Ingenieure belauschen "Aeroakustik" der menschlichen Stimme

Ingenieure belauschen "Aeroakustik" der menschlichen Stimme
Ingenieure belauschen "Aeroakustik" der menschlichen Stimme
Anonim

WEST LAFAYETTE, Indiana – Ingenieure versuchen, die Aerodynamik und Akustik der menschlichen Stimme besser zu verstehen und nachzubilden, teilweise um tiefgreifende Veränderungen der Stimme nach Operationen am Hals zu verhindern.

"Das Hauptinteresse besteht darin, zu versuchen, die Folgen einer Operation vorherzusagen und die Operation möglicherweise so zu planen, dass die Auswirkungen auf die Stimme minimiert werden", sagt Luc Mongeau, außerordentlicher Professor für Maschinenbau an der Purdue University.

Er und außerordentlicher Professor Steven Frankel haben mit finanzieller Unterstützung der National Institutes of He alth plastische und mathematische Modelle entwickelt, um den Stimmerzeugungsprozess, der von einem turbulenten Luftstrom durch die Glottis abhängt, besser zu analysieren und nachzubilden die Sprachbox.

Die Forscher versuchen, die Aeroakustik oder das aerodynamische Geräusch, das durch Luftströmungen erzeugt wird, vorherzusagen. Die Ergebnisse können nicht nur dazu beitragen, die Stimme einer Person zu erh alten, sondern auch Ingenieuren dabei helfen, herauszufinden, wie die Stimme für Robotik- und Spracherkennungszwecke besser synthetisiert und charakterisiert werden kann.

Die Purdue-Ingenieure haben einige neuere Erkenntnisse über die Arbeit in einem Artikel detailliert beschrieben, der in der Märzausgabe der Zeitschrift Physics of Fluids erscheint, die vom American Institute of Physics herausgegeben wird. Der Artikel konzentriert sich auf die Aerodynamik hinter "impulsiv gestarteten" Luftstrahlen, die für die menschliche Sprache von zentraler Bedeutung sind.

"Impulsiv ist, wenn du Druck aufbaust und ihn dann plötzlich wieder loslässt", sagt Mongeau.

Der Sprachprozess beginnt, wenn die Lunge Luftdruck ausübt und die Stimmbänder sich öffnen, wodurch aufeinanderfolgende, pulsierende Luftstrahlen freigesetzt werden. Jeder Luftstrahl ist an einem führenden Wirbel befestigt, der einem Rauchring ähnelt, der sich schließlich vom Strahl löst.Die Zeit, die der Ring benötigt, um sich von der Düse zu lösen – etwa eine Tausendstelsekunde – ist entscheidend für die Sprachbildung.

"Wir haben uns diesen Prozess mit einem Vergrößerungsglas in einer großen Computersimulation angesehen, um zu versuchen, diese Art von Strömung besser zu verstehen", sagt Mongeau. „Was wir wissen wollen, ist, wie viel Jet-Entwicklung Sie während dieser Zeit haben, und reicht das aus, damit sich ein einzelner Wirbel bildet und löst, oder würde er bis zur Bildung eines anderen anhaften bleiben?

"Denken Sie daran, eine Zigarette zu rauchen und Rauchringe zu machen. Wenn Sie sie sehr langsam machen, haben die Ringe Zeit, zu verschwinden, und Sie können zusehen, wie sie sich auflösen. Sie können sie aber auch kurz hintereinander ziehen, und das ist wenn du das bekommst, was ich einen Wirbelzug nenne, ein Wirbel folgt dem anderen, und es sieht aus wie eine Raupe."

Die in der Veröffentlichung diskutierten Berechnungsergebnisse unterstützten frühere Arbeiten anderer Forscher, und sie enthüllten auch etwas Neues: Jeder einzelne Jet wird instabil und bildet winzige Wirbel, die die Ablösung des Rings beeinflussen.Die zahlreichen Wirbel wirken sich auch auf die späteren Qualitäten der menschlichen Stimme aus.

Zusätzlich zu ihrer Arbeit mit Computersimulationen haben die Purdue-Forscher einen künstlichen Kehlkopf entworfen, die Struktur in der Luftröhre, die die Stimmbänder beherbergt. Wenn Luft durch das Modell strömt, werden seine gummiartigen Wände schnell durch kleine Stäbchen angepasst, um zu simulieren, wie das Gewebe beim Sprechen reagiert.

"Was wir gerade tun, ist, diese Arbeit noch einen Schritt weiter auszubauen und tatsächlich die Bewegung der Wände zu berücksichtigen, sodass sich jetzt die Stimmbänder bewegen", sagt Frankel. "Die Luft drückt gegen die Wände und dann springen die Wände zurück und drücken auf die Luft. Es gibt also eine Wechselwirkung zwischen den beiden."

Irgendwann wird die Modellierungsforschung über den Kehlkopf hinausgehen müssen, wenn Ingenieure die Physiologie der Sprache vollständig verstehen wollen. Die Strategie unterscheidet sich von einem konventionelleren Ansatz zur Sprachsynthese, der die menschliche Physiologie ignoriert.Der physiologische Ansatz strebt danach, die Sprachproduktion zu modellieren, indem er die Positionen der Stimmbänder, der Zunge, der Lippen und anderer „Artikulatoren“berücksichtigt, die an der Sprache beteiligt sind, sagt Mongeau.

Eine solche Technik ermöglicht es Wissenschaftlern, "eine Art Codebuch zu entwickeln, damit Sie für einen bestimmten Satz die Bewegung aller verschiedenen Artikulationsparameter verfolgen können", sagt er. "Und aus den artikulatorischen Parametern erzeugst du dann die Sprachausgabe."

Beliebtes Thema