18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

26.2 Sprecherlokalisierung 425<br />

Eine andere Möglichkeit, die räumliche Auflösung des Gehörs zu verbessern,<br />

ist die Verwendung von Basisverbreiterern, wie sie in der Seefahrt<br />

zur Lokalisierung von Nebelhörnern heute noch eingesetzt werden. Dabei<br />

werden in jedes Ohr das Ende eines tubus-, muschel- oder kegelförmigen<br />

Schalleiters gesteckt, während die anderen Enden für die Schallaufnahme<br />

dienen und einen wesentlich größeren Abstand voneinander haben als die<br />

Ohren des <strong>Mensch</strong>en. Auf diese Art ist eine viel exaktere Bestimmung<br />

der Korrelation der beiden gehörten Signale und somit eine Messung von<br />

Laufzeitunterschieden möglich.<br />

Beamforming<br />

Beim Beamforming nutzt man die gleichen Techniken wie bei der Sprecherlokalisierung<br />

mittels Mikrophonarrays. Während bei der Sprecherlokalisierung<br />

der Laufzeitunterschied des Schalls von der Schallquelle zu verschiedenen<br />

Mikrophonen gemessen wird, wird beim Beamforming den eintreffenden<br />

Signalen je nach Mikrophon eine berechnete Verzögerung zugefügt, so daß<br />

die Summe der unterschiedlich verzögerten Signal alle Schallwellen, die von<br />

einer bestimmten Quelle kommen verstärkt und die Signale, die aus anderen<br />

Richtungen kommen unterdrückt.<br />

Wenn xi(t) das Signal bezeichnet, das am Mikrophon Mi ankommt, und<br />

∆i die Schallaufzeit vom gewünschten Ort Q bis zu Mi ist, dann berechnet<br />

sich das endgültige Signal x(t) wie:<br />

x(t) = <br />

xi(t − ∆i) (26.2)<br />

i<br />

Die Folge ist, daß in x(t) die Schallwellen von allen Orten außer Q nicht<br />

in Phase sind und nur die Wellen von Q in Phase sind. Eigentlich ist die<br />

Bezeichnung ” Beamforming“ zu schwach, denn in Wirklichkeit kann man das<br />

Verfahren bei Verwendung von drei oder mehr Mikrophonen ” Spotforming“<br />

nennen, denn es werden nicht nur Wellen aus einer bestimmten Richtung<br />

sondern von einem bestimmten Punkt selektiert.<br />

26.2.2 Mit Videoaufnahmen<br />

Eine weitere Möglichkeit, eine Sprecherlokalisierung durchzuführen ist die<br />

Verwendung einer Videokamera. Mit Hilfe eines Gesichterdetektionsverfahrens<br />

[?] und Gesichterverfolgungsverfahrens können Gesichter im Raum<br />

erkannt werden, die Analyse der Lippenregion sollte selbst bei entfernten

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!