18.11.2014 Aufrufe

Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Abbildung 3: Selektion einer Stenose<br />

Für eine klinische Evaluierung wurde ein Prototyp<br />

realisiert, der es ermöglicht, eine Stenosen-<br />

Selektion und Quantifizierung mittels Sprachkommandos<br />

durchzuführen. Funktionell kann eine semiautomatische<br />

Schwellwertsegmentierung (Sprachbefehl:<br />

Erhöhe bitte den Schwellwert um 32 ),<br />

die Orientierung und Größe eines <strong>3D</strong>-Volumens<br />

(Sprachbefehl: Vergrößere/verkleinere das Volumen<br />

oder Rotiere das Volumen nach unten) sowie<br />

die Selektion einer Stenose mittels eines computerunterstützten<br />

<strong>3D</strong>-Zeigers via Sprachbefehl durchgeführt<br />

werden. Ein <strong>3D</strong>-Zeiger folgt dabei einem<br />

sprachgesteuerten 2D-Cursor permanent entlang<br />

der Gefäßschwerpunktlinie (Abbildung 3). Somit<br />

kann schnell und unkompliziert via Sprache der<br />

gewünschte <strong>3D</strong>-Gefäßabschnitt angewählt werden.<br />

Der entwickelte Prototyp wurde in eine Siemens Leonardo Workstation integriert und erlaubt<br />

eine Sprachsteuerung eines typischen Workflows einer Gefäßanalyse. Der Prototyp wurde am Institut<br />

für Röntgendiagnostik der Universität Würzburg klinisch evaluiert. Darüberhinaus wurde<br />

untersucht, in welchem Umfang die sprachgesteuerte Gefäßanalyse besser in den derzeitigen<br />

klinischen Workflow integriert werden kann.<br />

5 Ausblick<br />

Die Sprachsteuerung wurde von den in die Erprobung eingebundenen Ärzten insgesamt sehr<br />

positiv beurteilt. Besonders für die Bedienung von Geräten im sterilen Umfeld sehen sie durch<br />

die Sprachbedienung eine spürbare Erleichterung im beruflichen Alltag.<br />

Als möglicherweise problematisch für die Akzeptanz eines solchen Systems wird lediglich die<br />

Tatsache beurteilt, dass das System das Tragen eines Headsets verlangt. Obwohl sich hier für<br />

bestimmte Einsatzszenarien sehr komfortable Lösungen finden lassen (etwa die Integration des<br />

Mikrophons in den Mundschutz), so wird doch in Zweifel gezogen, ob jeder Arzt bereit ist,<br />

für den Komfort- und Effizienzgewinn bei der Bedienung des Systems die hierfür notwendigen<br />

Handgriffe in Kauf zu nehmen.<br />

Ohne besondere technische Maßnahmen sinkt die Erkennungsqualität mit zunehmendem Abstand<br />

zwischen Mund und Mikrophon drastisch. Verantwortlich hierfür sind der abnehmende<br />

Signal-Rausch-Abstand des Signals, Störgeräusche und besonders auch die auftretenden Echobzw.<br />

Hall-Effekte. Um zukünftig auch ein freies Sprechen mit Sprachsteuerungen ohne Headset<br />

zu ermöglichen, arbeiten wir zur Zeit intensiv an der Verwendung von Mikrophon-Arrays als<br />

Eingabemedium für die Spracherkennung und an der entsprechenden Optimierung des Spracherkenners.<br />

Mikrophon-Arrays fokussieren auf den Sprecher und kompensieren dadurch bis zu einem gewissen<br />

Grade störende Geräuschquellen, soweit sich diese nicht in Richtung des Sprechers befinden.<br />

Ohne weitere Maßnahmen sind jedoch bereits Entfernungen von mehr als 0,5m weiterhin problematisch.<br />

Durch ein neu entwickeltes Verfahren zur Anpassung des Spracherkenners an solche<br />

Bedingungen ist es uns bereits gelungen, auch bei einem Abstand von 1,5m und mehr den<br />

überwiegenden Teil der durch die verbleibenden Störungen verursachten Erkennungsfehler zu<br />

kompensieren, ohne hierfür neue, entsprechend gestörte Sprachdaten zur Adaption des Spracherkenners<br />

aufnehmen zu müssen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!