Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Weitere Magazine

Empfehlungen

Info

mehr/weniger Alternativen zulässt, wenn er mehr/weniger CPU-Zeit zur Verfügung hat. Somit wirkt sich eine schlechtere Rechnerausstattung weniger auf die Reaktionszeit und mehr auf die Güte der Erkennung aus (weniger Alternativen bedeutet, dass gelegentlich ein gültiger Befehl verworfen wird). Eine ” vernünftige“ Minimalanforderung an das System (nur für das Spracherkennungsmodul) ist: • Pentium III - CPU mit 800 MHZ • 512 MB Hauptspeicher • 100 MB Festplattenplatz (fuer Konfiguration und Logfiles) Wenn eine High-End Grafikkarte mit 3D-Beschleuniger und mindestens 256 MB Onboard vorhanden ist, dann beeinträchtigt der Spracherkenner die Anwendung fast gar nicht. Der Grund dafür ist, dass der rechenintensivste Teil der Anwendung fast vollständig von der Graphikkarte mit der eigenen CPU und eigenem 3D-Beschleuniger berechnet wird und dem Spracherkenner die CPU des Rechners praktisch alleine zur Verfügung steht. Im nächsten Abschnitt soll das Stenose-Vermessungsmodul mit der Spracherkennung beschrieben werden. 4.2 Beschreibung des Gesamtsystems Die Entwicklung von Algorithmen zur quantitativen Auswertung von Blutgefäßen [3] sowie zur computerunterstützten Gefäßnavigation konzentriert sich zunehmend auf deren Einsatz im interventionellen Umfeld. Da im Verlauf einer interventionellen Behandlung der Arzt den OP-Tisch und somit den sterilen Bereich verlassen muss, um an einer Workstation die Gefäßanalyse durchzuführen, stellt eine sprachgesteuerte Gefäßanalyse eine wertvolle Bereicherung dar. Dabei sollte die Sprachsteuerung nicht als Ersatz des bisher in der Praxis verwendeten Joysticks gesehen werden, sondern als zusätzliches Eingabemedium. Weit verbreitet ist ein am OP-Tisch angebrachter in Folie verpackter Joystick der als direktes Eingabeinstrument dient. Damit kann die 3D-Ansicht der Gefäße verändert werden. Dazu selektiert der Benutzer im Menu die entsprechende Funktion, wie beispielsweise “rotieren”, “zoom” oder “verschieben”. Dieser Workflow kann durch direkte Spracheingabe erheblich verkürzt werden. Eine Sprachsteuerung bietet den Vorteil, dass alle Steuerbefehle in einer Kommandoebene angeordnet und somit umständliche hierarchische Menüs vermieden werden können. Eine quantitative Analyse der Blutgefäße kann somit direkt am OP-Tisch vollzogen werden. Da eine Gefäßanalyse noch nicht vollautomatisch durchgeführt werden kann, bedarf es einiger manueller Eingaben. Der zu analysierende Gefäßabschnitt wird dabei vom Arzt in der 3D- Ansicht oder in einem Gefäßschnittbild via Mausklick angewählt, und bevor das Gefäßprofil automatisch erstellt werden kann, bedarf es noch einer Feinjustierung der Gefäßsegmentierung. Für diesen Workflow wurden spezielle Algorithmen entwickelt, die eine 3D-Selektion eines Gefäßabschnittes und die Segmentierung auf ein notwendiges Minimum an Benutzerinteraktion reduzieren. Ein mit einem Funkmikrofon ausgestatteter Arzt ist damit in der Lage, eine Gefäßanalyse via Sprache durchzuführen, ohne den OP-Tisch verlassen zu müssen.
Abbildung 3: Selektion einer Stenose Für eine klinische Evaluierung wurde ein Prototyp realisiert, der es ermöglicht, eine Stenosen- Selektion und Quantifizierung mittels Sprachkommandos durchzuführen. Funktionell kann eine semiautomatische Schwellwertsegmentierung (Sprachbefehl: Erhöhe bitte den Schwellwert um 32 ), die Orientierung und Größe eines 3D-Volumens (Sprachbefehl: Vergrößere/verkleinere das Volumen oder Rotiere das Volumen nach unten) sowie die Selektion einer Stenose mittels eines computerunterstützten 3D-Zeigers via Sprachbefehl durchgeführt werden. Ein 3D-Zeiger folgt dabei einem sprachgesteuerten 2D-Cursor permanent entlang der Gefäßschwerpunktlinie (Abbildung 3). Somit kann schnell und unkompliziert via Sprache der gewünschte 3D-Gefäßabschnitt angewählt werden. Der entwickelte Prototyp wurde in eine Siemens Leonardo Workstation integriert und erlaubt eine Sprachsteuerung eines typischen Workflows einer Gefäßanalyse. Der Prototyp wurde am Institut für Röntgendiagnostik der Universität Würzburg klinisch evaluiert. Darüberhinaus wurde untersucht, in welchem Umfang die sprachgesteuerte Gefäßanalyse besser in den derzeitigen klinischen Workflow integriert werden kann. 5 Ausblick Die Sprachsteuerung wurde von den in die Erprobung eingebundenen Ärzten insgesamt sehr positiv beurteilt. Besonders für die Bedienung von Geräten im sterilen Umfeld sehen sie durch die Sprachbedienung eine spürbare Erleichterung im beruflichen Alltag. Als möglicherweise problematisch für die Akzeptanz eines solchen Systems wird lediglich die Tatsache beurteilt, dass das System das Tragen eines Headsets verlangt. Obwohl sich hier für bestimmte Einsatzszenarien sehr komfortable Lösungen finden lassen (etwa die Integration des Mikrophons in den Mundschutz), so wird doch in Zweifel gezogen, ob jeder Arzt bereit ist, für den Komfort- und Effizienzgewinn bei der Bedienung des Systems die hierfür notwendigen Handgriffe in Kauf zu nehmen. Ohne besondere technische Maßnahmen sinkt die Erkennungsqualität mit zunehmendem Abstand zwischen Mund und Mikrophon drastisch. Verantwortlich hierfür sind der abnehmende Signal-Rausch-Abstand des Signals, Störgeräusche und besonders auch die auftretenden Echobzw. Hall-Effekte. Um zukünftig auch ein freies Sprechen mit Sprachsteuerungen ohne Headset zu ermöglichen, arbeiten wir zur Zeit intensiv an der Verwendung von Mikrophon-Arrays als Eingabemedium für die Spracherkennung und an der entsprechenden Optimierung des Spracherkenners. Mikrophon-Arrays fokussieren auf den Sprecher und kompensieren dadurch bis zu einem gewissen Grade störende Geräuschquellen, soweit sich diese nicht in Richtung des Sprechers befinden. Ohne weitere Maßnahmen sind jedoch bereits Entfernungen von mehr als 0,5m weiterhin problematisch. Durch ein neu entwickeltes Verfahren zur Anpassung des Spracherkenners an solche Bedingungen ist es uns bereits gelungen, auch bei einem Abstand von 1,5m und mehr den überwiegenden Teil der durch die verbleibenden Störungen verursachten Erkennungsfehler zu kompensieren, ohne hierfür neue, entsprechend gestörte Sprachdaten zur Adaption des Spracherkenners aufnehmen zu müssen.
Seite 1 und 2: Sprachgesteuerte 3D-Angiographie
Seite 3 und 4: Abbildung 2: C-Bogen-System zur 3D-
Seite 5: 4 Ein sprachgesteuertes Stenose-Ver

Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?