Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Weitere Magazine

Empfehlungen

Info

2 Analyse von Stenosen Abbildung 1: Gefäßprofil einer Stenose (links) und der quantifizierte Gefäßabschnitt (rechts). Stenosen sind Engstellen in Blutgefäßen, die beispielsweise durch Kalkablagerungen entstehen können und eine gestörte Durchblutung zur Folge haben. Eine Durchblutungsstörung des Gehirns ist oft die Ursache eines Schlaganfalls. Zur Risikoeinschätzung bedarf es einer gründlichen Analyse der Stenose, wobei der Verengungsgrad darüber entscheidet ob eine entsprechende Gefäßverengung behandelt werden muss. Zur Behandlung einer Stenose wird interventionell ein Stent mittels eines Katheters beispielsweise an der Leiste eingeführt und durch das Gefäßsystem zum krankhaften Gefäß durchgeschoben. Anschließend wird mit dem Stent die Gefäßwand geweitet und bei erfolgreicher Behandlung die ursprüngliche Anatomie wieder hergestellt. Um den Stent möglichst präzise auszuwählen und schnell zu plazieren, ist es erforderlich, eine 3D-Gefäßkarte zu erstellen und eine Quantifizierung des pathologischen Gefäßabschnittes vorzunehmen. Für die richtige Wahl des Stents wird der Gefäßdurchmesserverlauf und die Länge des stenotisierten Gefäßabschnittes benötigt (Abbildung 1). Die 3D-Angiographie ermöglicht vor dem Eingriff eine Visualisierung der Gefäße, die der Arzt zur Wegplanung des Katheters verwendet. Im Verlauf einer Intervention (Abbildung 2) können mehrere Aufnahmen notwendig sein, um in schwierigen Fällen einen Katheter richtig zu platzieren. Die 3D-Angiographie ist eine in der Praxis oft angewandte Methode um hochauflösende 3D-Bilder zu rekonstruieren. Technisch realisiert durch ein C-Bogen System werden im Verlauf einer Rotationsbewegung um den Patienten ca. 50-300 Röntgenaufnahmen geliefert aus denen innerhalb weniger Minuten eine 3D-Rekonstruktion des Gefäßbaumes berechnet wird. 3 Sprachliche Mensch-Maschine-Interaktion Im Folgenden wollen wir einige Aspekte der sprachlichen Mensch-Maschine-Interaktion (MMI) untersuchen. Technische Aspekte der MMI sind zum Beispiel in [2, 1, 4] beschrieben. Wir beschränken uns dabei auf die Interaktion zur Gerätesteuerung. Automatische Systeme zur Abfrage von Information (z.B. Fahrplan-Auskunft) oder Transaktionssysteme (z.B. Banküberweisungssysteme) bleiben hier unberücksichtigt. Mensch-Maschine-Interaktionssysteme lassen sich in verschiedene Richtungen kategorisieren:
Abbildung 2: C-Bogen-System zur 3D-Darstellung von Gefäßen (Quelle: Siemens Medical Solutions). • Kommandowort-Systeme: Diese Kategorie von Systemen ist immer noch sehr weit verbreitet, da sie wenig Rechenaufwand erfordert, es billige Chips dafür gibt und da der Anwender den Wortschatz selbst festlegen kann. Ein System kann ca. 10 bis 100 Einzelwörter erkennen, jedes davon löst eine Aktion aus. Der Anwender muß jedes der Kommandowörter ein- oder mehrmals sprechen. Aus den Sprachsignalen werden Merkmale berechnet und abgespeichert. Wird ein neuer Befehl gesprochen, so werden die daraus berechneten Merkmale mit allen gespeicherten Befehlen verglichen (Dynamische Zeitverzerrung) und das System entscheidet sich für den Befehl mit dem kleinsten Abstand. Ein wichtiger Nachteil dieses Ansatzes ist die Sprecherabhängigkeit des Systems: Wechselt der Anwender, so muss das gesamte System neu trainiert werden. Typische Anwendungen sind die Sprachwahl bei Handys (siehe die Telekom-Werbung “Wenn Sie Ihre Oma anrufen wollen, sagen Sie einfach ‘Oma’!”) oder einfache Gerätesteuerungen (“links”, “rechts”, “stop”). • Kommando- und Kontroll-Systeme: Die oben genannten Systeme stoßen sehr schnell an ihre Grenze, wenn es um die Parametrierbarkeit der Befehle geht (“nach links um Grad”). Die Tatsache, dass man einer Benutzeräußerung nicht mehr eine Aktion zuordnen kann, hat wichtige Konsequenzen: die erkannte Wortkette muß analysiert werden; der einzelne Anwender kann nicht mehr alle kombinatorisch möglichen Äußerungen vorab sprechen. Daher wird die Erkennung und Interpretation der Befehle mit grundsätzlich anderen Verfahren durchgeführt: statt sprecherabhängigem Schablonvergleich werden Verfahren zur sprecherunabhängigen Erkennung (insbesondere “Hidden Markov Modelle”) und zur Interpretation der erkannten Kette der am wahrscheinlichsten gesprochenen Wörter (insbesondere “Endliche Automaten”) verwendet. Eine wichtige Unterscheidung besteht zwischen folgenden Erkennertypen: – Grammatik-basierte Erkenner: Die Menge der möglichen Befehle wird vorab exakt festgelegt und in einem Graph abgespeichert. Der Erkenner benutzt den Graphen und lässt nur Pfade in dem Graphen als gültige Kommandos zu. Jedem Pfad wird eine Interpretation zugeordnet. Damit steht die Bedeutung des Kommandos nach der Erkennung fest. Da nicht alle Wörter zu jedem Zeitpunkt möglich sind, wird die Zahl der Erkennungsfehler stark reduziert. Ein Nachteil ist, dass der Benutzer die Wortfolge der Befehle exakt kennen muss.
Seite 1: Sprachgesteuerte 3D-Angiographie
Seite 5 und 6: 4 Ein sprachgesteuertes Stenose-Ver
Seite 7 und 8: Abbildung 3: Selektion einer Stenos

Sprachgesteuerte 3D-Angiographie - Sympalog Voice Solutions ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?