19.01.2014 Aufrufe

Maschinelle Ãœbersetzung und der menschliche Ãœbersetzer - tekom

Maschinelle Ãœbersetzung und der menschliche Ãœbersetzer - tekom

Maschinelle Ãœbersetzung und der menschliche Ãœbersetzer - tekom

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung <strong>und</strong><br />

<strong>der</strong> <strong>menschliche</strong> Übersetzer<br />

• Integration von elektronischen<br />

Übersetzungswerkzeugen in<br />

den Übersetzungs-Workflow<br />

06.11.2013 PD Dr. Kurt Eberle 1


Sprachbeherrschung durch Sprachtechnologie<br />

• Elektronische Hilfen bei <strong>der</strong> Übersetzung<br />

• Wörterbücher<br />

• CAT-Tools (computer-aided translation)<br />

• Übersetzungsarchive (Translation Memory, TM)<br />

• Automatische Übersetzungsprogramme<br />

• Übersetzungsmethoden <strong>und</strong> -programme<br />

• Regelbasierte Übersetzung<br />

• Statistische Übersetzung<br />

• Methoden-Mix<br />

06.11.2013 PD Dr. Kurt Eberle 2


Sprachbeherrschung durch Sprachtechnologie<br />

• Integration von Übersetzungshilfen in den<br />

Workflow<br />

• CAT mit Übersetzungsarchiven<br />

• <strong>Maschinelle</strong> Übersetzung<br />

• Eigene Wörterbücher<br />

• Optimierungszyklus<br />

• Potenzial <strong>der</strong> Übersetzungstechnologie<br />

06.11.2013 PD Dr. Kurt Eberle 3


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen<br />

• Wörterbücher<br />

• Konventionelle Print-Wörterbücher<br />

• Kostenlose Online-Wörterbücher<br />

• Elektronische Verlagswörterbücher<br />

06.11.2013 PD Dr. Kurt Eberle 4


Sprachbeherrschung durch Sprachtechnologie<br />

Konventionelle Print-Wörterbücher<br />

• Einsprachig/Übersetzungswörterbücher<br />

• Duden<br />

• Pons<br />

• Langenscheidt,…<br />

06.11.2013 PD Dr. Kurt Eberle 5


Sprachbeherrschung durch Sprachtechnologie<br />

Konventionelle Wörterbücher<br />

• große konventionelle Wörterbücher sind in <strong>der</strong> Regel sehr<br />

informativ....<br />

... aber mühsam zu durchdringen ....<br />

06.11.2013 PD Dr. Kurt Eberle 6


Sprachbeherrschung durch Sprachtechnologie<br />

Konventionelle Wörterbücher<br />

• Was heißt: Pleite machen ?....<br />

... <strong>und</strong> auch nicht immer mit präzisem Ergebnis !<br />

06.11.2013 PD Dr. Kurt Eberle 7


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Wörterbücher<br />

• LEO, ...<br />

mühelose Suche, sofort Ergebnisse !<br />

06.11.2013 PD Dr. Kurt Eberle 8


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Wörterbücher<br />

• Mittlerweile großes Angebot,..<br />

• Leo<br />

• Dict.cc<br />

• Beolingus (Uni Chemnitz)<br />

• Woxikon<br />

• Kdictionaries<br />

• …<br />

• Verlagswörterbücher,..<br />

• ‘Kollaborative Quellen’ (Wictionary)<br />

06.11.2013 PD Dr. Kurt Eberle 9


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Wörterbücher<br />

• Manchmal (noch) überfor<strong>der</strong>t bei spezifischerem Wortschatz<br />

falls Ausdruck nicht bekannt, Hilfe manchmal nicht ergiebig genug!<br />

06.11.2013 PD Dr. Kurt Eberle 10


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Hilfen<br />

• Weitere Angebote<br />

auf Basis von Extraktionen aus ‚Korpora‘,<br />

mit Belegstellen,…<br />

06.11.2013 PD Dr. Kurt Eberle 11


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Hilfen<br />

• Linguee,..<br />

06.11.2013 PD Dr. Kurt Eberle 12


Sprachbeherrschung durch Sprachtechnologie<br />

Kostenlose Online-Hilfen<br />

• Linguee,..<br />

Falls Korpus nicht allgemein genug, gibt es lexikalische Lücken!<br />

06.11.2013 PD Dr. Kurt Eberle 13


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

• office wörterbuch (digital publishing), translateDict ...<br />

... oft weiter gefächerter Wortschatz,<br />

06.11.2013 PD Dr. Kurt Eberle 14


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

• office wörterbuch, translateDict ...<br />

Resultate manchmal auch bei nur inhaltlicher Nähe zum Suchausdruck!<br />

06.11.2013 PD Dr. Kurt Eberle 15


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

• Wichtig:<br />

Welche Suchfunktionen gibt es?<br />

Gibt es auch ‚inhaltliche Nähe‘?<br />

06.11.2013 PD Dr. Kurt Eberle 16


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

• Gibt es auch kostenlos im Netz ...<br />

• Pons.eu, wwwtranslate.de, Collins, ….<br />

06.11.2013 PD Dr. Kurt Eberle 17


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

06.11.2013 PD Dr. Kurt Eberle 18


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

06.11.2013 PD Dr. Kurt Eberle 19


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Verlagswörterbücher<br />

06.11.2013 PD Dr. Kurt Eberle 20


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen<br />

• CAT mit Übersetzungsarchiven<br />

(Translation Memory, TM)<br />

• Mittlerweile Standard am (elektronischen)<br />

Arbeitsplatz<br />

• Satzarchive mit Übersetzungen<br />

• Automatische Vorlage von Übersetzungen bei<br />

genügend großer Übereinstimmung<br />

• Produkte: Trados, memoQ, WordFast, Déjà vu,<br />

across, Star,...<br />

06.11.2013 PD Dr. Kurt Eberle 21


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• TRADOS<br />

06.11.2013 PD Dr. Kurt Eberle 22


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• TRADOS<br />

06.11.2013 PD Dr. Kurt Eberle 23


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen<br />

• Automatische Übersetzungsprogramme<br />

• Einzelplatzsysteme<br />

• Netzwerklösungen<br />

(Windows Netzwerke, Terminal Server,..)<br />

• Firmen-Intranetlösungen<br />

• Kostenlose Online-Lösungen<br />

• Google-Translate<br />

• Microsoft Bing<br />

• Pons-Portal/Lingenio-Übersetzung<br />

• itranslate4EU<br />

06.11.2013 PD Dr. Kurt Eberle 24


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsprogramme<br />

• Systran... Einzelplatzsystem<br />

06.11.2013 PD Dr. Kurt Eberle 25


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen<br />

• Übersetzungsprogramme- <strong>und</strong> methoden<br />

• Regelbasierte Übersetzung<br />

• Statistische Übersetzung<br />

• Methoden-Mix<br />

06.11.2013 PD Dr. Kurt Eberle 26


Sprachbeherrschung durch Sprachtechnologie<br />

Regelbasierte Übersetzung<br />

Beispiel: Fieses Herrchen von Dackel Paul gefasst.<br />

(Bild 15.5.11)<br />

06.11.2013 PD Dr. Kurt Eberle 27


Sprachbeherrschung durch Sprachtechnologie<br />

Regelbasierte Übersetzung<br />

Syntaktische<br />

Analyse<br />

Transfer<br />

Generierung<br />

06.11.2013 PD Dr. Kurt Eberle 28


Sprachbeherrschung durch Sprachtechnologie<br />

Regelbasierte Übersetzung<br />

• Erkenne <strong>und</strong> berücksichtige Mehrdeutigkeiten!<br />

06.11.2013 PD Dr. Kurt Eberle 29


Sprachbeherrschung durch Sprachtechnologie<br />

Regelbasierte Übersetzung<br />

• … die meisten kommerziellen MT-Systeme<br />

• Systran<br />

• linguatec (Personal Translator)<br />

• Lingenio (translate)<br />

• Promt<br />

• ESTeam, ...<br />

06.11.2013 PD Dr. Kurt Eberle 30


Sprachbeherrschung durch Sprachtechnologie<br />

Programme <strong>und</strong> Methoden<br />

• Statistische Übersetzung<br />

• seit Ende <strong>der</strong> 80er Jahre<br />

• IBM<br />

• Ideen aus <strong>der</strong> Spracherkennung<br />

‣ Voraussetzung: Große Mengen von<br />

Übersetzungen elektronisch verfügbar!<br />

06.11.2013 PD Dr. Kurt Eberle 31


Sprachbeherrschung durch Sprachtechnologie<br />

Programme <strong>und</strong> Methoden<br />

Statistisches<br />

Modell<br />

..<br />

von<br />

Dackel<br />

Paul<br />

gefasst<br />

...<br />

Lexikonmodell<br />

of (0,2), by (0,1), from (0,3), how,..<br />

Dachsh<strong>und</strong> (0,8), idot (0,1)<br />

Paul (0,95)<br />

prepared (0,5), taken (0,2),<br />

Alignment-Modell, Sprachmodell<br />

06.11.2013 PD Dr. Kurt Eberle 32


Sprachbeherrschung durch Sprachtechnologie<br />

Statistische Übersetzung<br />

• .. die meisten kostenlosen Online-Systeme<br />

• Google Translate,<br />

• Bing,<br />

• aber auch,...<br />

• Language Weaver (SDL)<br />

• …<br />

06.11.2013 PD Dr. Kurt Eberle 33


Sprachbeherrschung durch Sprachtechnologie<br />

Google Translate<br />

06.11.2013 PD Dr. Kurt Eberle 34


Sprachbeherrschung durch Sprachtechnologie<br />

Programme <strong>und</strong> Methoden<br />

‣Methoden-Mix<br />

• Regelbasiert:<br />

• - teuer, braucht korrekten Input<br />

+ flexibel, eigene Wörter definieren<br />

• Statistisch<br />

• + billig, robust<br />

- Anpassung: große Datenmengen<br />

‣ Regelbasiert mit statistischem Datenlernen<br />

‣ Statistische Systeme mit linguistischem Vorwissen<br />

06.11.2013 PD Dr. Kurt Eberle 35


Sprachbeherrschung durch Sprachtechnologie<br />

Programme <strong>und</strong> Methoden<br />

‣Forschungsthema: Hybride Übersetzung<br />

06.11.2013 PD Dr. Kurt Eberle 36


Sprachbeherrschung durch Sprachtechnologie<br />

Integration<br />

• Integration von Übersetzungshilfen in den<br />

Workflow<br />

• Übersetzungsarchive<br />

• <strong>Maschinelle</strong> Übersetzung<br />

• Individuelle Wortschatzerweiterung<br />

06.11.2013 PD Dr. Kurt Eberle 37


Sprachbeherrschung durch Sprachtechnologie<br />

Integration<br />

• Übersetzungsarchive<br />

• Anwendungsbeispiel<br />

Rover-Reparaturanleitung<br />

‣Aktualisierungen mit geringfügigen Än<strong>der</strong>ungen<br />

06.11.2013 PD Dr. Kurt Eberle 38


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• Verwendung<br />

1) Text (Rover-Reparaturanleitung)<br />

2) Übersetzung<br />

3) Integration ins Translation Memory (TM)<br />

06.11.2013 PD Dr. Kurt Eberle 39


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• TM:<br />

06.11.2013 PD PD Dr. Kurt Eberle<br />

40


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• Aktualisierte Fassung mit modifizierten<br />

Bezeichnungen<br />

06.11.2013 PD Dr. Kurt Eberle 41


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungsarchive<br />

• Aktualiserte Fassung mit modifizierten<br />

Bezeichnungen<br />

06.11.2013 PD PD Dr. Kurt Eberle<br />

42


Sprachbeherrschung durch Sprachtechnologie<br />

Integration<br />

• <strong>Maschinelle</strong> Übersetzung<br />

1) Integration von Übersetzungsarchiven ins<br />

Projekt<br />

‣ Übersetze nur maschinell was (genügend) neu<br />

ist<br />

2) Automatische Rohübersetzung<br />

3) Manuelle Nachbearbeitung<br />

4) Integration ins Übersetzungsarchiv<br />

06.11.2013 PD Dr. Kurt Eberle 43


Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung<br />

• Manuelle Nachbearbeitung<br />

‣ Typische Übersetzungsfehler<br />

• fehlende Wörter<br />

• unzureichendes Satzverständnis<br />

32 byte lange Fel<strong>der</strong> <strong>und</strong> Variablen können nicht<br />

übergeben werden<br />

• des champs longs de 32 bytes et des variables...<br />

• des champs et des variables longs de 32 bytes...<br />

• des variables et des champs d'une longueur de 32<br />

bytes<br />

06.11.2013 PD Dr. Kurt Eberle 44


Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung<br />

• Qualitätsverbesserung<br />

‣ Source-Textanpassung: Schreibregeln<br />

‣ Textsorten/Sachgebiete<br />

‣ Übersetzungsoptionen<br />

06.11.2013 PD Dr. Kurt Eberle 45


Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung<br />

‣ Übersetzungsoptionen<br />

06.11.2013 PD Dr. Kurt Eberle 46


Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung<br />

• Qualitätsverbesserung<br />

‣ Eigener Wortschatz<br />

06.11.2013 PD Dr. Kurt Eberle 47


Sprachbeherrschung durch Sprachtechnologie<br />

Wortschatzerweiterung<br />

• Manuell eigene Einträge anlegen<br />

06.11.2013 PD Dr. Kurt Eberle 48


Sprachbeherrschung durch Sprachtechnologie<br />

Wortschatzerweiterung<br />

• Manuell eigene Einträge anlegen<br />

06.11.2013 PD PD Dr. Kurt Eberle<br />

49


Sprachbeherrschung durch Sprachtechnologie<br />

Wortschatzerweiterung<br />

‣ Automatisch neue Einträge in<br />

Übersetzungen <strong>und</strong> TMs erkennen!<br />

06.11.2013 PD PD Dr. Kurt Eberle<br />

50


Sprachbeherrschung durch Sprachtechnologie<br />

Optimierungszyklus<br />

• Arbeitsplatz... z.B. TRADOS<br />

Text öffnen<br />

automatisch übersetzen<br />

06.11.2013 PD Dr. Kurt Eberle 51


Sprachbeherrschung durch Sprachtechnologie<br />

Optimierungszyklus<br />

• MÜ... z.B. Lingenio's translate<br />

übersetzen<br />

nachbearbeiten:<br />

Alternativen<br />

nutzen<br />

06.11.2013 PD Dr. Kurt Eberle 52


Sprachbeherrschung durch Sprachtechnologie<br />

Optimierungszyklus<br />

• MÜ... z.B. Lingenio's translate<br />

nachbearbeiten:<br />

Alternativen<br />

nutzen<br />

06.11.2013 PD Dr. Kurt Eberle 53


Sprachbeherrschung durch Sprachtechnologie<br />

Optimierungszyklus<br />

• MÜ... z.B. Lingenio's translate<br />

archivieren<br />

06.11.2013 PD Dr. Kurt Eberle 54


Sprachbeherrschung durch Sprachtechnologie<br />

Übersetzungen<br />

archivieren <strong>und</strong> WB-<br />

Vorschläge auslesen<br />

unravel ~ ergeben<br />

Lithofacies analysis ~ Lithofazienanalyse<br />

Lithofacies ~ Lithofazien<br />

pliocene succession ~ Pliozänschicht<br />

Valdelsa basin ~ Valdelsabecken<br />

Valdelsa ~ Valdelsa<br />

06.11.2013 PD Dr. Kurt Eberle 55


Sprachbeherrschung durch Sprachtechnologie<br />

Optimierung<br />

• WB-Vorschläge optimieren<br />

06.11.2013 PD Dr. Kurt Eberle 56


Sprachbeherrschung durch Sprachtechnologie<br />

<strong>Maschinelle</strong> Übersetzung<br />

• Satzarchiv- <strong>und</strong> WB-Erweiterungen<br />

wie<strong>der</strong> einlesen<br />

06.11.2013 PD Dr. Kurt Eberle 57


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen am Arbeitsplatz<br />

• Potenzial<br />

• immer schneller, immer mehr Übersetzungen<br />

vorhanden<br />

• (Wiktionary,..)<br />

06.11.2013 PD Dr. Kurt Eberle 58


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen am Arbeitsplatz<br />

06.11.2013<br />

PD PD Dr. Kurt Eberle<br />

59


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen am Arbeitsplatz<br />

• Potenzial<br />

• immer mehr Übersetzungen sind<br />

elektronisch verfügbar <strong>und</strong> immer schneller<br />

‣ immer bessere automatische Extraktion von<br />

Übersetzungswissen möglich!<br />

‣ immer intelligentere Zuführung zum<br />

Übersetzungssystem<br />

‣ Fazit:<br />

• Entwicklung aufmerksam verfolgen!<br />

• Angebote kennen <strong>und</strong> überlegt nutzen!<br />

06.11.2013 PD Dr. Kurt Eberle 60


Sprachbeherrschung durch Sprachtechnologie<br />

Elektronische Hilfen am Arbeitsplatz<br />

Danke für Ihre Aufmerksamkeit!<br />

Fragen?<br />

(Besuchen Sie uns an unserem Stand 420)<br />

06.11.2013 PD Dr. Kurt Eberle 61

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!