26.10.2012 Aufrufe

Infomappe - Merck Jugend forscht - Merck KGaA

Infomappe - Merck Jugend forscht - Merck KGaA

Infomappe - Merck Jugend forscht - Merck KGaA

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Kurzfassung Stand 25<br />

30 Jahre <strong>Jugend</strong> <strong>forscht</strong> @ <strong>Merck</strong>; Hessischer Landeswettbewerb am 14. und 15. März 2012<br />

www.merck.de/jugend-<strong>forscht</strong><br />

Fachgebiet Mathematik/Informatik<br />

Thema Typology – Von n-Grams, Graphdatenbanken und schnellem Tippen<br />

Teilnehmer: Name (Alter) Anschrift Schule/Institution/Betrieb<br />

Paul Georg Wagner (18) 64293 Darmstadt Edith-Stein-Schule<br />

Darmstadt<br />

Till Speicher (18) 66127 Saarbrücken Otto-Hahn-Gymnasium<br />

Saarbrücken<br />

Betreuung: Herr Dipl.-Math. Pickhardt<br />

Ort der Projekterstellung: privat/zu Hause<br />

Mit Computern verfassen wir heute Mails, erledigen Büroarbeit, chatten und speichern unsere Gedanken.<br />

Ohne die Eingabe von Text wären diese Tätigkeiten nicht denkbar.<br />

Texte schnell und effzient einzugeben, bereitet jedoch vielen Menschen Schwierigkeiten.<br />

Dies wird durch die zunehmend weiter verbreiteten kleinen Touchscreen-Tastaturen von Tabletts und<br />

Smartphones noch verschärft.<br />

Deshalb stellen wir ein System bereit, das in der Lage ist, den angefangenen Satz des Benutzers auszuwerten<br />

und ihm weitere Eingaben vorzuschlagen, die er in seinen Text übernehmen kann.Statistiken über die<br />

Häufigkeit verschiedener Satzfragmente in deutschen Texten erhalten wir in Form von n-Grams von Google<br />

Books und übertragen sie in eine Graphdatenbank.<br />

Datenbank und Abfragen haben wir auf verschiedene Arten modelliert und anschließend mithilfe von künstlicher<br />

Intelligenz die Parameter der Modelle bestimmt.<br />

Die Güte der verschiedenen Methoden testeten wir unter Verwendung von natürlichen Texten der Seiten<br />

blogger.de und Wikipedia.<br />

Mit dem von uns entwickelten System sind wir inzwischen in der Lage, bei zwei vorgegebenen Buchstaben<br />

innerhalb von 50 Millisekunden das gesuchte Wort in etwa 2 von 3 Fällen auf einem der ersten fünf Plätze<br />

vorzuschlagen.<br />

- 44 -

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!