Infomappe - Merck Jugend forscht - Merck KGaA
Infomappe - Merck Jugend forscht - Merck KGaA
Infomappe - Merck Jugend forscht - Merck KGaA
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kurzfassung Stand 25<br />
30 Jahre <strong>Jugend</strong> <strong>forscht</strong> @ <strong>Merck</strong>; Hessischer Landeswettbewerb am 14. und 15. März 2012<br />
www.merck.de/jugend-<strong>forscht</strong><br />
Fachgebiet Mathematik/Informatik<br />
Thema Typology – Von n-Grams, Graphdatenbanken und schnellem Tippen<br />
Teilnehmer: Name (Alter) Anschrift Schule/Institution/Betrieb<br />
Paul Georg Wagner (18) 64293 Darmstadt Edith-Stein-Schule<br />
Darmstadt<br />
Till Speicher (18) 66127 Saarbrücken Otto-Hahn-Gymnasium<br />
Saarbrücken<br />
Betreuung: Herr Dipl.-Math. Pickhardt<br />
Ort der Projekterstellung: privat/zu Hause<br />
Mit Computern verfassen wir heute Mails, erledigen Büroarbeit, chatten und speichern unsere Gedanken.<br />
Ohne die Eingabe von Text wären diese Tätigkeiten nicht denkbar.<br />
Texte schnell und effzient einzugeben, bereitet jedoch vielen Menschen Schwierigkeiten.<br />
Dies wird durch die zunehmend weiter verbreiteten kleinen Touchscreen-Tastaturen von Tabletts und<br />
Smartphones noch verschärft.<br />
Deshalb stellen wir ein System bereit, das in der Lage ist, den angefangenen Satz des Benutzers auszuwerten<br />
und ihm weitere Eingaben vorzuschlagen, die er in seinen Text übernehmen kann.Statistiken über die<br />
Häufigkeit verschiedener Satzfragmente in deutschen Texten erhalten wir in Form von n-Grams von Google<br />
Books und übertragen sie in eine Graphdatenbank.<br />
Datenbank und Abfragen haben wir auf verschiedene Arten modelliert und anschließend mithilfe von künstlicher<br />
Intelligenz die Parameter der Modelle bestimmt.<br />
Die Güte der verschiedenen Methoden testeten wir unter Verwendung von natürlichen Texten der Seiten<br />
blogger.de und Wikipedia.<br />
Mit dem von uns entwickelten System sind wir inzwischen in der Lage, bei zwei vorgegebenen Buchstaben<br />
innerhalb von 50 Millisekunden das gesuchte Wort in etwa 2 von 3 Fällen auf einem der ersten fünf Plätze<br />
vorzuschlagen.<br />
- 44 -