Bibel dient als Grundlage für ein bahnbrechendes Übersetzungs- Programm

Ein junger deutscher Wissenschaftler sorgt zurzeit in den USA für Aufsehen. Franz Josef Och, Informatiker an der University of Southern California in Los Angeles, hat ein bahnbrechendes Computerprogramm entwickelt, das Texte selbständig und in kürzester Zeit von jeder beliebigen Sprache in eine andere übersetzen kann. Neben modernster Technologie spielt dabei auch die Bibel eine entscheidende Rolle.
Franz Josef Och.

„Wir sagen dem Computer nicht, wie er übersetzen soll. Wir lassen ihn das einfach selbst lernen", fasste Och kürzlich im „Spiegel" das Prinzip seiner Software zusammen. Sie kommt, anders als die meisten bisherigen Übersetzungsprogramme, ganz ohne linguistische Regeln aus. Satzbau und Grammatik werden von ihr völlig ignoriert. „Wir verwenden Modelle aus der Statistik, um für ein vorgegebenes Wort die wahrscheinlichste Übersetzung zu finden", erklärt der 31-Jährige.

Die von ihm eingesetzte Methode der statistischen Übersetzung lässt sich anhand eines einfachen Beispiels veranschaulichen: Auf Englisch heisst grosses Haus „big house". Grünes Haus bedeutet „green house". Daraus leitet der Computer ab, dass „house" Haus, „big" gross und „green" grün heissen muss.

Was so simpel klingt, ist tatsächlich ein hoch komplizierter Vorgang, der vor wenigen Jahren noch undenkbar schien, heute aber dank immer leistungsstärkerer und schnellerer Computer möglich ist. Dabei wird der Rechner mit identischen Texten in zwei verschiedenen Sprachen gefüttert – so genannten Paralleltexten – die dann automatisch Wort für Wort verglichen, statistisch ausgewertet und entschlüsselt werden.

Je umfangreicher der Fundus an Paralleltexten, um so genauer das Ergebnis: Riesige Textmengen von mehreren Millionen Wörtern sind keine Seltenheit. Doch hat sich das Programm eine Sprache erst einmal angeeignet, benötigt es für die Übersetzung einer DIN-A4-Seite kaum länger als eine Minute.

Bibel als Ausgangspunkt

Vor allem Handbücher, Meldungen internationaler Nachrichtenagenturen oder Veröffentlichungen der UNO und der EU kommen als Paralleltexte in Frage. Wichtigster Paralleltext aber ist die Bibel – kein anderes Buch wurde bisher öfter übersetzt und in grösserer Zahl gedruckt. Mit ihren rund 800.000 Wörtern bietet die Bibel genügend Ausgangsmaterial für viele Übersetzungsaufgaben. „Die Bibel ist hilfreich für Sprachen, in denen keine oder kaum weitere Paralleltexte zur Verfügung stehen", berichtet Och. „Genutzt habe ich sie bisher insbesondere für Cebuano und Hindi."

Letztere, die Übersetzung auf Hindi, stellte einen Meilenstein in der Karriere des Franken dar, der erst vor gut einem Jahr von der Universität Aachen nach Los Angeles kam: Im Juni 2003 nahm Och an einem Wettbewerb des US-Verteidigungsministeriums teil, bei dem ein fremdsprachiger Text per Computer ins Englische übersetzt werden musste. Er bewältigte diese Aufgabe in der Rekordzeit von nur vier Wochen und liess damit alle seine Konkurrenten weit hinter sich.

Inzwischen beherrscht sein Computer 15 Sprachen, darunter Arabisch und Chinesisch. Die Übersetzungen sind zwar meist holprig und werden literarischen Ansprüchen kaum gerecht, erfüllen aber ihren Zweck. Zu Ochs Auftraggebern gehören die Forschungsorganisation des Pentagon sowie der amerikanische Abhör- und Spionagedienst NSA (National Security Agency).

Quelle: Der Spiegel

Datum: 17.04.2004

Publireportage
Werbung
Livenet Service
Werbung