Reflektionen über Englisch in der CL
Durch die Recherche von Martin Pyka über CL¹ in der Blogosphäre bin ich auf die Seite des indischen Wissenschaftlers Anil Kumar Singh gestoßen, der sich in seinem Beitrag vom 29.02. Gedanken zur Rolle des Englischen in der internationalen Computerlinguistik macht. Es klingt mehr als ein wenig bitter, wenn er schreibt:
You propose a theory based on Hindi. It is language specific. It doesn’t count for much. You propose an NLP² technique for a particular problem. For Hindi. It is language specific. It doesn’t count for much. You build a software for some purpose. For Hindi. It is language specific. It doesn’t count for much.
Und das gleiche in Englisch gilt als “language-independent”. Das ganze erinnert mich ein wenig an den türkischen Astronom im Kleinen Prinz, dessen Entdeckung erst von der internationalen Forschergemeinde angenommen wurden, als er Robe und Turban gegen Anzug und Schlips tauschte. Aber: ist es denn wirklich so und wenn, was heißt das?
Es hat in meinen Augen durchaus seine Vorteile, wenn sich die im Wesentlichen ungeeinte computerlinguistische Gemeinde wenigstens auf eine Sprache konzentriert, um vielleicht irgendwann einmal einen Ansatzpunkt zu finden, mittels dessen sich Sprache angemessen formalisieren lässt. Gerade im Zuge automatischer Übersetzung ist es zwar immer auch wichtig, die anderen großen und auch kleinen bis sehr kleinen Sprachen zu berücksichtigen bzw. den Umweg über das Englische zu vermeiden. Aber um auf den Beitrag von Anil zu kommen: Er kann offensichtlich Englisch, ich kann es auch und die meisten anderen Computerlinguisten ebenfalls. Wenn er etwas über Hindi schreibt, kann ich das zur Kenntnis nehmen und abhängig von der Tiefe seiner Ausführungen vielleicht sogar verstehen. Da ich aber kein Hindi kann (und die wenigsten anderen Computerlinguisten ebenfalls) wird es in der Regel schwer, die Erkenntnisse auf die eigene Sprache anzuwenden. Insofern ist das Englische zwar nicht sprachunabhängig aber immerhin so bekannt, dass jeder von dort auf seine eigene Sprache rückfolgern können sollte. Natürlich wäre es “fairer”, wenn wir alle über eine idealtypische Interlingua schreiben würden. Und da liegt der Hase begraben: Es gibt keine sprachunabhängige Sprache. Und wenn jeder nicht nur in seinem kleinen Kämmerlein sondern auch noch an seiner eigenen Sprache arbeitet, dann wird es zunehmen schwierig, einen Fortschritt zu erzielen (der ohnehin schon auf sich warten lässt). Außerdem ist es natürlich weder verboten noch ungern gesehen, wenn über andere Sprachen geforscht wird: Ich schreibe ja auch über Automatische Übersetzung von Deutsch nach Spanisch - und muss mich damit Problemen stellen, die über die Probleme der englischen Sprachverarbeitung hinausgehen. Vielleicht ist Englisch auch aufgrund seiner verhältnismäßig einfachen Struktur gut geeignet, sich eher mit allgemein wirkenden Themen beschäftigen zu können. Konjugation, Deklination - spielt keine Rolle. Kommen wir zum Wesentlichen… Möglich wärs.
¹Computerlinguistik (ist ja klar)
²Natural Language Processing (Nicht zu verwechseln mit Neurolinguistischer Programmierung, Danke an Kamenin ![]()
Die Beschwerde da oben ist fachübergreifend, oder? Ihr benutzt nicht wirklich NLP in der Computerlinguistuik? Oder seid ihr mit der KI inzwischen so weit, dass ihr euren Computern inzwischen das Unbewusste manipulieren müsst, damit sie tun, was ihr sagt
kamenin
6 Mär 08 at 17:46
Haha! Beinahe hättest Du mich gekriegt. Nein, Neurolinguistische Programmierung steht nicht auf unseren Fahnen, zumindest offiziell. Aber Natural Language Processing
Und ja, davon abgesehen ist die Beschwerde in der Tat fachübergreifend, der Autor unterstellt sogar US-Filmen, dass sie sprach- bzw. in diesem Sinne wohl eher kulturübergreifend gelten möchten (er kennt wohl das Wort Kulturimperialismus nicht).
Faustus
6 Mär 08 at 19:45
Natural Language Processing — als ich jung war, haben’s PEEK und POKE auch getan. Neumodischer Kram
kamenin
6 Mär 08 at 22:25