Durch die Recher­che von Mar­tin Pyka über CL¹ in der Blo­go­sphäre bin ich auf die Seite des indi­schen Wis­sen­schaft­lers Anil Kumar Singh gesto­ßen, der sich in sei­nem Bei­trag vom 29.02. Gedan­ken zur Rolle des Eng­li­schen in der inter­na­tio­na­len Com­pu­ter­lin­gu­is­tik macht. Es klingt mehr als ein wenig bit­ter, wenn er schreibt:

You pro­pose a theory based on Hindi. It is lan­guage spe­ci­fic. It doesn’t count for much. You pro­pose an NLP² tech­ni­que for a par­ti­cu­lar pro­blem. For Hindi. It is lan­guage spe­ci­fic. It doesn’t count for much. You build a soft­ware for some pur­pose. For Hindi. It is lan­guage spe­ci­fic. It doesn’t count for much.

Und das glei­che in Eng­lisch gilt als “language-independent”. Das ganze erin­nert mich ein wenig an den tür­ki­schen Astro­nom im Klei­nen Prinz, des­sen Ent­de­ckung erst von der inter­na­tio­na­len For­scher­ge­meinde ange­nom­men wur­den, als er Robe und Tur­ban gegen Anzug und Schlips tauschte. Aber: ist es denn wirk­lich so und wenn, was heißt das?

Es hat in mei­nen Augen durch­aus seine Vor­teile, wenn sich die im Wesent­li­chen unge­einte com­pu­ter­lin­gu­is­ti­sche Gemeinde wenigs­tens auf eine Spra­che kon­zen­triert, um viel­leicht irgend­wann ein­mal einen Ansatz­punkt zu fin­den, mit­tels des­sen sich Spra­che ange­mes­sen for­ma­li­sie­ren lässt. Gerade im Zuge auto­ma­ti­scher Über­set­zung ist es zwar immer auch wich­tig, die ande­ren gro­ßen und auch klei­nen bis sehr klei­nen Spra­chen zu berück­sich­ti­gen bzw. den Umweg über das Eng­li­sche zu ver­mei­den. Aber um auf den Bei­trag von Anil zu kom­men: Er kann offen­sicht­lich Eng­lisch, ich kann es auch und die meis­ten ande­ren Com­pu­ter­lin­gu­is­ten eben­falls. Wenn er etwas über Hindi schreibt, kann ich das zur Kennt­nis neh­men und abhän­gig von der Tiefe sei­ner Aus­füh­run­gen viel­leicht sogar ver­ste­hen. Da ich aber kein Hindi kann (und die wenigs­ten ande­ren Com­pu­ter­lin­gu­is­ten eben­falls) wird es in der Regel schwer, die Erkennt­nisse auf die eigene Spra­che anzu­wen­den. Inso­fern ist das Eng­li­sche zwar nicht sprach­un­ab­hän­gig aber immer­hin so bekannt, dass jeder von dort auf seine eigene Spra­che rück­fol­gern kön­nen sollte. Natür­lich wäre es “fai­rer”, wenn wir alle über eine ide­al­ty­pi­sche Inter­lin­gua schrei­ben wür­den. Und da liegt der Hase begra­ben: Es gibt keine sprach­un­ab­hän­gige Spra­che. Und wenn jeder nicht nur in sei­nem klei­nen Käm­mer­lein son­dern auch noch an sei­ner eige­nen Spra­che arbei­tet, dann wird es zuneh­men schwie­rig, einen Fort­schritt zu erzie­len (der ohne­hin schon auf sich war­ten lässt). Außer­dem ist es natür­lich weder ver­bo­ten noch ungern gese­hen, wenn über andere Spra­chen geforscht wird: Ich schreibe ja auch über Auto­ma­ti­sche Über­set­zung von Deutsch nach Spa­nisch — und muss mich damit Pro­ble­men stel­len, die über die Pro­bleme der eng­li­schen Sprach­ver­ar­bei­tung hin­aus­ge­hen. Viel­leicht ist Eng­lisch auch auf­grund sei­ner ver­hält­nis­mä­ßig ein­fa­chen Struk­tur gut geeig­net, sich eher mit all­ge­mein wir­ken­den The­men beschäf­ti­gen zu kön­nen. Kon­ju­ga­tion, Dekli­na­tion — spielt keine Rolle. Kom­men wir zum Wesent­li­chen… Mög­lich wärs.

¹Com­pu­ter­lin­gu­is­tik (ist ja klar)

²Natu­ral Lan­guage Pro­ces­sing (Nicht zu ver­wech­seln mit Neu­ro­lin­gu­is­ti­scher Pro­gram­mie­rung, Danke an Kame­nin ;-)

Post to Twitter Tweet This Post