Das digitale Zeitalter bedroht 21 europäische Sprachen
Marburg 21.9.2012 (pm/red) Die meisten europäischen Sprachen werden in der digitalen Welt unter Umständen nicht überleben, warnt eine Studie führender europäischer Sprachtechnologie-Experten. In der Studie ‚Europe’s Languages in the Digital Age‘ haben Wissenschaftler den Stand der Sprachtechnologie für 30 der etwa 80 europäischen Sprachen bewertet. Sie kommen zu dem Schluss, dass bei 21 der 30 untersuchten Sprachen ein digitaler Rückhalt nicht existiert oder bestenfalls schwach ist. Umgesetzt wurde die Studie von META-NET, einem europäischen Exzellenz-Netzwerk, in dem 60 Spitzenforschungszentren in 34 Ländern an den technologischen Grundlagen für ein multilinguales Europa arbeiten.
Europa muss Maßnahmen ergreifen, um seine Sprachen auf das digitale Zeitalter vorzubereiten. Sie sind ein wertvoller Bestandteil unseres kulturellen Erbes und als solche verdienen sie Zukunftssicherheit. Am 26. September wird auch dieses Jahr der Europäische Tag der Sprachen stattfinden und an dieses sprachliche und kulturelle Erbe erinnern, dessen Pflege und Förderung für Europa einen wichtigen Stellenwert besitzt. Die META-NET-Studie zeigt, dass das multilinguale Europa im digitalen Zeitalter vor vielen Herausforderungen steht, aber auch immense Chancen hat.
Die Studie, erstellt von mehr als 200 Experten aus Wissenschaft und Industrie, dokumentiert und beurteilt in den 30 Bänden der META-NET White Paper Serie für jede der untersuchten Sprachen die sprachtechnologische Unterstützung in vier Anwendungsgebieten: automatische Übersetzung, Erkennung und Generierung gesprochener Sprache sowie Textanalyse und Verfügbarkeit von Sprachressourcen. Insgesamt 21 der 30 Sprachen wurden von den Experten mindestens einmal in die schlechteste Kategorie ‚Unterstützung ist schwach oder nicht-existent‘ eingeordnet. Mehrere Sprachen, zum Beispiel Isländisch, Litauisch und Maltesisch, erhalten diese Bewertung in allen vier Gebieten. Nur das Englische wurde mit ‚guter Unterstützung‘ bewertet, gefolgt von Sprachen wie Niederländisch, Französisch, Deutsch, Italienisch und Spanisch mit ‚moderater Unterstützung‘. Sprachen wie Baskisch, Bulgarisch, Katalanisch, Griechisch, Ungarisch und Polnisch zeigen nur ‚fragmentarische Unterstützung‘, womit auch sie in die Gruppe von Hochrisiko-Sprachen eingeordnet werden müssen.
„Die Ergebnisse unserer Studie sind äußerst alarmierend. Der Mehrheit der europäischen Sprachen mangelt es in gravierendem Maße an technologischer Unterstützung, und einige werden fast komplett vernachlässigt. In diesem Sinne sind viele unserer Sprachen noch nicht zukunftssicher“, sagt Prof. Hans Uszkoreit, Koordinator von META-NET.
Sprachtechnologie ist Software, die Sprache – in geschriebener oder gesprochener Form – verarbeitet oder generiert. Bekannte Beispiele für Anwendungen, die sprachtechnologische Komponenten enthalten, sind Textverarbeitungen und Mailprogramme (Rechtschreibkontrolle, Grammatiküberprüfung), automatische Übersetzungsprogramme, persönliche Assistenten in Smartphones, automatische Dialogsysteme für Auskünfte oder Buchungen per Telefon, Suchmaschinen im Web und synthetische Stimmen in Navigationssystemen. Derzeit basieren sprachtechnologische Komponenten und Systeme vornehmlich auf statistischen Methoden, die immens große Datenmengen geschriebener oder gesprochener Sprache benötigen. Gerade für Sprachen mit vergleichsweise wenigen Sprechern ist es oftmals sehr schwierig, diese Datenmengen im benötigten Umfang zu sammeln. Zudem unterliegen statistische Verfahren inhärenten Grenzen, was ihre Qualität betrifft, wie man an den oftmals amüsanten fehlerhaften Übersetzungen sehen kann, die von Online-Übersetzungsprogrammen erzeugt werden.
Europa hat es geschafft, fast alle Grenzen zwischen seinen Staaten abzubauen. Jedoch existieren immer noch die scheinbar undurchdringlichen, unsichtbaren Sprachbarrieren, die den freien Fluss von Wissen und Informationen behindern. Dies beeinträchtigt auf lange Sicht auch das Ziel, einen einzigen digitalen Markt zu schaffen, da Waren, Produkte und Dienstleistungen nicht ungehindert fließen können. Sprachtechnologie hat das Potenzial, diese Sprachgrenzen mit Hilfe moderner maschineller Übersetzungsmethoden zu überwinden. Die META-NET-Studie zeigt jedoch klar, dass viele europäische Sprachen dafür noch nicht hinreichend ausgestattet sind. Die technologischen Lücken sind signifikant und entstehen vor allem durch die Fokussierung auf die englische Sprache in Forschung und Entwicklung, mangelndes Engagement und geringe finanzielle Ressourcen sowie nicht zuletzt durch fehlende klare Forschungs- und Technologievisionen.
Um die fehlenden Basistechnologien für die Mehrheit der Sprachen zu entwickeln und den Technologietransfer anzustoßen, bedarf es umfassender Anstrengungen und einer präzisen Koordination. Es gibt stichhaltige Gründe, diese große Herausforderung mit einer gemeinsamen Strategie zu adressieren, welche die Europäische Union, ihre Mitgliedsstaaten und die Industrie einbezieht. Diese Gründe sind unter anderem die hohe finanzielle Pro-Kopf-Belastung kleinerer Sprachgemeinschaften, der notwendige Technologietransfer zwischen den Sprachen, die fehlende Interoperabilität der Ressourcen, Werkzeuge und Dienste sowie der Umstand, dass Sprachgrenzen oft nicht mit politischen Grenzen übereinstimmen.