Bergamot Project: Mozilla und Europäische Union bringen maschinelle Übersetzungen ohne Cloud in Firefox
- Sören Hentzschel
- 12 Antworten
- 1.496 Mal gelesen
Im Rahmen des von der Europäischen Union geförderten Bergamot Projects arbeitet Mozilla daran, eine Übersetzungsfunktion für Websites in Firefox zu integrieren – und das vollständig ohne Online-Komponente wie Google Translate.
Bergamot Project: Website-Übersetzung im Browser
Warum sollte man eine Webseite an Google senden, um sie zu übersetzen, wenn doch der eigene Computer und Browser alles dafür hätten, die Übersetzung durchzuführen? Diese Frage hat Emma Humphries von Mozilla sinngemäß auf Twitter gestellt und in dem Tweet auf eine aktuelle Stellenausschreibung von Mozilla verwiesen. Darin sucht Mozilla nach einem Ingenieur für neuronale maschinelle Übersetzung.
Hintergrund des Ganzen ist das von der Europäischen Union geförderte Bergamot Project, in dessen Rahmen Mozilla Deutschland mit der University of Tartu (Estland), der University of Sheffield (England), der University of Edinburgh (Schottland) und der Charles University (Tschechien) kollaboriert, um eine vollständig clientseitige Funktion zur maschinellen Übersetzung von Websites für den Browser zu entwickeln.
Die clientseitige Durchführung der Übersetzung soll einerseits der Privatsphäre dienen, da kein Datenriese wie Google involviert ist, andererseits aber auch die Verbreitung von Sprachtechnologie in Europa fördern, und zwar in Bereichen, welche Vertraulichkeit erfordern und wo es dementsprechend keine Option ist, die Übersetzung in der Cloud durchzuführen.
Das Bergamot Project ist mit drei Millionen Euro durch die Europäische Union gefördert und auf drei Jahre ausgelegt. Damit das Projekt auch über die drei Jahre hinaus einen langfristigen Effekt hat, wird die Übersetzungsfunktion in Firefox integriert und alle Technologien, welche im Rahmen des Bergamot Projects entstehen, als Open Source veröffentlicht.
Für Mozilla hat das Ganze noch einen weiteren sehr großen Vorteil: Firefox hat bereits seit Jahren eine Übersetzungsfunktion integriert, konnte diese aber bisher nicht standardmäßig aktivieren. Hierfür muss der Nutzer sich einen API-Schlüssel bei Google, Microsoft oder Yandex besorgen und diesen via about:config hinterlegen. Der Grund dafür dürfte vermutlich simpel sein: Während die Nutzung eines cloudbasierten Übersetzungsdienstes zwar für den einzelnen Nutzer bei durchschnittlicher Nutzung kostenlos ist, entstehen ab einer gewissen Nutzung Kosten. Würde Mozilla dieses Feature nutzungsbereit ausliefern, wäre dies bei der Anzahl an Firefox-Nutzern für Mozilla mit extrem hohen Kosten verbunden. Entfällt diese Abhängigkeit, kann Mozilla ein Übersetzungs-Feature in Firefox anbieten, ohne dafür tief in die eigene Tasche greifen zu müssen.
Das Bergamot Project läuft bereits seit Januar dieses Jahres und der erste Integrations-Meilenstein wurde nun erreicht und der EU präsentiert. Das folgende Video zeigt eine automatisierte Übersetzung eines deutschsprachigen Artikels in das Englische. Optisch ist kein Unterschied zu der bereits in Firefox vorhandenen, aber versteckten Übersetzungsfunktion zu erkennen. Das Interessante ist das, was man nicht sieht: nämlich, dass in dieser Demo die Übersetzung vollständig im Browser stattfindet und weder die Schnittstellen von Google, Microsoft noch Yandex genutzt werden.
Common Voice, DeepSpeech, WebSpeech API, Firefox Voice
Das Bergamot Project ist nicht Mozillas einzige Aktivität im Bereich Sprache. Mit Common Voice stellt Mozilla eine Online-Plattform zur Verfügung, über welche durch die Nutzer der weltweit größte Sprach-Datensatz kostenlos erzeugt wird – als Alternative zu den großen kommerziellen Anbietern Google, Microsoft, Apple und Amazon.
Unter dem Namen DeepSpeech entwickelt Mozilla ein Open Source Sprachmodell, welches nach Angaben von Mozilla bereits in der Lage sein soll, „Sprache mit menschlicher Genauigkeit und in Echtzeit in Text zu konvertieren – und zwar noch während der Ton gestreamt wird.“ DeepSpeech wird bereits in den Assistenten von Mycroft und Leon sowie im Telefonvermittlungssystem FusionPBX verwendet. In Zukunft soll DeepSpeech auch in Smartphones und In-Car-Systemen zum Einsatz kommen.
Außerdem arbeitet Mozilla derzeit an der Unterstützung des Spracherkennung-Parts der WebSpeech API für Firefox, worüber Websites die Möglichkeit erhalten, per Sprache gesteuert zu werden. Und mit Firefox Voice arbeitet Mozilla an einem Experiment, um Firefox per Sprache zu steuern.
Der Beitrag Bergamot Project: Mozilla und Europäische Union bringen maschinelle Übersetzungen ohne Cloud in Firefox erschien zuerst auf soeren-hentzschel.at.
Antworten 12
milupo
Steht dieses Projekt im Zusammenhang mit der zukünftigen Zusammenarbeit zwischen Mozilla und dem Unternehmen SYSTRAN? Da geht es um neuronale maschinelle Übersetzung.
Sören Hentzschel
Das steht nicht in Zusammenhang mit diesem EU-Projekt, aber wie im letzten Teil des Artikels ja zu lesen ist, macht Mozilla sehr viel im Bereich Sprache. Ich musste jetzt selbst erst einmal suchen, weil ich bisher überhaupt nichts davon gehört hatte, habe dann ab das hier gefunden:
https://blog.systransoft.com/o…e-in-the-opennmt-project/
Da steht nichts von Mozilla, aber von TensorFlow. Außerdem diesen Artikel, in welchem Mozilla erwähnt wird:
https://www.finanzen.at/nachri…slation-models-1028610537
Aus diesen Quellen schließe ich, dass es hier um Mozillas DeepSpeech-Projekt geht:
https://github.com/mozilla/DeepSpeech
Lange Rede, kurzer Sinn: Nein, das steht in keinem direkten Zusammenhang zueinander, aber es geht um die gleiche Sparte von Mozilla.
milupo
Danke Sören für die schnelle Antwort.
Ich habe die Information aus einem Beitrag von Jeff Beatty, Leiter des Lokalisierungs-Teams bei Mozilla, in der Newsgroup mozilla.dev.l10n. Der Beitrag ist von gestern.
milupo
Hier noch der Link zum entsprechenden Thread in den Google Groups:
https://groups.google.com/foru…illa.dev.l10n/51azgDcrgW0
Sören Hentzschel
Danke. Auf jeden Fall auch ein cooles Thema, um darüber einen kleinen Artikel zu schreiben. Es folgt eh noch ein Artikel zur WebSpeech API, dann ist das ein Dreierpaket verwandter Themen.
milupo
Ich bitte darum.
milupo
Mal so neben bei: Kürzlich hatte der Direktor der Stiftung für das sorbische Volk mal ein paar Änderungen an Übersetzungen des Common Voice-Website-Projektes auf Pontoon vorgeschlagen. Daraufhin habe ich mit ihm Kontakt aufgenommen und er hat daraufhin vorgeschlagen, dass er eine Initiative startet, Stimmaufnahmen von mindestens 5000 Sätzen zu sammeln. Diese 5000 Sätze sind die Mindestmenge für die Aktivierung des Common Voice-Datensatzes einer Sprache. Die Common-Voice-Website ist ja bereits in beide sorbischen Sprachen übersetzt, ist ja aber nur die halbe Miete.
Außerdem habe ich eine Einladung zu einer eintägigen Konferenz zum Thema "Digitalisierung und sorbische Sprache" erhalten, die am 30. November in Bautzen stattfinden soll. Da wird dieser Themenbereich sicherlich auch behandelt werden.
Speravir
Ein bisschen Krümelausscheidung, aber:
Warum englische Bezeichnungen? Es heißt einfach Universität Tartu und Karls-Universität.
Sören Hentzschel
Bei Universitäten verwende ich gerne den internationalen Namen, insbesondere, wenn es sich um ein internationales Projekt handelt. Aber im Prinzip ist es egal. Ich hätte auch eine deutsche Übersetzung der Namen verwenden können. Ist halt am Ende auch nur eine Übersetzung und nicht der tatsächliche Name.
Speravir
Ich verstehe aber immer nicht, wieso in einem deutschen Text die englische Übersetzung genommen werden soll, wenn die Sache/die Einrichtung/wasauchimmer in/aus einem nicht-englischsprachigen Land ist (die beiden Unis aus England und Schottland habe ich in meiner Replik explizit herausgenommen). Wenn Du den Text in Englisch geschrieben hättest, wäre es ja völlig in Ordnung gewesen.