1. Nachrichten
  2. Forum
    1. Unerledigte Themen
    2. Forenregeln
  3. Spenden
  • Anmelden
  • Registrieren
  • Suche
Firefox-Nachrichten
  • Alles
  • Firefox-Nachrichten
  • Artikel
  • Seiten
  • Forum
  • Erweiterte Suche
  1. camp-firefox.de
  2. Firefox-Nachrichten

Bergamot Project: Mozilla und Europäische Union bringen maschinelle Übersetzungen ohne Cloud in Firefox

  • Sören Hentzschel
  • 19. Oktober 2019 um 19:54
  • 2.158 Mal gelesen
  • 12 Antworten

Im Rahmen des von der Europäischen Union geförderten Bergamot Projects arbeitet Mozilla daran, eine Übersetzungsfunktion für Websites in Firefox zu integrieren - und das vollständig ohne Online-Komponente wie Google Translate.

Im Rahmen des von der Europäischen Union geförderten Bergamot Projects arbeitet Mozilla daran, eine Übersetzungsfunktion für Websites in Firefox zu integrieren – und das vollständig ohne Online-Komponente wie Google Translate.

Bergamot Project: Website-Übersetzung im Browser

Warum sollte man eine Webseite an Google senden, um sie zu übersetzen, wenn doch der eigene Computer und Browser alles dafür hätten, die Übersetzung durchzuführen? Diese Frage hat Emma Humphries von Mozilla sinngemäß auf Twitter gestellt und in dem Tweet auf eine aktuelle Stellenausschreibung von Mozilla verwiesen. Darin sucht Mozilla nach einem Ingenieur für neuronale maschinelle Übersetzung.

Hintergrund des Ganzen ist das von der Europäischen Union geförderte Bergamot Project, in dessen Rahmen Mozilla Deutschland mit der University of Tartu (Estland), der University of Sheffield (England), der University of Edinburgh (Schottland) und der Charles University (Tschechien) kollaboriert, um eine vollständig clientseitige Funktion zur maschinellen Übersetzung von Websites für den Browser zu entwickeln.

Die clientseitige Durchführung der Übersetzung soll einerseits der Privatsphäre dienen, da kein Datenriese wie Google involviert ist, andererseits aber auch die Verbreitung von Sprachtechnologie in Europa fördern, und zwar in Bereichen, welche Vertraulichkeit erfordern und wo es dementsprechend keine Option ist, die Übersetzung in der Cloud durchzuführen.

Das Bergamot Project ist mit drei Millionen Euro durch die Europäische Union gefördert und auf drei Jahre ausgelegt. Damit das Projekt auch über die drei Jahre hinaus einen langfristigen Effekt hat, wird die Übersetzungsfunktion in Firefox integriert und alle Technologien, welche im Rahmen des Bergamot Projects entstehen, als Open Source veröffentlicht.

Für Mozilla hat das Ganze noch einen weiteren sehr großen Vorteil: Firefox hat bereits seit Jahren eine Übersetzungsfunktion integriert, konnte diese aber bisher nicht standardmäßig aktivieren. Hierfür muss der Nutzer sich einen API-Schlüssel bei Google, Microsoft oder Yandex besorgen und diesen via about:config hinterlegen. Der Grund dafür dürfte vermutlich simpel sein: Während die Nutzung eines cloudbasierten Übersetzungsdienstes zwar für den einzelnen Nutzer bei durchschnittlicher Nutzung kostenlos ist, entstehen ab einer gewissen Nutzung Kosten. Würde Mozilla dieses Feature nutzungsbereit ausliefern, wäre dies bei der Anzahl an Firefox-Nutzern für Mozilla mit extrem hohen Kosten verbunden. Entfällt diese Abhängigkeit, kann Mozilla ein Übersetzungs-Feature in Firefox anbieten, ohne dafür tief in die eigene Tasche greifen zu müssen.

Das Bergamot Project läuft bereits seit Januar dieses Jahres und der erste Integrations-Meilenstein wurde nun erreicht und der EU präsentiert. Das folgende Video zeigt eine automatisierte Übersetzung eines deutschsprachigen Artikels in das Englische. Optisch ist kein Unterschied zu der bereits in Firefox vorhandenen, aber versteckten Übersetzungsfunktion zu erkennen. Das Interessante ist das, was man nicht sieht: nämlich, dass in dieser Demo die Übersetzung vollständig im Browser stattfindet und weder die Schnittstellen von Google, Microsoft noch Yandex genutzt werden.

Common Voice, DeepSpeech, WebSpeech API, Firefox Voice

Das Bergamot Project ist nicht Mozillas einzige Aktivität im Bereich Sprache. Mit Common Voice stellt Mozilla eine Online-Plattform zur Verfügung, über welche durch die Nutzer der weltweit größte Sprach-Datensatz kostenlos erzeugt wird – als Alternative zu den großen kommerziellen Anbietern Google, Microsoft, Apple und Amazon.

Unter dem Namen DeepSpeech entwickelt Mozilla ein Open Source Sprachmodell, welches nach Angaben von Mozilla bereits in der Lage sein soll, „Sprache mit menschlicher Genauigkeit und in Echtzeit in Text zu konvertieren – und zwar noch während der Ton gestreamt wird.“ DeepSpeech wird bereits in den Assistenten von Mycroft und Leon sowie im Telefonvermittlungssystem FusionPBX verwendet. In Zukunft soll DeepSpeech auch in Smartphones und In-Car-Systemen zum Einsatz kommen.

Außerdem arbeitet Mozilla derzeit an der Unterstützung des Spracherkennung-Parts der WebSpeech API für Firefox, worüber Websites die Möglichkeit erhalten, per Sprache gesteuert zu werden. Und mit Firefox Voice arbeitet Mozilla an einem Experiment, um Firefox per Sprache zu steuern.

Der Beitrag Bergamot Project: Mozilla und Europäische Union bringen maschinelle Übersetzungen ohne Cloud in Firefox erschien zuerst auf soeren-hentzschel.at.

  • Vorheriger Artikel Lightbeam-Erweiterung für Firefox offiziell eingestellt
  • Nächster Artikel Fenix: Firefox Preview 2.2 für Android veröffentlicht

Antworten 12

milupo
19. Oktober 2019 um 21:08

Steht dieses Projekt im Zusammenhang mit der zukünftigen Zusammenarbeit zwischen Mozilla und dem Unternehmen SYSTRAN? Da geht es um neuronale maschinelle Übersetzung.

Sören Hentzschel
19. Oktober 2019 um 21:20

Das steht nicht in Zusammenhang mit diesem EU-Projekt, aber wie im letzten Teil des Artikels ja zu lesen ist, macht Mozilla sehr viel im Bereich Sprache. Ich musste jetzt selbst erst einmal suchen, weil ich bisher überhaupt nichts davon gehört hatte, habe dann ab das hier gefunden:

https://blog.systransoft.com/opennmt-tf-2-0…pennmt-project/

Da steht nichts von Mozilla, aber von TensorFlow. Außerdem diesen Artikel, in welchem Mozilla erwähnt wird:

https://www.finanzen.at/nachrichten/ak…dels-1028610537

Zitat

"Mozilla is happy to partner with SYSTRAN, who shares our commitment to open source and to giving people control over their online lives. Our contribution to SYSTRAN's Marketplace with neural models trained on Mozilla's linguistic data will make it easier for software developers to get to market faster in more languages including under-resourced languages. This will help us standardize how key privacy and security features are labeled and improve multilingual diversity and access to the web for more people," says Joe Hildebrand, Mozilla's Vice President of Engineering

Aus diesen Quellen schließe ich, dass es hier um Mozillas DeepSpeech-Projekt geht:

https://github.com/mozilla/DeepSpeech

Lange Rede, kurzer Sinn: Nein, das steht in keinem direkten Zusammenhang zueinander, aber es geht um die gleiche Sparte von Mozilla.

milupo
19. Oktober 2019 um 21:35
Zitat von Sören Hentzschel

Das steht nicht in Zusammenhang mit diesem EU-Projekt, aber wie im letzten Teil des Artikels ja zu lesen ist, macht Mozilla sehr viel im Bereich Sprache. Ich musste jetzt selbst erst einmal suchen, weil ich bisher überhaupt nichts davon gehört hatte, habe dann ab das hier gefunden:

https://blog.systransoft.com/opennmt-tf-2-0…pennmt-project/

Da steht nichts von Mozilla, aber von TensorFlow. Außerdem diesen Artikel, in welchem Mozilla erwähnt wird:

https://www.finanzen.at/nachrichten/ak…dels-1028610537


Aus diesen Quellen schließe ich, dass es hier um Mozillas DeepSpeech-Projekt geht:

https://github.com/mozilla/DeepSpeech

Lange Rede, kurzer Sinn: Nein, das steht in keinem direkten Zusammenhang zueinander, aber es geht um die gleiche Sparte von Mozilla.

Alles anzeigen

Danke Sören für die schnelle Antwort.

Ich habe die Information aus einem Beitrag von Jeff Beatty, Leiter des Lokalisierungs-Teams bei Mozilla, in der Newsgroup mozilla.dev.l10n. Der Beitrag ist von gestern.

Zitat

Hello localizers!

tl;dr: Mozilla seeks to widen the impact of your l10n contributions. We’re
partnering with SYSTRAN’s neural machine translation (MT) marketplace to
license neural models trained on Mozilla’s linguistic data from Pontoon’s
translation memory. *Please refrain from commenting on this in public
forums (Twitter, Reddit, etc.) until 1:00pm CET.*

We are grateful for the time, energy, and translations you contribute to
advancing the Mozilla mission through our products. Your impact has been
undeniably helpful to increasing linguistic diversity in open source
software and the Web at large. Because of your localizations, we’re able to
reach new markets with our products and bring in revenue to sustain the
longevity of Mozilla’s existence and mission.

Mozilla’s continued sustainability is dependent upon getting the most out
of the resources Mozilla has and finding diverse forms of revenue. Applied
to l10n, expanding the scope of impact of your contributions is a high
priority for us. As such, we seek to find diverse ways for your
contributions to continuously add value to the organization. We believe
we’ve found a new context in which to maximize your contributions, and I’m
eager to tell you about it here.

SYSTRAN, a major player in the enterprise machine translation (MT)
solutions space, has reached out to Mozilla to partner with us in providing
neural MT solutions to enterprises worldwide. This is done by using our
bilingual datasets and training neural machine translation models with
them. In order to create these, SYSTRAN guarantees transparency and that
Mozilla retains the rights to process and disseminate this data. The data,
like the models created, remain the entire property of Mozilla. SYSTRAN
licenses these models through their neural MT marketplace to enterprise
users and shares any revenue generated from enterprise users licensing
Mozilla’s neural models. We plan to partner with SYSTRAN to train neural
models using data from Pontoon’s translation memory database (which has
been entirely anonymized), and then license those models on the
marketplace. We plan to coordinate with SUMO and MDN at later dates to
determine whether we can do the same with their language datasets.

We’re enthusiastic about this opportunity to partner with SYSTRAN for a
number of reasons:

1.
We are guaranteed free access to the trained model to incorporate into Pontoon, providing you with better quality MT suggestions in Pontoon’s machinery tab.

2.
Translations you contributed to past products (e.g., Firefox OS) find new life as part of the dataset used to train these neural models.

3.
We can lower the barrier to entry for other enterprises to produce software in more languages, improving multilingual diversity and representation in tech.

4.
Through our influence in the marketplace, we can standardize the way some of the most important elements of our mission are discussed and labeled in other languages (e.g., multiple privacy products using the same vernacular, influenced by Mozilla’s neural model).

5.
We can experiment with diversifying Mozilla’s potential revenue through new and exciting partnerships, ensuring that Mozilla remains financially viable and strong.


I hope you’ll join us in our excitement to embark on a unique experiment
with SYSTRAN. It’s great to have a new opportunity to increase your
contributions’ impact on Mozilla and the Web as a whole. If you have any
questions, please first refer to this FAQ [1], which includes more details
about how all of this will work. If you can’t find answers to your
questions there, please reach out to us to discuss further.

Thank you,

Jeff

[1] http://bit.ly/systran_mozilla_FAQ

Alles anzeigen
milupo
19. Oktober 2019 um 21:43

Hier noch der Link zum entsprechenden Thread in den Google Groups:

https://groups.google.com/forum/#!topic/…10n/51azgDcrgW0

Sören Hentzschel
19. Oktober 2019 um 21:46

Danke. Auf jeden Fall auch ein cooles Thema, um darüber einen kleinen Artikel zu schreiben. Es folgt eh noch ein Artikel zur WebSpeech API, dann ist das ein Dreierpaket verwandter Themen. ;)

milupo
19. Oktober 2019 um 21:46
Zitat von Sören Hentzschel

Danke. Auf jeden Fall auch ein cooles Thema, um darüber einen kleinen Artikel zu schreiben. ;)

Ich bitte darum. :)

milupo
19. Oktober 2019 um 22:26

Mal so neben bei: Kürzlich hatte der Direktor der Stiftung für das sorbische Volk mal ein paar Änderungen an Übersetzungen des Common Voice-Website-Projektes auf Pontoon vorgeschlagen. Daraufhin habe ich mit ihm Kontakt aufgenommen und er hat daraufhin vorgeschlagen, dass er eine Initiative startet, Stimmaufnahmen von mindestens 5000 Sätzen zu sammeln. Diese 5000 Sätze sind die Mindestmenge für die Aktivierung des Common Voice-Datensatzes einer Sprache. Die Common-Voice-Website ist ja bereits in beide sorbischen Sprachen übersetzt, ist ja aber nur die halbe Miete.

Außerdem habe ich eine Einladung zu einer eintägigen Konferenz zum Thema "Digitalisierung und sorbische Sprache" erhalten, die am 30. November in Bautzen stattfinden soll. Da wird dieser Themenbereich sicherlich auch behandelt werden.

Speravir
21. Oktober 2019 um 22:17

Ein bisschen Krümelausscheidung, aber:

Zitat

University of Tartu (Estland), […] und der Charles University (Tschechien)

Warum englische Bezeichnungen? Es heißt einfach Universität Tartu und Karls-Universität.

Sören Hentzschel
21. Oktober 2019 um 22:33

Bei Universitäten verwende ich gerne den internationalen Namen, insbesondere, wenn es sich um ein internationales Projekt handelt. Aber im Prinzip ist es egal. Ich hätte auch eine deutsche Übersetzung der Namen verwenden können. Ist halt am Ende auch nur eine Übersetzung und nicht der tatsächliche Name. ;)

Speravir
22. Oktober 2019 um 19:03
Zitat von Sören Hentzschel

Ist halt am Ende auch nur eine Übersetzung und nicht der tatsächliche Name.

Ich verstehe aber immer nicht, wieso in einem deutschen Text die englische Übersetzung genommen werden soll, wenn die Sache/die Einrichtung/wasauchimmer in/aus einem nicht-englischsprachigen Land ist (die beiden Unis aus England und Schottland habe ich in meiner Replik explizit herausgenommen). Wenn Du den Text in Englisch geschrieben hättest, wäre es ja völlig in Ordnung gewesen.

Diskutiere mit! 2 weitere Antworten

Unterstütze uns!

Jährlich (2025)

59,1 %

59,1% (384,24 von 650 EUR)

Jetzt spenden
Über den Artikel diskutieren 12 Antworten, zuletzt: 22. Oktober 2019 um 19:11
  1. Kontakt
  2. Datenschutz
  3. Impressum
Community-Software: WoltLab Suite™
Mastodon