Mozilla veröffentlicht Common Voice Corpus 8.0

Du benötigst Hilfe bezüglich Firefox? Bitte stelle deine Frage im öffentlichen Bereich des Forums und nicht per Konversation an wahllos ausgesuchte Benutzer. Wähle dazu einen passenden Forenbereich, zum Beispiel „Probleme auf Websites“ oder „Erweiterungen und Themes“ und klicke dann rechts oben auf die Schaltfläche „Neues Thema“.

Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Nun hat Mozilla Version 8.0 seines nun noch einmal 30 Prozent größeren Datensatzes veröffentlicht, inklusive elf weiterer Sprachen.

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.

Im vergangenen Jahr hat Mozilla Common Voice Investitionen von Nvidia, der Bill & Melinda Gates Foundation, der Deutschen Gesellschaft für Internationale Zusammenarbeit (GIZ) und dem britischen Außenministerium in Gesamthöhe von knapp fünf Millionen Dollar erhalten.

Mit dem nun veröffentlichten Common Voice Corpus 8.0 umfasst die Menge der aufgenommenen Sprachdaten jetzt mehr als 18.000 Stunden gegenüber den noch knapp unter 14.000 Stunden der im August 2021 veröffentlichten Version 7.0. Mit elf zusätzlichen Sprachen deckt Mozilla Common Voice jetzt außerdem insgesamt 87 Sprachen ab.

Zum Download der Mozilla Common Voice Datensätze

Der Beitrag Mozilla veröffentlicht Common Voice Corpus 8.0 erschien zuerst auf soeren-hentzschel.at.