1. Nachrichten
  2. Forum
    1. Unerledigte Themen
    2. Forenregeln
  3. Spenden
  • Anmelden
  • Registrieren
  • Suche
Firefox-Nachrichten
  • Alles
  • Firefox-Nachrichten
  • Artikel
  • Seiten
  • Forum
  • Erweiterte Suche
  1. camp-firefox.de
  2. Firefox-Nachrichten

Mozilla veröffentlicht Common Voice 24

  • Sören Hentzschel
  • 29. Dezember 2025 um 11:06
  • 30 Mal gelesen
  • 4 Antworten

Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 24 seines Datensatzes veröffentlicht.

Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 24 seines Datensatzes veröffentlicht.

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.

Mozilla Common Voice 24

Der nun veröffentlichte Datensatz Common Voice Scripted Speech 24 beinhaltet für die deutsche Sprache 1.483 Stunden an Daten und ist 34,53 GB groß. In Summe waren 20.413 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 2 für spontane Sprache kommt für Deutsch auf zwei Stunden an Daten und ist 21,96 MB groß, beigetragen von 17 Personen.

Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für drei neue Sprachen bringt, 289 Sprachen mit insgesamt 38.932 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 58 auf 62 Sprachen gewachsen.

Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen

Der Beitrag Mozilla veröffentlicht Common Voice 24 erschien zuerst auf soeren-hentzschel.at.

  • Vorheriger Artikel VR-Browser Wolvic ab sofort im Wartungsmodus

Antworten 4

.DeJaVu
29. Dezember 2025 um 14:08

Wie und wo nutzt man sowas? Technisch gefragt, ich bin auf der Seite nicht fündig geworden.

Sören Hentzschel
29. Dezember 2025 um 14:27

Als Endnutzer normalerweise überhaupt nicht. Das richtet sich an Forscher und Entwickler, die in ihren Produkten eine Spracherkennung anbieten. Mit den Sprachdaten lassen sich die entsprechenden Modelle trainieren, die dann Sprache in Text oder Aktionen übersetzen.

.DeJaVu
29. Dezember 2025 um 14:30

Also quasi sprachgeführte Wege am Ende des Telefons, wie zB doctolib. Schade, aber danke.

Sören Hentzschel
29. Dezember 2025 um 14:40

Es gibt viele Anwendungsfälle dafür. Das ist extrem wichtige Arbeit von Mozilla und seiner Community. Ansonsten wäre der Bereich der Sprachtechnologie mehr oder weniger komplett in den Händen der größten Technologiekonzerne der Welt, die nicht unbedingt Interesse daran haben, ihre Daten kleineren Unternehmen zur Verfügung zu stellen, schon gar nicht kostenlos. Mit Common Voice werden fairere Wettbewerbsbedingungen geschaffen. Und es werden damit auch Sprachen unterstützt, die nicht so weit verbreitet sind und für die es entsprechend schwer ist, überhaupt Daten zu finden. Mittlerweile werden 289 unterschiedlichen Sprachen unterstützt. Es gibt weltweit keinen auch nur ansatzweise so großen Datensatz für Sprache wie Mozilla Common Voice. Und das Ganze ist kostenlos.

Diskutiere mit!

Unterstütze uns!

Jährlich (2025)

108,6 %

108,6% (705,72 von 650 EUR)

Jetzt spenden
Über den Artikel diskutieren 4 Antworten, zuletzt: 29. Dezember 2025 um 14:40
  1. Kontakt
  2. Datenschutz
  3. Impressum
Community-Software: WoltLab Suite™
Mastodon