Camp Firefox

Die Firefox-Community

Die aktuelle Version von Firefox können Sie hier kostenlos herunterladen!

Mozilla stellt weltweit größten Sprach-Datensatz kostenlos zur Verfügung

Alexa, Siri, Google, Cortana – Spracherkennung ist in aller Munde. Und in den festen Händen kommerzieller Anbieter. Nun hat Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereitgestellt – kostenlos und für jeden nutzbar.

Mozillas Arbeit auf dem Gebiet der Spracherkennung

Mozillas Arbeit im Gebiet der Spracherkennung kann neben der Arbeit an Firefox durchaus zu einem der wichtigsten Projekte der Not-for-Profit-Organisation Mozilla gezählt werden. Immer mehr Geräte sind miteinander vernetzt und lassen sich über Sprache steuern. Was vor Jahren noch nach Science Fiction geklungen hätte, ist mittlerweile für immer mehr Menschen Realiät. Der Erfolg eines Gerätes mit Spracherkennung steht und fällt dabei natürlich vor allem mit der Qualität der Spracherkennung

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla das Projekt Common Voice gestartet. Mit Common Voice versucht Mozilla, eine kostenlose Alternative zu etablieren, zu der jeder beitragen kann und die jedem zur Verfügung steht, denn nach Ansicht von Mozilla sollte diese Technologie für jeden zugänglich sein und nicht den großen Anbietern vorbehalten sein. Common Voice ergänzt damit ein weiteres Projekt von Mozilla, nämlich ein Open Source Spracherkennungsmodell, welches unter dem Namen Deep Speech von Mozilla entwickelt wird.

Mozilla veröffentlicht Sprach-Datensatz

Was Mozilla nun kostenlos und zur freien Verfügung veröffentlicht hat, ist der weltweit bislang größte öffentliche Datensatz menschlicher Stimmen. Dieser setzt sich aus 18 verschiedenen Sprachen und knapp 1.400 Stunden aufgezeichneter Sprache zusammen, zu denen mehr als 42.000 Menschen beigetragen haben. Alle Datensätze stehen unter der Creative Commons-Lizenz CC0, befinden sich also in der sogenannten Public Domain.

Download Sprach-Datensatz von der Mozilla Common Voice Webseite

Mozillas Sprachtechnologie auf dem Vormarsch

Mozilla Common Voice ist in den acht Monaten seit dem Start weiterer Sprachen als Englisch bereits auf 22 Sprachen gewachsen – und 70 weitere Sprachen stehen schon in den Startlöchern. Erwähnenswert ist dabei auch, dass bei Common Voice nicht nur die populärsten Sprachen vertreten sind, sondern teilweise auch eher kleinere Sprachen dabei sind, welche von den großen kommerziellen Anbietern häufig vernachlässigt werden.

Aber auch DeepSpeech ist auf dem besten Weg. DeepSpeech sei nach Angaben von Mozilla bereits in der Lage, „Sprache mit menschlicher Genauigkeit und in Echtzeit in Text zu konvertieren – und zwar noch während der Ton gestreamt wird.“ DeepSpeech wird bereits in den Assistenten von Mycroft und Leon sowie im Telefonvermittlungssystem FusionPBX verwendet. In Zukunft soll DeepSpeech auch in Smartphones und In-Car-Systemen zum Einsatz kommen.

Dass Mozilla nun eine erste Version des Sprachdatensatzes bereitgestellt hat, heißt natürlich nicht, dass nicht weiter beigetragen werden sollte. Unter voice.mozilla.org kann nach wie vor jeder helfen.

Der Beitrag Mozilla stellt weltweit größten Sprach-Datensatz kostenlos zur Verfügung erschien zuerst auf soeren-hentzschel.at.

Diese Website verwendet zur Verbesserung des Angebotes Cookies. Wenn Sie weiter auf der Seite bleiben, stimmen Sie der Cookie-Nutzung zu.
Weitere Informationen OK