Meta startet neues Programm zur Verbesserung von Sprach- und Übersetzungs-KI

Meta startet in Partnerschaft mit der UNESCO ein neues Programm zur Sammlung von Sprachaufnahmen und Transkriptionen, die laut dem Unternehmen zur Entwicklung zukünftiger frei verfügbarer KI beitragen werden.

Das Programm, das Language Technology Partner Program, sucht nach Mitarbeitern, die mehr als 10 Stunden Sprachaufnahmen mit Transkriptionen, große Mengen schriftlichen Text und Sätze in verschiedenen Sprachen beisteuern können. Laut Meta werden die Partner mit den KI-Teams des Unternehmens zusammenarbeiten, um diese Sprachen in KI-Spracherkennungs- und Übersetzungsmodelle zu integrieren, die - sobald sie fertig sind - Open Source sein werden.

Zu den bisherigen Partnern zählen die Regierung von Nunavut, einem dünn besiedelten Gebiet im Norden Kanadas. Einige Bewohner von Nunavut sprechen Inuit-Sprachen, die zusammen als Inuktut bekannt sind.

„Unsere Bemühungen konzentrieren sich besonders auf unterversorgte Sprachen zur Unterstützung der Arbeit der UNESCO“, schrieb Meta in einem Blog-Beitrag, der TechCrunch zur Verfügung gestellt wurde. „Letztendlich ist unser Ziel, intelligente Systeme zu schaffen, die komplexe menschliche Bedürfnisse verstehen und darauf reagieren können, unabhängig von Sprache oder kulturellem Hintergrund.“

Ergänzend zu dem neuen Programm gab Meta bekannt, dass es einen Open Source Machine Translation Benchmark veröffentlicht, um die Leistung von Sprachübersetzungsmodellen zu bewerten. Der Benchmark, bestehend aus von Linguisten erstellten Sätzen, unterstützt sieben Sprachen und kann über die KI-Entwicklungsplattform Hugging Face aufgerufen und ergänzt werden.

Meta bezeichnet beide Initiativen als philanthropisch. Aber das Unternehmen profitiert von verbesserten Spracherkennungs- und Übersetzungsmodellen.

Meta erweitert weiterhin die Anzahl der Sprachen, die von seinem KI-gestützten Assistenten Meta AI unterstützt werden, und führt Pilotfunktionen wie automatische Übersetzung für Creator ein. Im vergangenen September kündigte Meta an, ein Tool zum Übersetzen von Stimmen in Instagram Reels zu testen, damit Creator ihre Sprache synchronisieren und automatisch lip-syncen können.

Metas Umgang mit Inhalten in Sprachen andere als Englisch auf seinen Plattformen wurde vielfach kritisiert. Laut einem Bericht ließ Facebook fast 70% der italienischen und spanischen COVID-Fehlinformationen ungekennzeichnet im Vergleich zu nur 29% ähnlicher englischsprachiger Fehlinformationen. Und geleakte Dokumente des Unternehmens zeigen, dass arabische Beiträge regelmäßig fälschlicherweise als Hassrede markiert werden.

Meta hat angekündigt, Schritte zur Verbesserung seiner Übersetzungs- und Moderationstechnologien zu unternehmen.