Zephyrnet-Logo

Appen bekämpft verzerrte KI-Daten, um sicherzustellen, dass Endbenutzer die gleiche Erfahrung machen

Datum:

Das Unternehmen startete verschiedene Trainingsdatensätze für Initiativen zur Verarbeitung natürlicher Sprache.

daten.jpg

Bild: iStock / metamorworks

Der gerade gestartete Trainingsdatenanbieter Appen-Daten wurde kürzlich entwickelt verschieden Schulungsdatensätze für Initiativen zur Verarbeitung natürlicher Sprache, um sicherzustellen, dass Endbenutzer unabhängig von Sprachvielfalt, Dialekt, Ethnolekt, Akzent, Rasse oder Geschlecht die gleiche Erfahrung erhalten. 

Mehr für CXOs

Appen sagte, es sei klar geworden, dass KI-Projekte, die auf voreingenommenen oder unvollständigen Daten basieren, nicht für alle funktionieren. Es ermöglicht Organisationen, unvoreingenommene KI-Modelle durch eine Vielzahl von Projekten und Partnerschaften zu starten, zu aktualisieren und zu betreiben, die sich auf die Vielfalt von Sprachen und Dialekten konzentrieren. Das Unternehmen gab auf seiner Website bekannt

Im März stellten die Verfahren der Nationalen Akademie der Wissenschaften fest, dass beliebte automatisierte Spracherkennungssysteme, die für virtuelle Assistenten, Untertitel, Freisprech-Computing und mehr verwendet werden, „erhebliche rassische Leistungsunterschiede aufweisen“.

SEHEN: Fernarbeit mit Kindererziehung zu jonglieren, ist eine Mammutaufgabe. So können Arbeitgeber helfen (kostenloses PDF) (TechRepublic)

Der Bericht kommt zu dem Schluss, dass „vielfältigere Trainingsdatensätze erforderlich sind, um diese Leistungsunterschiede zu verringern und sicherzustellen, dass die Spracherkennungstechnologie inklusiv ist. Sprachinterpretations- und natürliche Sprachverarbeitungssysteme leiden unter derselben Herausforderung und erfordern dieselbe Lösung. “

"Die Qualität und Vielfalt der Trainingsdaten wirkt sich direkt auf die Leistung und die Verzerrung der KI-Modelle aus", sagte Mark Brayan, CEO bei Appen, in einer Pressemitteilung. „Als Datenpartner können wir vollständige Trainingsdaten für viele Anwendungsfälle bereitstellen, um sicherzustellen, dass KI-Modelle für alle funktionieren. Es ist wichtig, dass wir eine vielfältige Gruppe von Personen damit beauftragen, die Daten zu erstellen, zu kennzeichnen und zu validieren, um sicherzustellen, dass das trainierte Modell nicht nur gerecht ist, sondern auch verantwortungsbewusst aufgebaut wird. “

Mit dem Ziel, KI für alle zu schaffen, entwickelte Appen eine Vielzahl von Projekten und Partnerschaften, die sich auf die Vielfalt der Sprachen und Dialekte konzentrieren. 

Als Beispiel erklärte die Appen-Website:

  1. Partnerschaft zwischen Übersetzern ohne Grenzen: „Appen hat sich in Zusammenarbeit mit TWB, Amazon, der Carnegie Mellon University, Facebook, Google, der John Hopkins University, Microsoft und Translated der Partnerschaft angeschlossen Übersetzungsinitiative für COVID-19 (TICO-19), das die Entwicklung der Sprachtechnologie unterstützte, um COVID-19-Informationen in möglichst vielen Sprachen verfügbar zu machen, einschließlich Sprachen in Entwicklungsländern wie Kongolesisch-Suaheli, Tigrinya und Nigerian Fulfulde. “
  2. Das Inuktitut Übersetzungsprojekt: "In Zusammenarbeit mit der Regierung von Nunavut hat Microsoft Microsoft Translator mithilfe von Appen-Diensten Inuktitut hinzugefügt, eine indigene Sprache in Nordamerika, die in der kanadischen Arktis gesprochen wird."
  3. Das Kanadisches französisches Übersetzungsprojekt: "Appen hat sich mit Beratern für Muttersprachen abgestimmt, um Microsoft dabei zu helfen," kanadisches Französisch "als Sprachoption in Microsoft Translator hinzuzufügen."
  4. Standarddatensätze von African American Vernacular English: „Die meisten vorhandenen Trainingsdatensätze, die in ASR, Suchmaschinen, Sprachassistenten und Stimmungsanalysen verwendet werden, sind nicht repräsentativ für AAVE. Um qualitativ hochwertige AAVE-Daten verfügbar zu machen, arbeitet Appen mit AAVE-Sprechern unter seinen Kommentatoren zusammen, um Daten für einen OTS-Datensatz zu sammeln, die auf Gesprächen über ein breites Themenspektrum basieren. “

Ohne dies zu tun, können voreingenommene KI-Daten eine Informationswelle auslösen, die nicht nur für die Forschung nicht wertvoll ist, sondern auch schädlich sein kann.

"Voreingenommene KI-Daten führen zu Projekten, die möglicherweise nicht die erwarteten Geschäftsergebnisse liefern und Personen schaden, von denen sie profitieren sollen", sagte Dr. Judith Bishop, Senior Director von KI-Spezialisten bei Appen. "Der Umfang und die Komplexität von KI-Projekten machen es den meisten Unternehmen unmöglich, ausreichend unvoreingenommene, qualitativ hochwertige Daten zu erfassen, ohne mit einem KI-Datenexperten zusammenzuarbeiten." Sie fügte hinzu: „Durch die Entwicklung der unterschiedlichsten und kompetentesten Gruppe von Datenanmerkern erhält die Branche eine klar differenzierte Ressource für den Aufbau fairer und ethischer KI-Projekte.“

Siehe auch

Münzsmart. Beste Bitcoin-Börse in Europa
Quelle: https://www.techrepublic.com/article/appen-combats-skewed-ai-data-to-ensure-end-users-have-the-same-experience/#ftag=RSS56d97e7

spot_img

Neueste Intelligenz

spot_img