Zephyrnet logo

Joku vihdoin auttaa tekoälymalleja ymmärtämään puhevammaisia

Treffi:

Boffins University of Illinois Urbana-Champaignissa (UIUC) Yhdysvalloissa työskentelee tavanomaisten Internet-superjoukkojen kanssa ideaalisesti parantaakseen tekoälyn äänentunnistusta vammaisille.

Puheentunnistusohjelmistolla on usein vaikeuksia käsitellä puhetta ihmisille, joilla on voimakkaita aksentteja, ja se toimii vielä huonommin puhevammaisten kohdalla, koska heidän äänensä eivät yleensä ole hyvin tai ollenkaan edustettuina koulutustietosarjoissa. 

Maanantaina käynnistetty Speech Accessibility Project, jota Amazon, Apple, Google, Meta ja Microsoft sekä voittoa tavoittelemattomat organisaatiot tukevat, pyrkii tekemään puheentunnistusmalleista tehokkaampia kaikille. "Puhe ja viestintä ovat monille meistä vaivatonta", sanoi Clarion Mendes, kliininen puhe- ja kuulotieteen professori UIUC:sta projektin parissa. Rekisteri.

”On kuitenkin miljoonia ihmisiä, joille viestintä ei ole vaivatonta. Se on jokapäiväistä kamppailua. Yhdistämällä ponnistelumme kohti yhteistä tavoitetta parantaa puheen esteettömyyttä henkilöille, joilla on puhevamma tai puheeroja, emme vain kehitä teknologiaa, vaan parannamme elämänlaatua ja edistämme itsenäisyyttä.

Tutkijat keskittyvät hankkimaan monipuolista äänidataa ihmisiltä, ​​jotka kärsivät erilaisista puheeseen vaikuttavista sairauksista, kuten Lou Gehrigin taudista tai amyotrofisesta lateraaliskleroosista (ALS), Parkinsonin taudista, aivohalvauksesta ja Downin oireyhtymästä, jotka puhuvat englantia. Vapaaehtoisille maksetaan ääninäytteiden tallentamisesta, joita käytetään suuren tietojoukon luomiseen tekoälymallien kouluttamiseksi kaupallisiin ja tutkimussovelluksiin.

Jos on olemassa tai on ollut samanlaisia ​​projekteja kuin tämä yritys, se on hienoa, vaikka tämä erottuukin tuesta niiltä, ​​jotka tekevät nykypäivän tekoälyapureita ja vastaavia.

Puheen esteettömyysprojektia tukevat toimialakumppanit rahoittavat hanketta vähintään kahden vuoden ajan ja tekevät yhteistyötä tutkijoiden kanssa selvittääkseen, kuinka nykyisiä puheentunnistusmalleja voidaan parantaa.

"Työskentelemällä suoraan ihmisten kanssa, joilla on puheeroja ja vammoja, fokusryhmien ja edunvalvontakumppaneidemme kautta pystymme määrittämään nykyisten automaattisten puheentunnistusjärjestelmien vahvuudet ja rajoitukset sekä tarpeen kehittää uusia järjestelmiä", Mendes sanoi.

Tiimi työskentelee Davis Phinney Foundationin ja Team Gleasonin, kahden voittoa tavoittelemattoman järjestön kanssa, kerätäkseen puhedataa ihmisiltä, ​​joilla on ALS ja Parkinsonin tauti, ennen kuin laajentaa toimintaansa tukemaan muita vammatyyppejä. 

"Mahdollisuus kommunikoida ja käyttää laitteita puheella on ratkaiseva kaikille, jotka ovat vuorovaikutuksessa teknologian tai digitaalisen talouden kanssa nykyään. Puheliitäntöjen tulee olla kaikkien saatavilla, myös vammaisten, sanoi Mark Hasegawa-Johnson, UIUC:n sähkö- ja tietokonetekniikan professori, joka johtaa projektia.

"Tämä tehtävä on ollut vaikea, koska se vaatii paljon infrastruktuuria, mieluiten sellaista, jota johtavat teknologiayritykset voivat tukea, joten olemme luoneet ainutlaatuisen poikkitieteellisen tiimin, jolla on asiantuntemusta lingvistiikasta, puheesta, tekoälystä, turvallisuudesta ja yksityisyydestä. kohtaamme tämän tärkeän haasteen." ®

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?