Liplezende AI is in ontwikkeling, onder toeziend oog

hardhorend — Een liplees-app met AI die is ontwikkeld door startup Liopa is ontwikkeld als hulpmiddel voor slechthorenden en wordt ook toegepast bij bewaking. (Tegoed: Getty Images)

Door AI Trends Staff

Een liplees-app van de Ierse startup Liopa zou een doorbraak betekenen op het gebied van visuele spraakherkenning (VSR), die AI traint om lippen te lezen zonder enige audio-invoer.

Liopa's product, SRAVI (Speech Recognition App for the Voice Impaired) is een communicatiehulpmiddel voor patiënten met een spraakstoornis. Het is waarschijnlijk de eerste liplezende AI-app die beschikbaar is voor openbare aankoop, volgens een account van Vice/Moederbord.

Onderzoekers die worden gedreven door een reeks potentiële commerciële toepassingen, waaronder bewakingstools, werken al jaren om computers te leren liplezen, en het is een uitdagende taak gebleken. Liopa werkt eraan om SRAVI te certificeren als een medisch hulpmiddel van klasse I in Europa, in de hoop de certificering in augustus af te ronden. Dat zou het mogelijk maken om te beginnen met verkopen aan zorgverleners.

Veel techreuzen werken ook aan liplezende AI. Wetenschappers die gelieerd zijn aan of rechtstreeks werken voor Google, Huawei, Samsung en Sony doen allemaal onderzoek naar VSR-systemen en lijken snelle vorderingen te maken, aldus het Motherboard-account.

Liopa wint tweede contract voor Brits defensie- en veiligheidsonderzoek

Hoe liplezende AI wordt ontwikkeld en hoe deze kan worden ingezet, baart zorgen. Liopa heeft onlangs aangekondigd dat het is geselecteerd om deel te nemen aan fase 2 van het DASA Behavioural Analytics-initiatief, bedoeld om de Britse Defense and Security Accelerator te helpen bij het ontwikkelen van capaciteit op het gebied van gedragsanalyse. Deze worden gedefinieerd als 'contextspecifieke inzichten' die zijn afgeleid van gegevens over individuen en groepen, die 'betrouwbare voorspellingen kunnen doen over hoe ze zich in de toekomst waarschijnlijk zullen gedragen'.

De gehoopte tool zou wetshandhavingsinstanties in staat stellen stille CCTV-beelden te doorzoeken en te identificeren wanneer mensen bepaalde trefwoorden zeggen.

De Liopa VSR-engine neemt video op van een onderwerp(en) die aan het woord is als input, en gebruikt AI om de meest waarschijnlijke uitingen van het onderwerp te voorspellen, volgens een persberichtene van Liopa, gevestigd in Belfast, Noord-Ierland. De motor kan worden gebruikt: om sleutelwoorden te identificeren die worden gesproken in bewakingsvideo-inhoud (CCTV) waar audio niet aanwezig is of van slechte kwaliteit is.

DASA Delivery Manager, Eleanor Humphrey, verklaarde: "Behavioural Analytics is een fascinerende en opkomende mogelijkheid die innovatieve manieren vindt om onze mensen te beschermen tegen grote bedreigingen. We zijn verheugd om met Liopa samen te werken om hun technologie te versnellen en kijken uit naar de resultaten.”

Liam McQuillan, oprichter en CEO van Liopa, verklaarde in het persbericht: “Dit contract stelt ons in staat voort te bouwen op de vooruitgang die is geboekt in het fase 1-project. Het is een geweldige validatie van onze VSR-technologie in een praktische use case die onschatbare informatie zal opleveren voor Defensie & Veiligheidspersoneel.”

Liopa is niet de enige die op zoek is naar AI voor liplezen. Surveillancebedrijf Motorola Solutions heeft een patent op een lipleessysteem dat is ontworpen om de politie te helpen. Skylark Labs, een startup waarvan de oprichter banden heeft met het Amerikaanse Defense Advanced Research Projects Agency (DARPA), vertelde Motherboard dat zijn lipleessysteem momenteel wordt gebruikt in particuliere huizen en een door de staat gecontroleerd energiebedrijf in India om grof en grof taalgebruik op te sporen. .

VSR-technologie kan verstrikt raken in ethische kwesties die verband houden met gezichtsherkenning

Sommigen zien het kleverige wicket voor de boeg, vergelijkbaar met wat er is gebeurd op de markt voor gezichtsherkenning, die verstrikt is geraakt in ethische kwesties.

"Dit is een van die gebieden, vanuit mijn perspectief, dat een goed voorbeeld is van 'alleen omdat we het kunnen, betekent niet dat we het moeten doen'", zei Fraser Sampson, de Britse commissaris voor biometrie en bewakingscamera's, tegen Motherboard. “Mijn grootste zorg op dit gebied zou niet per se zijn wat de technologie zou kunnen en wat niet, het zou het huiveringwekkende effect zijn van mensen die geloven dat het zou kunnen doen wat het zegt. Als dat hen ervan weerhield om in het openbaar te spreken, dan bevinden we ons in een veel groter gebied dan alleen privacy, en privacy is groot genoeg.”

AI-onderzoekers zijn zich nu meer bewust van de ethische implicaties van hoe AI wordt toegepast. De NeurIPS-conferentie vereist nu bijvoorbeeld dat AI-wetenschappers, samen met hun voorgestelde papers, impactverklaringen indienen over hoe hun bevindingen de samenleving kunnen beïnvloeden.

Stavros Petridis, onderzoekswetenschapper, Facebook AI Applied Research

Stavros Petridis, die gerelateerd onderzoek heeft gedaan aan Imperial College London en nu voor Facebook werkt, sprak met Motherboard over het dilemma. "In het afgelopen jaar zijn er in de gepubliceerde literatuur verschillende discussies geweest over ethische overwegingen voor VSR-technologie", verklaarde hij. “Aangezien er nog geen commerciële toepassingen beschikbaar zijn, is de kans vrij groot dat er deze keer wel rekening wordt gehouden met ethische overwegingen voordat deze technologie volledig gecommercialiseerd wordt.”

Liopa CEO Liam McQuillan sprak ook met Motherboard over het probleem en zei dat het bedrijf nog minstens een jaar verwijderd is van een systeem dat trefwoorden van stille CCTV-beelden kan liplezen met het vereiste nauwkeurigheidsniveau. Hij zei dat het bedrijf de mogelijkheid van een privacy-terugslag heeft overwogen. "Er kunnen hier zorgen zijn die het uiteindelijke gebruik van deze technologie eigenlijk verbieden", zei McQuillan.

Op de Consumer Electronics Show in januari gaf Sony een overzicht van zijn Visual Speech Enablement-product in ontwikkeling, dat camerasensor en AI gebruikt voor verbeterde liplezen. Mark Hanson, Sony's VP Product Technology and Innovation, zei dat het product de lippen van een gebruiker isoleert en hun bewegingen in woorden vertaalt, onafhankelijk van achtergrond- of voorgrondgeluid, volgens een account in PCMag.

De technologie van het nieuwe product legt alleen lippen vast, geen gezichten, dus er worden geen door de gebruiker identificeerbare gegevens bewaard, gaf Hanson aan.

Lees de bronartikelen en informatie in Vice/Moederbord, a persberichtene van Liopa en in PCMag.

PlatoAi. Web3 opnieuw uitgevonden. Gegevensintelligentie versterkt.
Klik hier voor gratis proefversie.
Bron: https://www.aitrends.com/image-recognition/lip-reading-ai-is-under-development-under-watchful-eyes/

Generatieve data-intelligentie

Liplezende AI is in ontwikkeling, onder waakzame ogen

VC Café

VC Café

Laatste intelligentie

Google Play Store kan nu meerdere Android-apps tegelijkertijd downloaden

🔴Ethereum ETF's uitgesteld | Deze week in Crypto – 11 maart 2024

In ziekte en gezondheid: een gids voor zorgverleners om kracht en hoop te vinden – World News Report – Verbinding met het medische marihuanaprogramma

Clean Group kondigt nieuwe kantoorlocatie aan in Sydney CBD en verbeterde commerciële schoonmaakdiensten – World News Report – Verbinding met het medische marihuanaprogramma

Winstmaximalisatie in 2024: een alomvattende blik op ValueZone.AI

Britse minister van Defensie maakt Italiaanse levering van stormschaduwraketten aan Oekraïne bekend