제퍼넷 로고

입술 읽기 AI가 개발 중이며주의 깊은 눈 아래에 있습니다. 

시간

스타트 업 리오 파가 개발 한 인공 지능을 이용한 입술 읽기 앱이 청각 장애인을위한 보조 도구로 개발되어 감시에도 적용되고있다. (크레딧 : 게티 이미지)   

AI 트렌드 스태프 

아일랜드 스타트 ​​업 Liopa의 입술 읽기 앱은 음성 입력없이 입술을 읽을 수 있도록 AI를 훈련시키는 시각 음성 인식 (VSR) 분야의 돌파구를 대표한다고합니다.   

Liopa의 제품인 SRAVI (음성 장애를위한 음성 인식 앱)는 언어 장애 환자를위한 커뮤니케이션 보조 도구입니다. 의 계정에 따르면 공개 구매가 가능한 최초의 입술 읽기 AI 앱이 될 것입니다. 바이스 / 마더 보드.  

감시 도구를 포함하여 다양한 잠재적 인 상용 응용 프로그램을 운영하는 연구원들은 컴퓨터에 입술 읽기를 가르치기 위해 수년간 노력해 왔으며 어려운 작업으로 입증되었습니다. Liopa는 SRAVI를 유럽에서 Class I 의료 기기로 인증하기 위해 노력하고 있으며 XNUMX 월까지 인증을 완료하기를 희망합니다. 그러면 의료 제공자에게 판매를 시작할 수 있습니다. 

많은 기술 거물들도 입술 읽기 AI를 연구하고 있습니다. 마더 보드 계정에 따르면 구글, 화웨이, 삼성, 소니와 제휴하거나 직접 일하는 과학자들은 모두 VSR 시스템을 연구하고 있으며 빠르게 발전하고있는 것으로 보인다.   

Liopa, 영국 국방 및 보안 연구를위한 두 번째 계약 체결  

입술 읽기 AI가 개발되는 방식과 배포 방식이 우려의 원인이되고 있습니다. Liopa는 최근 영국의 Defense and Security Accelerator가 행동 분석 기능을 개발할 수 있도록 돕는 것을 목표로하는 DASA 행동 분석 이니셔티브의 2 단계에 참여하도록 선정되었다고 발표했습니다. 이는 개인 및 그룹에 대한 데이터에서 파생 된 "컨텍스트 별 통찰력"으로 정의되며 "미래에 어떻게 행동 할 것인지에 대한 신뢰할 수있는 예측"을 가능하게합니다.   

이 도구를 사용하면 법 집행 기관이 조용한 CCTV 영상을 검색하고 사람들이 특정 키워드를 말할 때 식별 할 수 있습니다.   

XNUMXD덴탈의 Liopa VSR 엔진은 입력으로 말하는 대상의 비디오를 가져오고 AI를 사용하여 대상의 가장 가능성이 높은 발화를 예측합니다. 보도 자료북 아일랜드 벨파스트에 본사를 둔 Liopa 출신. 엔진을 사용할 수 있습니다 오디오가 없거나 품질이 좋지 않은 CCTV (감시 비디오 콘텐츠)에서 사용되는 키워드를 식별합니다.  

DASA 제공 관리자 인 Eleanor Humphrey는 다음과 같이 말했습니다.“행동 분석은 주요 위협으로부터 직원을 안전하게 보호 할 수있는 혁신적인 방법을 찾고있는 매력적이고 새로운 기능입니다. Liopa와 협력하여 기술을 가속화하게되어 기쁘고 결과를 기대합니다.”  

Liam McQuillan, Liopa 설립자 겸 CEO

Liopa의 설립자 겸 CEO 인 Liam McQuillan은 릴리스에서 다음과 같이 말했습니다.“이 계약을 통해 우리는 1 단계 프로젝트의 진행 상황을 기반으로 할 수 있습니다. 국방 및 보안 요원에게 귀중한 정보를 제공 할 실제 사용 사례에서 VSR 기술을 훌륭하게 검증 한 것입니다. "  

입술 읽기를 위해 AI를 활용하려는 노력은 Liopa만이 아닙니다. 감시 회사 인 Motorola Solutions는 경찰을 돕기 위해 설계된 입술 판독 시스템에 대한 특허를 보유하고 있습니다. 창립자가 미국 국방 첨단 연구 프로젝트 기관 (DARPA)과 관련이있는 신생 기업인 Skylark Labs는 자신의 입술 판독 시스템이 현재 개인 가정과 인도의 국영 전력 회사에 배치되어 불쾌하고 욕설을 감지하기 위해 마더 보드에 말했습니다. . 

VSR 기술은 얼굴 인식과 관련된 윤리적 문제에 갇힐 수 있습니다. 

일부 사람들은 윤리적 문제에 휩싸인 안면 인식 시장에 닥친 것과 유사한 끈질긴 개찰구를 앞두고 있습니다.  

영국의 생체 인식 및 감시 카메라 커미셔너 인 Fraser Sampson은 마더 보드에 이렇게 말했습니다. “이 분야에서 저의 주된 관심사는 기술이 할 수있는 일과 할 수없는 일이 반드시있는 것은 아닙니다. 그것이 말하는대로 할 수 있다고 믿는 사람들의 냉담한 효과 일 것입니다. 그렇게해서 그들이 대중 앞에서 말하는 것을 막았다면 우리는 단순한 프라이버시보다 훨씬 더 큰 영역에 있고 프라이버시는 충분히 큽니다.” 

AI 연구자들은 이제 AI가 적용되는 방식의 윤리적 의미를 더 잘 알고 있습니다. 예를 들어, NeurIPS 컨퍼런스에서는 이제 AI 과학자가 제안 된 논문과 함께 자신의 연구 결과가 사회에 미치는 영향에 대한 성명서를 제출해야합니다.  

Stavros Petridis, 연구원, Facebook AI Applied Research

Imperial College London에서 관련 연구를 수행했으며 현재 Facebook에서 일하고있는 Stavros Petridis는 딜레마에 대해 마더 보드에 이야기했습니다. "작년에 출판 된 문헌에서 VSR 기술에 대한 윤리적 고려 사항에 대한 여러 논의가있었습니다."라고 그는 말했습니다. "아직 사용할 수있는 상용 응용 프로그램이 없다는 점을 감안할 때 이번에는이 기술이 완전히 상용화되기 전에 윤리적 고려 사항이 고려 될 가능성이 매우 높습니다."  

Liopa의 CEO 인 Liam McQuillan은 또한 문제에 대해 마더 보드와 이야기를 나눴으며, 회사는 필요한 수준의 정확도로 무음 CCTV 영상에서 키워드를 입술로 읽을 수있는 시스템을 갖출 수있는 시스템을 갖출 수있는 시스템을 갖추기에는 적어도 XNUMX 년은 더 걸릴 것이라고 말했습니다. 그는 회사가 프라이버시 반발 가능성을 고려했다고 말했다. "실제로이 기술의 궁극적 인 사용을 금지하는 우려가있을 수 있습니다."라고 McQuillan은 말했습니다.  

지난 XNUMX 월 소비자 가전 전시회에서 소니는 증강 입술 판독을 위해 카메라 센서와 AI를 사용하는 비주얼 스피치 인 에이블먼트 제품에 대한 개요를 제공했습니다. 소니의 제품 기술 및 혁신 담당 부사장 인 Mark Hanson은이 제품이 사용자의 입술을 분리하고 배경 또는 전경 소음과 무관하게 사용자의 움직임을 단어로 번역한다고 밝혔다. PCMag.  

이 신제품의 기술은 얼굴이 아닌 입술 만 캡처하므로 사용자 식별 데이터는 유지되지 않는다고 Hanson은 지적했습니다.   

소스 기사 및 정보 읽기 바이스 / 마더 보드보도 자료e Liopa와 PCMag. 

PlatoAi. Web3 재창조. 풍부한 데이터 인텔리전스.
무료 평가판을 보려면 여기를 클릭하십시오.

출처 : https://www.aitrends.com/image-recognition/lip-reading-ai-is-under-development-under-watchful-eyes/

spot_img

최신 인텔리전스

spot_img