제퍼넷 로고

Facebook은 이미지와 비디오를 분할 할 수있는 자체 감독 AI를 자세히 설명합니다.

시간

이번 2021 월 12 일부터 16 일까지 Transform XNUMX에 참여하세요. FO 등록r 올해의 AI 이벤트.


페이스북은 오늘(XNUMX일) 인리 아 훈련을 가능하게 하는 DINO라고 불리는 변압기, 레이블이 지정된 교육 데이터가 없는 일종의 기계 학습 모델입니다. 이 회사는 레이블이 지정되지 않은 데이터 훈련 방법 중 새로운 최첨단을 설정하고 특정 목표 없이 이미지 또는 비디오에서 개체를 발견하고 분할할 수 있는 모델로 이어진다고 주장합니다.

개체 분할은 비디오 채팅의 배경 교체에서 공장을 탐색하는 로봇 교육에 이르기까지 다양한 작업에 사용됩니다. 그러나 AI가 이미지의 내용을 이해해야 하기 때문에 컴퓨터 비전에서 가장 어려운 과제 중 하나로 간주됩니다.

세분화는 전통적으로 다음과 같이 수행됩니다. 지도 학습 많은 양의 주석이 달린 예제가 필요합니다. 감독 학습에서 알고리즘은 입력과 출력 결과 사이의 기본 관계를 감지할 수 있을 때까지 특정 출력에 대해 주석이 달린 입력 데이터에 대해 훈련됩니다. 그러나 비지도 학습(자기 지도 학습이라고도 함)을 활용하는 DINO를 사용하면 시스템이 자체적으로 레이블이 지정되지 않은 데이터를 분류하고 레이블이 지정되지 않은 데이터를 처리하여 고유한 구조에서 학습하도록 학습합니다.

감독되지 않은 변환기

트랜스포머를 사용하면 AI 모델이 입력 부분에 선택적으로 집중하여 보다 효과적으로 추론할 수 있습니다. 처음에는 음성 및 자연어 처리에 적용되었지만 변환기는 컴퓨터 비전 문제와 이미지 분류 및 감지에 채택되었습니다.

소위 비전 변환기의 핵심에는 자기 주의 계층이 있습니다. 각 공간 위치는 다른 위치에 "주목"하여 표현을 구축합니다. 그런 식으로 잠재적으로 멀리 떨어져 있는 이미지의 다른 부분을 "바라봄"으로써 변환기는 전체 장면에 대한 풍부하고 높은 수준의 이해를 구축합니다.

DINO는 동일한 이미지의 다른 보기에서 모델의 출력을 일치시키는 방식으로 작동합니다. 이를 통해 이미지 전체에서 개체 부분 및 공유 특성을 효과적으로 발견할 수 있습니다. 또한 DINO는 시각적 속성을 기반으로 범주를 연결할 수 있습니다. 예를 들어 생물학적 분류와 유사한 구조로 동물 종을 명확하게 구분합니다.

페이스북 디노

위: Facebook의 DINO 시스템은 감독되지 않은 방식으로 이미지를 분할할 수 있습니다.

이미지 크레디트 : Facebook

Facebook은 DINO가 이미지 사본을 식별하도록 설계되지 않았음에도 불구하고 이미지 사본을 식별하는 데 최고라고 주장합니다. 즉, 미래에 DINO 기반 모델을 사용하여 잘못된 정보나 저작권 침해를 식별할 수 있습니다.

페이스북은 블로그 게시물에서 “변환기와 함께 자기 지도 학습을 사용함으로써 DINO는 이미지와 비디오를 훨씬 더 깊이 이해하는 기계를 구축할 수 있는 문을 엽니다. “인간 주석의 필요성은 일반적으로 컴퓨터 비전 시스템 개발의 병목 현상입니다. 접근 방식을 보다 효율적으로 주석 처리함으로써 모델을 더 큰 작업 세트에 적용하고 잠재적으로 인식할 수 있는 개념의 수를 확장할 수 있습니다.”

PAWS

Facebook은 또한 오늘 PAWS라는 새로운 기계 학습 접근 방식을 자세히 설명했습니다. 이 접근 방식은 이전의 최첨단 및 반지도 방식보다 표면적으로 더 나은 분류 정확도를 달성합니다. 특히 4배에서 12배 정도 더 적은 훈련이 필요하므로 PAWS는 의학과 같이 레이블이 지정된 이미지가 많지 않은 영역에 잠재적으로 적합합니다.

지도 학습과 비지도 학습 사이에 있는 준지도 학습은 부분적으로 레이블이 지정되었거나 대부분의 데이터에 레이블이 없는 데이터를 받아들입니다. 제한된 데이터로 작업할 수 있는 능력은 준지도 학습의 주요 이점입니다. 대부분 데이터를 정리하고 정리하는 데 시간을 보냅니다.

페이스북 PAWS

PAWS는 레이블이 지정되지 않은 데이터와 함께 레이블이 지정된 데이터의 일부를 활용하여 결과를 얻습니다. 레이블이 지정되지 않은 훈련 이미지가 주어지면 PAWS는 무작위 데이터 확대 및 변환을 사용하여 이미지의 두 개 이상의 뷰를 생성합니다. 그런 다음 이러한 보기의 표현을 서로 유사하게 만들기 위해 모델을 훈련합니다.

표현을 직접 비교하는 자체 감독 방법과 달리 PAWS는 레이블이 지정된 이미지의 무작위 하위 샘플을 사용하여 레이블이 지정되지 않은 보기에 "의사 레이블"을 할당합니다. 의사 레이블은 레이블이 지정되지 않은 보기의 표현과 레이블이 지정된 지원 샘플의 표현을 비교하여 얻습니다. 이 때문에 PAWS는 모든 이미지가 동일한 표현에 매핑되는 "collapsing representations"를 학습하지 않습니다. 이는 자체 감독 방법의 일반적인 문제입니다.

"DINO와 PAWS를 통해 AI 연구 커뮤니티는 레이블이 지정된 데이터와 훈련을 위한 방대한 컴퓨팅 리소스에 훨씬 덜 의존하는 새로운 컴퓨터 비전 시스템을 구축할 수 있습니다."라고 페이스북 성명서는 계속 말했습니다. "우리의 실험이 커뮤니티에 [시각적 변환기]에 대해 훈련된 자가 감독 시스템의 잠재력을 보여주고 더 많은 채택을 장려하기를 바랍니다."

DINO와 PAWS는 모두 오픈 소스로 제공됩니다.

VentureBeat

VentureBeat의 사명은 기술 의사 결정권자가 혁신적인 기술과 거래에 대한 지식을 습득 할 수있는 디지털 타운 스퀘어가되는 것입니다. 당사 사이트는 데이터 기술 및 전략에 대한 필수 정보를 제공하여 조직을 이끌 때 안내합니다. 다음에 액세스 할 수 있도록 커뮤니티의 일원이되도록 귀하를 초대합니다.

  • 관심있는 주제에 대한 최신 정보
  • 뉴스 레터
  • 금지 된 사고 리더 콘텐츠 및 다음과 같은 소중한 이벤트에 대한 할인 된 액세스 변환 2021: 더 알아보기
  • 네트워킹 기능 등

회원 가입

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처: https://venturebeat.com/2021/04/30/facebook-details-self-supervised-ai-that-can-segment-images-and-videos/

spot_img

최신 인텔리전스

spot_img