제퍼넷 로고

Scale AI, 자율 주행 자동차 개발을위한 무료 라이더 데이터 세트 출시

시간

고품질 데이터는 AI 알고리즘을 강화하는 연료입니다. 레이블이 지정된 데이터가 지속적으로 흐르지 않으면 병목 현상이 발생할 수 있으며 알고리즘이 서서히 악화되어 시스템에 위험을 초래합니다.

라벨링 된 데이터가 다음과 같은 회사에 중요한 이유 주크, 크루즈 Waymo, 자율 주행 차를 개발하고 배치하기 위해 기계 학습 모델을 훈련시키는 데 사용됩니다. 소프트웨어와 사람들을 사용하여 머신 러닝 알고리즘을 구축하는 회사의 이미지, 라이더 및지도 데이터를 처리하고 라벨링하는 스타트 업인 Scale AI가 탄생하게되었습니다. 자율 주행 차량 기술에 종사하는 회사는 저울 이 플랫폼은 에어 비앤비, Pinterest, OpenAI 등에서도 사용됩니다.

COVID-19 전염병은 AV 회사들이 공공 도로에서 테스트를 중단함에 따라 수십억 개의 이미지를 수집하는 수단 인 데이터 흐름을 느리게하거나 심지어 중단했습니다. 저울은 탭을 다시 켜고 무료로 바라고있다.

이 회사는 lidar 제조업체 인 Hesai와 공동으로 이번 주에 오픈 소스 데이터 세트를 출시했습니다. 판다 세트 자율 주행을위한 머신 러닝 모델 훈련에 사용될 수 있습니다. 학술 및 상업용으로 무료로 사용이 허가 된 데이터 세트에는 이미지와 같은 해상도를 가진 Hesai의 전방을 향한 PandarGT 라이더와 Pandar64라는 기계적 회전 라이더를 사용하여 수집 된 데이터가 포함됩니다. 이 회사에 따르면 샌프란시스코와 실리콘 밸리에서 도시 지역을 운전하는 동안이 정보가 수집됐다고 전했다.

"AI와 머신 러닝은 놀라운 잠재력을 가진 놀라운 기술이지만 엄청난 고통을 안고있다"고 스케일 CEO 겸 공동 창립자 인 Alexandr Wang은 최근 인터뷰에서 TechCrunch에 말했다. “기계 학습은 분명히 쓰레기와 쓰레기 같은 종류의 프레임 워크입니다. 이러한 알고리즘을 구현하려면 고품질의 데이터가 필요합니다. 이것이 바로 우리가 스케일을 구축 한 이유이기도하며 오픈 소스 관점에서 업계를 발전시키는 데 도움이되도록 오늘날이 데이터 세트를 사용하는 이유이기도합니다.”

이 라이더 데이터 세트의 목표는 밀도가 높고 컨텐츠가 풍부한 데이터 세트에 자유롭게 액세스하는 것이 었으며 Wang은 자동차, 자전거, 신호등 및 보행자로 가득한 복잡한 도시 환경에서 두 종류의 라이더를 사용하여 달성했다고 밝혔다.

Wang은“축소와 세계 크루즈는 종종 이러한 밀집된 도시 환경에서 시스템의 전투 테스트 방법에 대해 이야기 할 것입니다. "우리는 그것을 전체 커뮤니티에 실제로 노출시키고 싶었습니다."

Lidar-Scale AI PandaSet 플라이 오버 GIF

이미지 크레딧 : AI 규모

회사에 따르면이 데이터 세트에는 48,000 개가 넘는 카메라 이미지와 16,000 개의 레이더 스위프 (100 개씩 8 개가 넘는 장면)가 포함되어 있습니다. 또한 각 장면에 대해 28 개의 주석 클래스와 대부분의 장면에 대한 37 개의 시맨틱 세그먼트 레이블을 포함합니다. 예를 들어 자전거 나 자동차 주위에 배치 된 작은 상자 인 기존 입방체 레이블은 모든 라이더 데이터를 적절하게 식별 할 수 없습니다. 따라서 Scale은 점 구름 세분화 도구를 사용하여 비와 같은 복잡한 물체에 정확하게 주석을 달 수 있습니다.

오픈 소싱 AV 데이터가 완전히 새로운 것은 아닙니다. 작년, Aptiva Scale은 자율 주행 차량 센서 제품군에서 대규모 데이터 세트 인 nuScenes를 출시했습니다. Argo AI, Cruise 및 Waymo는 연구원들에게 데이터를 공개 한 다수의 AV 회사 중 하나였습니다. Argo AI는 고화질지도와 함께 선별 된 데이터를 발표했으며 Cruise는 데이터 시각화 도구 로봇의 모든 센서에서 수집 된 원시 데이터를 가져 와서 이진 코드를 비주얼로 변환하는 Webviz라고합니다.

Scale의 노력은 약간 다릅니다. 예를 들어 Wang은이 데이터 세트를 사용하는 라이센스에는 제한이 없다고 말했다.

Wang은“현재는 큰 라벨링 된 데이터에 대한 필요성과 지속적인 요구가 있습니다. “자율 주행 시스템을 구축 할 때 극복해야 할 가장 큰 장애물 중 하나입니다. 특히 많은 자율 주행 회사가 데이터를 수집 할 수없는시기에이 데이터에 대한 액세스를 민주화하고 싶습니다.”

그렇다고 스케일이 갑자기 모든 데이터를 제공한다는 의미는 아닙니다. 결국 영리 기업입니다. 그러나 올해 말 이미 새로운 데이터를 수집하고 개방하는 것을 고려하고 있습니다.

출처 : https://techcrunch.com/2020/05/22/scale-ai-releases-free-lidar-dataset-to-power-self-driving-car-development/

spot_img

최신 인텔리전스

VC 카페

VC 카페

spot_img