소셜 네트워크

인공 지능

미래의 사기 퇴치 : 은행이해야 할 일

화신

게재

on

By 팻 시어

대유행 봉쇄 기간 동안 고객 행동이 급격히 바뀌 었으며 이는 결제 산업도 자연스럽게 변화 시켰습니다.

사기를 방지하기 위해 금융 산업은 의심스러운 행동을 식별하거나 고객 행동의 차트 변화를 파악하기 위해 항상 특정한 견제와 균형을 유지해 왔습니다. 논리와 패턴을 식별하기위한 훈련에 기반한 이러한 견제와 균형은 논리와 패턴 이외의 다른 것에 기반한 유행병이 온라인 뱅킹을 사용하지 않았거나 디지털 지갑을 통해 상품과 서비스를 구매 한 고객이있을 때까지 대부분 잘 작동했습니다. 갑자기 반복해서. 그리고 더 많은 온라인 고객은 더 많은 사기를 의미합니다.

ThetaRay의 금융 서비스 솔루션 EVP 인 James Heinzman은 ATM Marketplace와의 인터뷰에서 "사기 결정에 항상 사용 된 패턴과 모델은 불행히도 더 이상 관련이 없습니다."라고 말했습니다. "은행은 이제 대유행 이전보다 400 ~ 600 배 많은 경보를 생성하고 있으며 모델은 시장의 근본적인 행동이 변경되었음을 인식하는 대신 새로운 행동을 의심스러운 것으로 식별하고 있습니다."

Heinzman은 업계가 이전에 그러한 급진적 인 변화를 본 적이 없기 때문에 유행병 이전에 사용 된 모델을 앞으로 어떤 식 으로든 의미있게 만들려면 재 작성, 재교육 및 재보 정해야한다고 설명했습니다.

“이것은 매우 비싸고 리소스를 많이 소모하는 작업입니다. 레거시 기술 프로그램을 다시 작성하는 것이 정말로 합리적입니까? 우리는 비지도 머신 러닝이 문제에 대한 더 나은 해결책이라고 믿습니다. 고급 인공 지능 솔루션은 데이터 기반이고 새로운 표준에 자동으로 조정되기 때문에이 문제를 해결합니다.”라고 Heinzman은 말했습니다. “도매 시장 변화와 실제 의심스러운 행동을 정확하게 구분합니다. 사전 정의 된 규칙이나 모델이 없기 때문에 사전 예가 없더라도 연결하고 패턴을 식별 할 수 있습니다.”

Q : COVID-19로 인해 자금 세탁 방지 및 사기 방지 감지 모델이 거의 쓸모 없게 된 경우 은행은 어떻게해야합니까?

A: [은행]이 가장 먼저해야 할 일은 AML 프로그램을 새롭게 살펴 보는 것입니다. 사람, 프로세스 및 기술을 확인하십시오. 그들은 세상이 영원히 변했음을 인정할 필요가 있습니다. 바이러스는 사라지지 않습니다. 은행이 실제로 새로운 기술을 채택하고 인프라를 현대화해야 할 때입니다. 많은 은행 업무는 관계를 기반으로했습니다. -인간 상호 작용. 그것은 극적으로 변했습니다. 미래의 은행 업무는 주로 웹 및 디지털 채널을 통해 수행 될 것입니다. AML 프로그램은 이러한 변화를 충족하고 기술을 현대화하도록 적응해야합니다.

Q : 은행은 사이버 범죄 증가에 어떻게 개방되어 있습니까?

A:T그는 은행 직원이 현재 재택 근무를하고 있으며 보안 시스템은이를 위해 설계되지 않았으며 새로운 취약점이 발생했습니다. 또한 은행이 개인 기기에서 원격 근무자에게 민감한 정보를 공개하도록 강요하여 민감한 데이터를 노출시킵니다. 은행은 탐지되지 않는 이러한 침해를 식별하고 완화하기 위해 사이버 범죄에 대한보다 현대적인 접근 방식을 채택하고 경계 방어뿐만 아니라 비즈니스 활동도 살펴볼 필요가 있습니다.

Q : 금융 기관이주의해야하는 주요 사이버 범죄는 무엇입니까?

A:이 은행을 공격하기 전에는 본 적이없는 많은 공격이 있으며 점점 더 정교 해지고 있습니다. 그리고 이제는 금융 범죄 단속 네트워크 위반 덕분에 더 많은 정보를 얻을 수 있습니다. 피싱 및 스피어 피싱 기술은 원격 인력 덕분에 더욱 효과적이되고 있습니다. 직원이 사무실에 없을 때 의심스러운 링크를 클릭 할 가능성이 높아져 직원을 감독하기가 어렵습니다. 또한 이직에 대한 두려움으로 인해 직원들은 평소에하지 않았던 일을하게되어 이러한 유형의 공격에 넘어 질 위험이 더 높아집니다. COVID 이후 시대의 가장 큰 위협은 은행 자체에서 올 수 있습니다.

Q : 새로운 직관적 인 AI 유형에 대해 설명해 주시겠습니까?

A: 인공 직관을 통해 컴퓨터는 인간의 경험이나 과거 사건을 기반으로 사전 정의 된 모델을 따르지 않고 무엇을 찾아야하는지 알려주지 않고도 위협과 기회를 식별 할 수 있습니다. 인간의 직감으로 우리가 결정을 내리는 방법에 대한 특별한 지시 없이도 결정을 내릴 수있는 것처럼. 기본적으로 인공 직관은 모든 데이터 포인트와 이들이 연결되는 방식을 평가합니다. 무슨 일이 일어나고 있는지, 모든 것이 다른 모든 것에 어떻게 연결되어 있는지에 대한 동적 뷰를 만들 수 있습니다. 이런 식으로 인간의 두뇌가 정보를 처리하는 방식을 모방하고 특이한 사항에 대해 결정을 내릴 수 있습니다.

사람이 다가오는 것을 볼 때 어떤 일이 발생하는지 고려하십시오. 대부분의 사람들은자를 꺼내 귀 사이의 거리, 눈의 거리 또는 턱의 길이를 측정하지 않습니다. 그들이하는 일은이 사람에 대한 모든 정보를 매우 빠르게 보는 것입니다. 데이터 포인트의 모든 연결을 메모리와 비교합니다. 이 사람이 전에 본 사람입니까? 그들은 친구입니까? 협박? 같은 방식으로 인위적인 직관은 개별적으로 정상으로 보이지만 함께 살펴보면 의심을 불러 일으키는 데이터 포인트 간의 연결을 만들 수 있습니다.

Q : 지능이 아닌 인공 직관이라고하는 이유는 무엇입니까?

A: 사람들이 "인공 지능"이라는 용어를들을 때 그들은 규칙 기반 프로그래밍을 따르는 매우 논리 기반 시스템을 그리는 경향이 있습니다. 예, 대부분의 실제 AI 응용 프로그램이 HAL9000이 아니라는 것은 사실이지만 여전히 교육받은 일련의 규칙을 따릅니다. "X가 발생하면 Y가 발생합니다." 인공적인 직관은 이러한 규칙 기반 접근 방식에서 벗어나 정교한 알고리즘을 사용하여 시스템이 자체적으로 작동하여 데이터 포인트를 연결하도록합니다. 가능한 모든 시나리오를 배울 필요는 없으며, 인간이 무한한 수의 가능한 상황을 인식하고 이해해야하기 때문에 불가능할 것입니다. 인간의 지능을 뛰어 넘어 인간의 직관을 모방 한 빅 데이터를 처리 할 수 ​​있다면 자동으로 추론 할 수 있습니다.

Q :이 기술의 이점은 무엇입니까?

A: 금융 기관은 통신 은행, 국경 간 거래, 무역 금융, 자금 세탁, 사기 및 ATM 해킹을 포함한 새롭고 정교한 금융 사이버 범죄를 탐지하기 위해 인위적인 직관을 채택하기 시작했습니다. 이러한 범죄는 일반적으로 연결된 매개 변수 집합이있는 수천 건의 거래 사이에 숨겨져 있습니다. 정교한 특허받은 수학적 알고리즘과 사용자 친화적 인 기술 인터페이스를 결합하여 인공적인 직관은 실제 의심스러운 활동을 자동으로 정확하게 식별하고 완전한 투명성과 확장 성을 갖춘 쉽게 이해할 수있는 형식으로 분석가에게 제시합니다. 또한 모든 도구와 포렌식 데이터를 단일 인터페이스에 함께 제공하여 식별 된 문제를 조사하고 해결합니다. 효율성을 높이고 위험을 줄입니다.

Q : 어떤 문제가 있습니까?

A: 주요 과제는 실제로 기술 자체가 아니라 기술이 나타내는 패러다임 전환과 더 관련이 있습니다. 이것은 새롭고 다릅니다. 그것은 어떤 사람들에게는 무섭고 다른 사람들에게는 받아들이 기 어려운 변화를 나타냅니다. 또한 사내에서 기술 솔루션을 구축하고 생성하는 것을 선호하는 내부 이해 관계자들에게 위협으로 인식 될 수 있습니다. 이러한 도전은 은행에 위험 할 수 있으며 현재 위기에 대한 최선의 해결책을 찾는 능력을 저해 할 수 있습니다. ㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ ㅇㅇㅇ

다른 문제는이 기술에만 국한된 것은 아니지만 여기서 언급 할만한 가치가 있습니다. 빅 데이터는 여전히 은행에게 큰 문제입니다. 그들은 일관된 데이터 전략을 갖고 빅 데이터 기술을 도입하는 데 더 능숙 해졌지만 여전히 갈 길이 있습니다. 데이터 수집, 데이터 품질 및 ETL 프로세스는 새로운 기술을 신속하게 배포하는 능력을 저해하는 은행에게 여전히 문제입니다.

Q : AI가 "감각"하는 방식은 어떻게 변합니까?

A: 인공 직관을 사용하는 시스템은 규칙 기반 AI 솔루션이 사용하는 기존의 정량적 모델이 아닌 분석중인 데이터에 정 성적 모델을 적용하여 변화를 감지합니다. 거기에서 인공 직관은 데이터 세트를 분석하고 데이터의 전체 구성을 나타내는 문맥 언어를 개발합니다. 개별 데이터 포인트가 아니라 앞에 놓여있는 "큰 그림"을 이해할 수 있습니다.

예를 들어, X, Y 및 Z 데이터 포인트가 자체적으로 완전히 정상으로 보이더라도 인공 직관 기반 모델은 함께 분석 할 때 무언가가 합산되지 않음을 식별합니다. 시스템이이를 표시합니다. 또한 데이터에서 "드리프트"를 자동으로 식별했습니다. 비즈니스 운영 및 시장 상황이 변함에 따라 시스템에 제공되는 데이터도 변경됩니다. 이러한 드리프트를 자동으로 식별함으로써 시스템은 "새로운 표준"에 맞춰 조정할 수 있습니다. 이러한 방식으로 진정으로 의심되는 사례 만 지속적으로 식별하여 은행의 방어를 미래에 대비하고 효과적이고 효율적인 탐지를 제공 할 수 있습니다.

Q : 경고를 줄이고 기본적인 행동 변화에서 위협을 분리 할 수 ​​있습니까?

A:예. 사실, 전염병은 이것의 좋은 예입니다. COVID-19의 결과로 소비자의 뱅킹 습관이 극적으로 변했습니다. 개인 뱅킹은 COVID 이전과 같은 규모로 일어나지 않았고, 현금 지불이 급격히 떨어졌고 (바이러스에 감염 될까봐 아무도 만지고 싶지 않음) 신용 및 직불 카드 사용이 급증했으며 온라인 및 모바일 뱅킹이 폭발적으로 증가했습니다.

소비자 행동의 이러한 매크로 변화는 시스템에 의해 데이터에서 "드리프트"로 자동 식별되며 기술은 전체 데이터 세트에서 "새로운 표준"을 다시 학습합니다. 이러한 매크로 변경 사항을 이해하고이를 고려함으로써 시스템은 계속해서 고품질의 적은 양의 경고를 생성 할 수 있습니다. 은행은 총 경보 수를 30 ~ 40 % 줄였으며 95 %는 "조사 할 가치가있는"것으로 나타 났으며 동시에 경보 당 전체 조사 시간을 최대 50 %까지 줄였습니다. 이를 400-600 배 더 많은 경고와 은행이 현재 시스템에서 경험하고있는 90 % 이상의 오 탐지와 비교해 보면 많은 것을 알 수 있습니다.

Q : 귀사의 기술은 사기를 방지하기 위해 어떻게 작동합니까?

A: ThetaRay 기술은 경고 처리 및보고를 통해 데이터 통합에서 엔드 투 엔드 솔루션을 제공하도록 설계되었습니다. 시장을 선도하는 빅 데이터 기술, 마이크로 서비스, API 기반 아키텍처 및 클라우드 지원 기능이 결합 된이 기술은 온 프레미스 또는 클라우드에 배포 할 수 있습니다. 풀 스택 감지 기능을 통해 시스템은 단일 솔루션에 다양한 감지 기능을 통합 할 수 있습니다. 사용자 인터페이스는 조사 전문가를 위해 조사 전문가가 설계하고 고품질의 효율적인 사용자 경험을 제공합니다.

Q : 제한이 있습니까?

A:핵심 기술은 인간의 두뇌에 기반을두고 있으며 실제로 사용하려는 사람들의 상상력에 의해서만 제한됩니다. 이 기술은 표준 하드웨어 및 빅 데이터 인프라에서 실행되므로 필요에 따라 확장 및 확장 할 수 있습니다. 기존 시스템과 원활하게 통합되도록 설계되었으며 현재 시스템을 즉시 향상 및 보강 할 수 있으며 경보 볼륨과 오탐을 줄여 실제 결과와 효율성을 더 잘 식별하여 효율성을 높일 수 있습니다. 시간이 지남에 따라 시스템은 은행의 기술 생태계에 통합되거나 레거시 시스템의 대체로 전환 될 수 있습니다.

Q : 유행병 이후 금융 기관의 미래는 어떻습니까?

A:대유행은 많은 곡선을 가속화했습니다. 즉, 디지털 뱅킹의 채택, 체크리스 및 현금없는 사회로의 움직임, 소비자가 금융 서비스 제공 업체와 상호 작용하는 방식 및 젊은 세대가 요구하는 뱅킹에 대한 실시간 자기 주도적 접근 방식이 계속해서 근본적인 변화를 가져올 것입니다. 은행 산업.

은행과 같은 서비스를 제공하는 핀 테크는 시장 점유율을 높이고 은행의 혁신을 압박하고 있습니다. 저는 지금이 유행병 이후의 세계에서 적응하고 경쟁하기 위해 고군분투하는 은행들에게 어려운시기라고 생각합니다. 이 변화는 대유행 이전에 진행 중이었지만 그로 인해 극적으로 가속화되었습니다. 앞으로 몇 년 동안 은행들에게는 조금 어려울 것이라고 생각합니다. 이자율이 XNUMX에 가까워지면 (일부 국가에서는 음수 임) 수익 센터 및 수익 모델이 재평가되고 혁신적인 신제품이 개발되고 서비스 및 배송 방법이 생성되며 결국 금융 부문이 등장 할 것입니다. 그 어느 때보 다 더 좋고, 더 강하고, 더 탄력적입니다. 나는이 기간이 성장통과 비슷하다고 생각합니다. 일정 기간 동안 힘들고 고통 스러울 것이지만 최종 결과는 그만한 가치가 있습니다.

Q : 금융 기관이 사기로부터 자신을 보호하기 위해 할 수있는 가장 중요한 일은 무엇입니까?

A: 과거는 잊어라. 대유행 이전에 효과가 있었던 것은 더 이상 효과가 없을 것입니다. 새로운 아이디어, 기술 및 방법을 수용하십시오. 혁신을 두려워하지 마십시오. 새로운 것을 시도하고 "빠르게 실패하십시오." 오래 기다릴수록 더 나빠질 것입니다. 분석과 무 활동으로 인해 마비되지 마십시오. 문제를 새롭게 바라보고 창의적으로 접근하십시오.

포스트 미래의 사기 퇴치 : 은행이해야 할 일 첫 번째 등장 핀 테크 뉴스.

PrimeXBT 결제
AC Milan의 공식 CFD 파트너와 거래
출처 : https://www.fintechnews.org/fighting-fraud-in-the-future-what-banks-need-to-do/

인공 지능

딥 러닝 vs 머신 러닝 : 새로운 분야가 전통적인 컴퓨터 프로그래밍에 미치는 영향

화신

게재

on

두 개의 서로 다른 개념이 크게 얽혀있는 경우 서로 다른 학문적 주제로 구분하기 어려울 수 있습니다. 분리하기 어려운 이유를 설명 할 수 있습니다. 깊은 학습기계 학습 전체적으로. 자동화와 즉각적인 만족 모두에 대한 현재의 추진을 고려할 때이 주제에 많은 초점이 새롭게 집중되었습니다.

자동화 된 제조 작업부터 개인화 된 디지털 의학 잠재적으로 의존 할 수 있습니다. 깊은 학습 과학 기술. 그러나 이러한 산업에 혁명을 일으킬이 기술 분야의 정확한 측면을 정의하는 것은 훨씬 더 어렵습니다. 아마도 컴퓨터 과학의 더 큰 움직임의 맥락에서 딥 러닝을 고려하는 것이 가장 좋습니다.

기계 학습의 하위 집합으로 딥 러닝 정의

기계 학습 그리고 딥 러닝은 본질적으로 같은 동전의 양면입니다. 딥 러닝 기술은 똑같이 다양한 상황에서 올바른 응답을 예측할 수있는 다양한 훈련 된 인공 지능 에이전트를 포함하는 훨씬 더 큰 분야에 속하는 특정 분야입니다. 그러나 딥 러닝을 이러한 다른 모든 기술과 독립적으로 만드는 것은 여러 가상 환경에서 가능한 최상의 작업을 학습함으로써 특정 목표를 달성하기 위해 에이전트를 가르치는 데 거의 전적으로 초점을 맞추고 있다는 사실입니다.

전통적인 기계 학습 알고리즘은 일반적으로 암기 암기를 통해 자극에 반응하는 방법을 인공 노드에 가르칩니다. 이것은 단순한 반복으로 구성된 인간의 교육 기술과 다소 유사하므로 시간표를 암송 할 수있을 때까지 시간표를 뛰어 다니는 학생과 동등한 컴퓨터로 생각할 수 있습니다. 이 방법은 효과적이지만 그러한 방식으로 교육받은 인공 지능 에이전트는 원래 설계 사양의 영역을 벗어난 어떤 자극에도 반응하지 못할 수 있습니다.

이것이 딥 러닝 전문가들이이 방법보다 다소 우월하다고 여겨지는 대체 알고리즘을 개발 한 이유입니다. 딥 러닝 에이전트가 사용하는 서브로 운틴은 생성 적대 네트워크, 컨볼 루션 신경 노드 구조 또는 제한된 볼츠만 머신의 실용적인 형태를 기반으로 할 수 있습니다. 이는 기존의 기계 학습 펌웨어 및 대부분의 최신 파일 시스템에서 사용하는 이진 트리 및 연결 목록과는 뚜렷한 대조를 이룹니다.

자체 구성 맵은 다른 AI 연구 분야에서의 응용 프로그램이 일반적으로 훨씬 덜 유망했지만 딥 러닝에도 널리 사용되었습니다. 정의에 관해서는 딥 러닝 vs 머신 러닝 그러나 토론에서는 기술자들이 향후 몇 달 동안 이론적 학술 토론보다 실용적인 응용 프로그램을 더 많이 찾고있을 가능성이 높습니다. 머신 러닝은 가장 단순한 AI에서 가장 정교한 예측 알고리즘에 이르기까지 모든 것을 포괄하는 반면 딥 러닝은 이러한 기술의보다 선택적 하위 집합을 구성한다고 말하면 충분합니다.

딥 러닝 기술의 실제 응용

특정 프로그램이 작성되는 방식에 따라 딥 러닝 기술은 감독 또는 반 감독 신경망을 따라 배포 될 수 있습니다. 이론적으로도 가능할 것입니다. 완전히 감독되지 않는 노드 레이아웃을 통해 수행, 그리고 가장 유망한 기술이 된 것은 바로이 기술입니다. 비지도 네트워크는 의료 영상 분석에 유용 할 수 있습니다.이 애플리케이션은 종종 알려진 입력에 대해 테스트해야하는 컴퓨터 프로그램에 고유 한 그래픽 정보를 제공하기 때문입니다.

전통적인 이진 트리 또는 블록 체인 기반 학습 시스템 데이터를 효과적으로 제공하도록 설계된 구조에 정보가 숨겨져 있기 때문에 극적으로 다른 시나리오에서 동일한 패턴을 식별하는 데 어려움을 겪었습니다. 본질적으로 스테 가노 그래피의 자연스러운 형태이며 의료 산업에서 컴퓨터 알고리즘을 혼란스럽게했습니다. 그러나이 새로운 유형의 비지도 학습 노드는 컴퓨터가 예상하는 정상적인 라인을 따라 구성되지 않은 데이터 구조에서도 이러한 패턴을 일치시키는 방법에 대해 사실상 스스로 교육 할 수 있습니다.

다른 사람들은 구현을 제안했습니다. 준 감독 인공 지능 마케팅 에이전트 이는 기존 거래 성사 소프트웨어와 관련된 윤리에 대한 우려를 상당 부분 제거 할 수 있습니다. 이 도구는 가능한 한 많은 고객층에 도달하려고하는 대신 주어진 시간에 제품을 필요로하는 개인의 확률을 계산합니다. 이를 위해서는 조직이 대리하는 특정 유형의 정보가 필요하지만 결국 모든 추가 조치를 자체적으로 예측할 수있게됩니다.

일부 회사는 현재 동일한 목표를 달성하기 위해 전통적인 기계 학습 기술을 활용하는 도구에 의존하고 있지만 이러한 도구는 종종 개인 정보 보호 윤리적 문제. 심층 구조화 된 학습 알고리즘의 출현으로 소프트웨어 엔지니어는 이러한 단점이없는 새로운 시스템을 만들 수있게되었습니다.

개인 자동화 학습 환경 개발

기존의 기계 학습 프로그램은 종종 심각하게 실행됩니다. 개인 정보 보호 유용한 결론을 도출하기 위해 엄청난 양의 입력이 필요하기 때문입니다. 딥 러닝 이미지 인식 소프트웨어 입력의 작은 하위 집합을 처리하여 작동하므로 많은 정보가 필요하지 않습니다. . 이것은 걱정하는 사람들에게 특히 중요합니다. 소비자 데이터 유출 가능성.

이러한 많은 문제에 대한 새로운 규제 입장을 고려할 때, 규정 준수 관점에서도 중요한 요소가되었습니다. 독성학 실험실에서 생체 활동 중심의 심층 구조 학습 패키지, 규제 당국은 이러한 종류의 민감한 데이터로 주어진 작업을 수행하는 데 필요한 정보의 양과 관련하여 추가적인 우려를 표명 할 가능성이 높습니다. 컴퓨터 과학자들은 일부 사람들이 대부분이 편한 것보다 더 많은 이야기를 전달하는 바이트의 진정한 소방 호스라고 부르는 것을 축소해야했습니다.

어떤면에서 이러한 발전은 시스템의 각 프로세스가 작업을 완료하는 데 필요한 권한의 양만 가져야한다고 믿었던 초기로 거슬러 올라갑니다. 머신 러닝 엔지니어가이 패러다임을 수용함에 따라, 오늘날의 기존 작업을 지원하는 데 필요한 방대한 양의 데이터 마이닝이 필요하지 않기 때문에 향후 개발이 훨씬 더 안전해질 가능성이 높습니다.

이미지 크레딧 : toptal.io

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처 : https://datafloq.com/read/deep-learning-vs-machine-learning-how-emerging-field-influences-traditional-computer-programming/13652

계속 읽기

인공 지능

엑스트라 크런치 라운드 업 : Deliveroo의 록키 IPO 인 Tonal EC-1, Substack은 정말 $ 650M의 가치가 있습니까?

화신

게재

on

오늘 아침 칼럼, Alex Wilhelm은 지난 몇 달 동안 뜨거운 4 년 2020 분기를 뒤따른 "기술 종료로 바쁜 계절"을 되돌아 보았습니다.

우리는 냉각 될 수있는 IPO 시장의 징후를보고 있지만 그렇다고해도 "최근 Y Combinator 클래스 전체를 공개하기에 충분한 SPAC가 있습니다."라고 그는 말합니다.

돈이 가득한 사모 펀드를 고려해 보면, 후반기 기업이 레벨 업을위한 세 가지 확실한 선택을 할 수 있다는 것이 분명합니다.

이러한 유동성 옵션에 대한 더 많은 통찰력을 얻기 위해 Alex는 다음과 같이 인터뷰했습니다.

  • 회사가 IPO를 통해 상장 된 DigitalOcean CEO Yancey Spruill;
  • CFO Garth Mitchell은 자신의 스타트 업과 부동산 SPAC $ TSIA의 합병에 대해 논의했습니다.
  • 최근 사모 펀드에 매각 한 AlertMedia의 설립자이자 CEO 인 Brian Cruver.

거래를 요약 한 후 각 경영진은 회사가 어떤 빨간색 "EXIT"기호를 따라야할지 결정한 방법을 설명합니다. Alex가 말했듯이 "뷔페의 가능성 중에서 가장 좋은 옵션을 선택하는 것은 흥미로운 작업입니다."

Extra Crunch를 읽어 주셔서 감사합니다! 좋은 주말 보내세요.

월터 톰슨
TechCrunch 수석 편집자
안녕하세요.


전체 엑스트라 크런치 기사는 회원에게만 제공됩니다.
할인 코드 사용 ECFriday 20 년 또는 XNUMX 년 구독 XNUMX % 할인


톤 EC-1

이미지 크레딧 : 나이젤 서스 만

화요일에 우리는 200 년에 시작된 이래 2018 억 달러를 모금 한 홈 피트니스 스타트 업 Tonal에 대한 2,995 부작 시리즈를 발표했습니다.이 회사의 특허 하드웨어는 XNUMX 달러에 판매되는 벽걸이 형 시스템에 디지털 웨이트, 코칭 및 AI를 결합했습니다.

어떤 측면에서든 성공할 준비가되어 있습니다. 매출 800 % 증가 2019 년 2020 월부터 60 년까지 그리고 올해 말까지 XNUMX 개의 소매점을 갖게 될 것입니다. 수요일에, Tonal은 250 억 XNUMX 천만 달러 시리즈 E를보고했습니다. 그 회사의 가치는 1.6 억 달러였습니다.

우리의 심층 분석은 Tonal의 기원, 제품 개발 일정, 시장 진출 전략 및 투자자의 관심과 고객 만족을 자극하기 위해 결합 된 기타 측면을 검토합니다.

이 형식을 "EC-1,”이러한 이야기는 S-1 폼 스타트 업이 공개되기 전에 SEC에 제출해야하는 것처럼 포괄적이고 조명이 밝기 때문입니다.

Tonal EC-1이 분해되는 방법은 다음과 같습니다.

우리는 큰 일을 잘하고 그 과정에서 뉴스를 만드는 다른 후기 단계의 스타트 업에 대한 작업에 더 많은 EC-1을 보유하고 있습니다.

Deliveroo의 거친 IPO 데뷔를 어떻게 만들까요?

Deliveroo가 거래를 시작했을 때 왜 어려움을 겪었습니까? 고성장 모델과 보수적 인 유럽 투자자 간의 문화적 불협화음으로 고통 받고 있습니까?

숫자를 들여다보고 알아 봅시다.

Kaltura는 데뷔를 보류합니다. 기술 IPO 창이 닫히나요?

Exchange는 많은 사람들이 IPO 기후가 예고없이 너무 추울 것이라고 예상했다고 의심합니다. 그러나 우리는 기술 데뷔를위한 이전의 혹독한 기후 속에서 2 분기에 잠시 멈출 수 있습니다.

Substack은 정말 $ 650M의 가치가 있습니까?

65 년 기준에도 불구하고 2021 만 달러 규모의 시리즈 B는 놀랍습니다. 그러나 a16z가 대체 미디어 공간에 더 많은 자본을 쏟아 붓고 있다는 사실은 놀라운 일이 아닙니다.

Substack은 출판물이 잘 알려진 재능을 피하여 미디어의 무게 중심을 바꾸는 곳입니다. Substack의 역사적 성장을 살펴 보겠습니다.

RPA 시장은 투자자, 공급 업체가 유행에 따른 기술 변화를 활용함에 따라 급증합니다.

비즈니스 프로세스 구성 및 분석. 비즈니스 프로세스 시각화 및 표현, 자동화 된 워크 플로 시스템 개념. 벡터 개념 창조적 인 그림

이미지 크레딧 : 비주얼 생성 / 게티 이미지

로봇 프로세스 자동화는 기업이 디지털 혁신을위한 조치를 취함에 따라 대유행 기간 동안 전면에 나타났습니다. 직원들이 같은 사무실에 함께있을 수 없을 때, 더 적은 수의 사람들을 필요로하는 자동화 된 워크 플로우를 함께 결합하는 것이 중요해졌습니다.

RPA를 통해 경영진은 모든 산업 워크 플로의 일부인 일상적인 수동 작업을 많이 줄이면서보다 현대적인 접근 방식으로 시스템을 업데이트하는 데 시간을 벌 수있는 수준의 자동화를 제공 할 수 있습니다.

전자 상거래 롤업은 소비재의 차세대 혁신 물결입니다.

파란색 배경에 많은 화장실 롤의 상승 된보기

이미지 크레딧 : Javier Zayas 사진 (새 창에서 열림) / 게티 이미지

올해는 롤업, 소규모 회사를 대기업으로 통합하여 주식 가치에 대한 잠재적 인 매력적인 경로를 만드는 것입니다. 전자 상거래 브랜드를 통한 가치 창출에 대한 관심은 특히 두드러집니다.

불과 XNUMX 년 전만해도 많은 사람들이 벤처 규모의 수익을 창출하지 못한 후 디지털 네이티브 브랜드가 벤처 자본가들에게 선호되지 않았습니다. 그렇다면 롤업 과대 광고는 무엇입니까?

Hack take : CISO와 해커가 Exchange 침해에 대응하는 방법을 자세히 설명합니다.

데이터 유출, 기밀 데이터 도용, 사이버 공격의 3d 평면 아이소 메트릭 벡터 개념.

이미지 크레딧 : TarikVision (새 창에서 열림) / 게티 이미지

사이버 세계는 공격이 그 어느 때보 다 더 자주 발생하고 대규모로 발생하는 새로운 시대에 접어 들었습니다. 수천 개의 고위 미국 기업과 기관에 영향을 미치는 대규모 해킹이 최근 뉴스를 지배했습니다. 이 중 가장 중요한 것은 XNUMX 월 SolarWinds / FireEye 침해와 최근의 Microsoft Exchange 서버 침해입니다.

모두가 알고 싶어합니다. Exchange 보안 침해를 당했다면 어떻게해야합니까?

비 기술적 리더가 이해해야하는 5 가지 기계 학습 필수 요소

흰색 배경 위에 직선으로 풀리는 여러 가지 빛깔 전선의 뒤죽박죽. 남아프리카 공화국 케이프 타운. 2019 년 XNUMX 월.

이미지 크레딧 : 데이비드 말란 (새 창에서 열림) / 게티 이미지

머신 러닝은이 분야의 놀라운 변화와 개발 속도로 인해 비즈니스 및 성장 가속화의 기초가되었습니다.

그러나 ML 배경이없는 엔지니어링 및 팀 리더의 경우 이는 압도적이고 위협적 일 수 있습니다.

다음은 XNUMX 개의 실용적이고 쉽게 적용 할 수있는 강의로 분류 된 모범 사례와 반드시 알아야 할 구성 요소입니다.

임베디드 조달은 모든 회사를 자체 시장으로 만들 것입니다.

경제인 데이터 및 경제 성장 그래프 차트를 분석하는 휴대 전화를 사용합니다. 기술 디지털 마케팅 및 네트워크 연결.

이미지 크레딧 : Busakorn Pongparnit / 게티 이미지

임베디드 조달은 임베디드 핀 테크의 자연스러운 진화입니다.

이 다음 물결에서 기업은 영업 담당자, 유통 업체 또는 개별 판매자의 웹 사이트를 통하지 않고 수직 B2B 앱을 통해 필요한 것을 구매할 것입니다.

스타트 업이 비즈니스 개발에 올인해야하는시기 파악

비즈니스 또는 금융 성장 차트 캔버스에서 분리 된 화살표 머리가있는 빨간색 선 하나.

이미지 크레딧 : twomeows / 게티 이미지

스타트 업 성장의 고통이나 확장 문제는 비즈니스 개발을 통해 해결할 수 있다는 오류가 지속적으로 발생합니다.

그것은 사실이 아닙니다.

Dear Sophie : 결혼을 통해 prenups 및 영주권 취득에 대해 무엇을 알아야합니까?

중앙에 미국 국기가있는 미로 울타리 입구의 고독한 인물

이미지 크레딧 : 브라이스 더빈 / TechCrunch

친애하는 소피 :

저는 E-2 투자자 비자로 스타트 업의 창립자이고 방금 약혼했습니다! 곧 나의 배우자가 영주권을 위해 나를 후원 할 것입니다.

그녀가 나를 후원하기위한 최소 급여 요건이 있습니까? 영주권 절차를 시작하기 전에 염두에 두어야 할 사항이 있습니까?

— 벨몬트에서 약혼

스타트 업은 민첩한 데이터 거버넌스를 보장하기 위해 관료주의를 억제해야합니다.

컴퓨터, 전화 및 책상에 시계의 이미지는 빨간 테이프에 묶여있다.

이미지 크레딧 : RichVintage / 게티 이미지

많은 조직은 데이터 관리를 데이터 거버넌스와 유사하다고 인식합니다. 여기서 책임은 통제 및 감사 절차를 수립하는 데 집중되고 상황은 방어적인 관점에서 볼 수 있습니다.

특히 데이터 관리 오류 및 유출로 인한 잠재적 인 재정적 및 평판 적 손해를 감안할 때 이러한 방어는 정당화됩니다.

그럼에도 불구하고 여기에는 근시의 요소가 있으며, 지나치게 조심하면 조직이 특히 소프트웨어 및 제품 개발과 관련하여 데이터 기반 공동 작업의 이점을 실현하지 못할 수 있습니다.

CISO를 최고 경영진으로 끌어 들여 사이버 보안을 기업 문화에 적용

혼합 된 인종 사업가 태블릿 컴퓨터를 사용하여 서버 룸

이미지 크레딧 : 제타 프로덕션 Inc (새 창에서 열림) / 게티 이미지

사이버 전략과 기업 전략은 뗄래야 뗄 수없는 관계입니다. 결과적으로 C-Suite의 최고 정보 보안 책임자는 주주 가치를 극대화하는 데 CFO만큼이나 일반적이고 영향력이 있습니다.

edtech는 추가 자본을 어떻게 지출합니까?

머니 트리 : 성인 손이 잎이없는 나무에서 자라는 달러 지폐에 도달

이미지 크레딧 : 테트라 이미지 (새 창에서 열림) / 게티 이미지

에드 텍 유니콘은 2020 년에이 부문에 대한 자본 증가에 따라 사용할 수있는 많은 현금을 보유하고 있습니다. 그 결과 edtech M & A 활동이 계속 증가하고 있습니다.

핵심 사업을 보완하기 위해 경쟁사를 구매하는 자본이 풍부한 스타트 업 아이디어는 새로운 것이 아니지만, 스타트 업을 구입하는 데 사용되는 돈이 원격 교육에 대한 전염병의 영향으로 볼 수 있기 때문에이 부문의 출구는 주목할 만합니다.

그러나 지난주 통합 환경은 분명한 진술을했습니다. 전염병이 입증 된 신생 기업이 인재를 빠르게 확보하고 있습니다.

멕시코의 기술 : 라틴 아메리카, 미국 및 아시아의 합류점

라인으로 연결된 군중의 항공보기

이미지 크레딧 : 오르 본 알리자 (새 창에서 열림)/ 게티 이미지

지식 이전은 미국-아시아-중남미 넥서스에서 흐르는 유일한 추세가 아닙니다. 경쟁도 진행 중입니다.

유사한 시장 상황으로 인해 아시아의 거대 기술 기업들은 멕시코 및 기타 LatAm 국가로 직접 확장하고 있습니다.

30 분기 동안 순 유지율을 2 포인트 이상 향상시킨 방법

점퍼 케이블에 연결된 미국 달러 지폐에서 나오는 불꽃

이미지 크레딧 : 스티븐 푸에 처 (새 창에서 열림) / 게티 이미지

리더들이 집중하는 SaaS 성능 지표는 확실히 부족하지 않지만 NRR (순 수익 유지)은 의심 할 여지없이 가장 과소 평가 된 지표입니다.

NRR은 단순히 총 수익에서 수익 이탈과 업그레이드, 교차 판매 또는 상향 판매로 인한 수익 확장을 뺀 값입니다. NRR이 클수록 회사는 더 빨리 확장 할 수 있습니다.

제작자가 Roblox에서 새로운 게임을 만드는 5 가지 실수

브라질-2021/03/24 :이 사진 삽화에서 스마트 폰에 표시된 Roblox 로고. (사진 일러스트 : Rafael Henrique / SOPA Images / LightRocket via Getty Images)

이미지 크레딧 : SOPA 이미지 (새 창에서 열림) / 게티 이미지

모바일 F2P 비즈니스에서 가장 경험이 많고 재능있는 게임 디자이너조차도 Robloxians에게 중요한 기능이 무엇인지 이해하지 못합니다.

Roblox 게임 개발의 여정을 막 시작한 사람들에게 이것은 게임 전문가가 Roblox에서하는 가장 일반적인 실수입니다.

CEO Manish Chandra, 투자자 Navin Chaddha가 Poshmark의 Series A 데크가 노래하는 이유를 설명합니다.

CEO Manish Chandra, 투자자 Navin Chaddha가 Poshmark의 Series A 데크가 이미지를 노래하는 이유를 설명합니다.

"사랑으로 인도하면 돈이옵니다." Poshmark의 초석 가치 중 하나입니다. Extra Crunch Live의 최신 에피소드에서 Chandra와 Chaddha는 우리와 함께 앉아 오리지널 Series A 피치 데크를 안내했습니다.

대유행이 도시의 현명한 재 탄생에 박차를가할까요?

새로운 대 오래된 건물-현대적인 새로운 외관의 창에 반영된 오래된 벽돌 건물

이미지 크레딧 : Hopsalka (새 창에서 열림) / 게티 이미지

도시는 사람들이 살고, 일하고, 즐기는 번화 한 허브입니다. 전염병이 닥쳤을 때 일부 사람들은 소규모 도시를 위해 주요 대도시 시장을 떠나 도시의 미래 타당성에 대한 질문을 제기했습니다.

그러나 COVID-19가 주요 도시 공동체를 파괴 할 것이라고 예측 한 사람들은 이러한 지방 자치 단체의 회복력을 단축하는 것을 멈추고 유행병 이후의 미래가 어떻게 보이는지 오래 지속하기를 원할 것입니다.

NFT 열풍은 변호사에게 혜택이 될 것입니다

복사 공간 밝은 파란색 배경에 옆에 누워 망치와 들리는 블록에 서 핑크 돼지 저금통의 3d 렌더링. 돈 문제. 돈에 대한 소송. 경매 입찰.

이미지 크레딧 : Gearstd (새 창에서 열림) / 게티 이미지

저작권 문제, 사기 및 성인용 콘텐츠를 둘러싼 많은 불확실성이 있으며 법적 영향이 NFT 추세의 핵심입니다.

법원이 주어진 파일에 대한 영수증 소유자의 소유권을 보호할지 여부는 다양한 요인에 따라 다릅니다. 이러한 모든 우려는 아티스트가 변호사를 선임해야한다는 것을 의미합니다.

Carvana의 앞 유리를 통해 Cazoo의 제안 된 SPAC 데뷔보기

그것은 합리적인 질문입니다. Carvana가 더 수익성이 있고 그게 뭐가 아니라면 왜 오늘날 누가 Cazoo에 그렇게 많은 돈을 지불하겠습니까? 글쎄, 성장. 어쨌든 그것은 논쟁입니다.

코인 스마트. 유로파 최고의 비트 코인-보르 스
Source: https://techcrunch.com/2021/04/02/extra-crunch-roundup-tonal-ec-1-deliveroos-rocky-ipo-is-substack-really-worth-650m/

계속 읽기

AI

건강 관리를 재편하는 AI 트렌드

화신

게재

on

저자에 대해 자세히 알아 보려면 클릭하십시오. 벤 로리 카.

의료 분야에서 AI를 적용하면 다른 산업과 크게 다른 여러 가지 과제와 고려 사항이 있습니다. 그럼에도 불구하고 최첨단 기술을 활용하여 치료를 개선하는 AI를 작동시키는 데있어 리더 중 하나이기도합니다. 수치는 스스로를 말해줍니다 : 의료 시장 규모의 글로벌 AI는 4.9 년 2020 억 달러에서 XNUMX 년까지 성장할 것으로 예상됩니다. 45.2에 의해 $ 2026 억. 이러한 성장을 이끄는 몇 가지 주요 요인은 엄청난 양의 의료 데이터와 증가하는 데이터 세트의 복잡성, 증가하는 의료 비용을 줄여야 할 필요성, 변화하는 환자 요구 사항입니다.

깊은 학습예를 들어, 지난 몇 년 동안 임상 환경에 상당한 진출을했습니다. 특히 컴퓨터 비전은 검사 및 진단을 지원하는 의료 영상에서 그 가치가 입증되었습니다. 자연어 처리 (NLP) 텍스트 마이닝 및 데이터 공유를 통해 계약 및 규제 문제를 모두 해결하는 데 상당한 가치를 제공했습니다. COVID-19 이후 백신 및 약물 개발과 같은 이니셔티브를 촉진하기 위해 제약 및 생명 공학 회사가 AI 기술을 채택하는 것이 증가하는 것은 AI의 엄청난 잠재력을 예시 할뿐입니다.

우리는 이미 의료 AI에서 놀라운 진전을보고 있지만 아직 초기 단계이며 그 가치를 진정으로 발휘하기 위해 업계를 형성하는 과제, 도구 및 의도 된 사용자를 이해하기 위해 수행해야 할 많은 작업이 있습니다. 의 새로운 연구 John Snow Labs 및 Gradient Flow, 의료 조사 보고서의 2021 AI, 우리가 어디에 있고, 어디로 가고, 어떻게 거기에 도착하는지에 대해 조명합니다. 글로벌 설문 조사에서는 오늘날 의료 분야에서 AI의 상태를 광범위하게 살펴볼 수 있도록 다양한 단계의 AI 채택, 지역 및 기술 역량에있는 의료 기관에 대한 중요한 고려 사항을 조사합니다.               

가장 중요한 발견 중 하나는 AI 구현과 관련하여 어떤 기술이 가장 중요하다는 것입니다. 2021 년 말까지 어떤 기술을 도입 할 계획인지 묻는 질문에 거의 절반의 응답자가 데이터 통합. 약 XNUMX/XNUMX이 현재 사용 중이거나 연말까지 사용할 계획 인 기술 중 자연어 처리 (NLP) 및 비즈니스 인텔리전스 (BI)를 인용했습니다. 기술 리더로 간주되는 이들 중 절반은 데이터 통합, NLP, 비즈니스 인텔리전스 및 데이터웨어 하우징에 기술을 사용하고 있거나 곧 사용할 것입니다. 이러한 도구가 방대한 양의 데이터를 이해하는 데 도움이되는 힘을 가지고 있으며 규제 및 책임감있는 AI 관행을 염두에두고 있다는 점을 고려하면 이는 의미가 있습니다.

AI 도구 및 기술의 대상 사용자에 대해 질문했을 때 응답자의 절반 이상이 대상 사용자 중에서 임상의를 식별했습니다. 이는 과거와 마찬가지로 기술자와 데이터 과학자뿐만 아니라 의료 서비스를 제공해야하는 사람들이 AI를 사용하고 있음을 나타냅니다. 이 숫자는 성숙한 조직이나 60 년 이상 생산에 AI 모델을 보유한 조직을 평가할 때 훨씬 더 높아집니다. 흥미롭게도 성숙한 조직의 응답자의 거의 XNUMX %는 환자가 AI 기술의 사용자이기도한다고 답했습니다. 챗봇과 원격 의료의 출현으로 향후 몇 년 동안 AI가 환자와 제공자 모두에게 어떻게 확산되는지 보는 것은 흥미로울 것입니다.

AI 솔루션 구축을위한 소프트웨어를 고려할 때 오픈 소스 소프트웨어 (53 %)가 퍼블릭 클라우드 제공 업체 (42 %)보다 약간 우위를 점했습니다. XNUMX ~ XNUMX 년을 내다 보면서 응답자들은 상용 소프트웨어와 상용 SaaS를 모두 사용할 수있는 개방성을 나타 냈습니다. 오픈 소스 소프트웨어는 클라우드 제공 업체가 할 수없는 데이터에 대한 자율성을 사용자에게 제공하므로 의료 서비스와 같이 규제가 엄격한 산업이 데이터 공유를 경계하는 것은 그리 놀라운 일이 아닙니다. 마찬가지로, AI 모델을 프로덕션에 배포 한 경험이있는 대부분의 회사는 타사 또는 소프트웨어 공급 업체의 평가가 아닌 자체 데이터 및 모니터링 도구를 사용하여 모델을 검증하기로 선택합니다. 초기 단계의 회사는 타사 파트너를 탐색하는 데 더 수용 적이지만 성숙한 조직은보다 보수적 인 접근 방식을 취하는 경향이 있습니다.                      

일반적으로 AI 솔루션, 소프트웨어 라이브러리 또는 SaaS 솔루션을 평가하는 데 사용되는 주요 기준 및 협력 할 컨설팅 회사에 대한 질문에 대한 태도는 동일하게 유지되었습니다. 기업, 자체 모델 교육 능력, 최첨단 정확성을 최우선 과제로 삼습니다. 솔루션 및 잠재적 파트너에 대한 질문에서 의료 데이터 엔지니어링, 통합 및 컴플라이언스 분야의 의료 관련 모델과 전문 지식이 XNUMX 위를 차지했습니다. 개인 정보 보호, 정확성 및 의료 경험은 AI 채택을 이끄는 원동력입니다. 데이터가 계속 증가하고 기술 및 보안 조치가 개선됨에 따라 AI가 더욱 성장할 준비가 된 것은 분명합니다. 빠른 채택에 뒤처져있는 의료 서비스가 AI로 옮겨 가고 있으며 이미 상당한 영향을 받고 있습니다. 접근 방식, 최고의 도구 및 기술, AI의 응용 프로그램은 다른 산업과 다를 수 있지만 내년 설문 조사 결과를 위해 무엇이 준비되어 있는지 보는 것은 흥미로울 것입니다.

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처 : https://www.dataversity.net/the-ai-trends-reshaping-health-care/

계속 읽기

AI

우리가 라벨링에 동의 할 수 없기 때문에 인간이 AI 시스템을 잘못 이끌고 있음이 밝혀졌습니다.

화신

게재

on

AI 모델을 훈련하고 시간이 지남에 따라 기술이 어떻게 발전했는지 벤치마킹하는 데 사용되는 상위 데이터 세트는 라벨링 오류로 가득 차 있습니다.

데이터는 다양한 식물 종을 식별하거나 자동으로 캡션을 생성하는 등 특정 작업을 완료하는 방법을 기계에 가르치는 데 중요한 리소스입니다. 대부분의 신경망은 데이터의 일반적인 패턴을 학습하기 전에 숟가락으로 많은 양의 주석이 달린 샘플입니다.

그러나 이러한 레이블이 항상 올바른 것은 아닙니다. 오류가 발생하기 쉬운 데이터 세트를 사용하여 기계를 훈련하면 성능이나 정확도가 저하 될 수 있습니다. 에서 앞서 언급 한 연구MIT가 이끄는 분석가들은 학술 논문에서 100,000 회 이상 인용 된 3.4 개의 인기있는 데이터 세트를 샅샅이 뒤져 평균 XNUMX %의 샘플이 잘못 표시되어 있다는 것을 발견했습니다.

그들이 살펴본 데이터 세트는 ImageNet의 사진, AudioSet의 사운드, Amazon에서 스크랩 한 리뷰, QuickDraw의 스케치에 이르기까지 다양합니다. 실수의 예 컴파일 연구자들에 의해 어떤 경우에는 악어 태그가 붙은 전구 그림과 같은 명백한 실수이지만 다른 경우에는 이것이 항상 분명하지는 않습니다. 야구 양동이 사진은 '야구'또는 '양동이'로 표시되어야합니까?

충격적인 내용 공개

전 세계 AI 교육에 사용 된 1TB ImageNet 데이터 세트 : 알몸의 아이들, 술취한 친구 파티, 포르노 스타 등

자세히 보기

각 샘플에 주석을다는 것은 힘든 작업입니다. 이 작업은 작업을 Amazon Mechanical Turk와 같은 서비스에 아웃소싱하는 경우가 많습니다. 여기서 작업자는 잔디의 제곱근을 지불하여 데이터를 하나씩 살펴보고 이미지와 오디오에 라벨을 지정하여 AI 시스템에 공급합니다. 이 프로세스는 Vice가 문서화 한 것처럼 편견과 오류를 증폭시킵니다. 여기를 클릭해 주세요.

노동자들은 보수를 받고 싶다면 현상 유지에 동의해야한다는 압력을받습니다. 많은 사람들이 야구 양동이를 '양동이'로 분류하고 당신이 그것이 '야구'라고 결정한다면, 플랫폼이라면 전혀 보수를받지 못할 수 있습니다 당신이 틀렸거나 고의적으로 라벨링을 엉망으로 만들려고한다고 생각합니다. 즉, 작업자는 실수 한 것처럼 보이지 않도록 가장 인기있는 레이블을 선택합니다. 내러티브를 고수하고 아픈 엄지 손가락처럼 튀어 나오지 않는 것이 그들의 관심사입니다. 이는 오류 또는 더 나쁜 인종적 편견과 같은 데이터 세트의 눈덩이를 의미합니다.

오류율은 데이터 세트에 따라 다릅니다. 에 IMAGEnet, 객체 인식을 위해 모델을 훈련하는 데 사용되는 가장 인기있는 데이터 세트 인 경우 속도는 XNUMX %. 약 15 만 장의 사진이 포함되어 있다는 점을 감안하면 수십만 개의 레이블이 잘못되었음을 의미합니다. 예를 들어 '카멜레온'은 종종 '녹색 도마뱀'으로 오인되고 그 반대의 경우도 마찬가지입니다.

다른 노크 온 효과가 있습니다. 신경망은 데이터 내의 특징을 특정 레이블과 잘못 연관시키는 방법을 배울 수 있습니다. 예를 들어, 많은 바다 이미지에 보트가 포함되어 있고 계속 '바다'라는 태그가 붙으면 기계가 혼란스러워지고 보트를 바다로 잘못 인식 할 가능성이 더 높습니다.

이러한 시끄러운 데이터 세트를 사용하여 모델의 성능을 비교하려고 할 때 문제가 발생하는 것은 아닙니다. 이러한 시스템을 실제 세계에 배포하면 위험이 더 높아집니다. Curtis Northcutt는 스터드의 공동 수석 저자이자 MIT의 박사 과정 학생이며 기계 학습 하드웨어 스타트 업인 ChipBrain의 공동 창립자이자 CTO입니다. 등록.

"AI 모델을 사용하여 교차로에서 운전 결정을 내리는 자율 주행 자동차를 상상해보십시오."라고 그는 말했습니다. “자율 주행 자동차가 XNUMX 방향 교차로를 XNUMX 방향 교차로로 잘못 표시하는 라벨 오류가 빈번한 데이터 세트에서 훈련되면 어떻게 될까요? 답 : 삼 방향 교차로를 만나면 도로에서 운전하는 법을 배울 수 있습니다.

자율 주행 자동차가 XNUMX 방향 교차로를 XNUMX 방향 교차로로 잘못 표시하는 라벨 오류가 빈번한 데이터 세트에서 훈련되면 어떻게 될까요?

“아마도 AI 자율 주행 모델 중 하나는 실제로 훈련 소음에 더 강력하여 도로에서 많이 운전하지 않습니다. 테스트 세트 레이블이 현실과 일치하지 않기 때문에 테스트 세트가 너무 시끄러 우면 이것을 알 수 없습니다. 즉, 어떤 자동 조종 AI 모델이 가장 잘 움직이는 지 제대로 측정 할 수 없습니다. 최소한 도로에서 운전할 수있는 실제 세계에 자동차를 배치 할 때까지는 말입니다. "

연구팀이 오류가 제거 된 ImageNet 부분에서 일부 컨볼 루션 신경망을 훈련했을 때 성능이 향상되었습니다. boffins는 개발자가 오류율이 높은 데이터 세트에 대한 대규모 모델 학습에 대해 두 번 생각하고 먼저 샘플을 정렬하도록 조언해야한다고 생각합니다. 팀이 개발하고 부정확하고 일관성이없는 라벨을 식별하는 데 사용한 소프트웨어 인 Cleanlab을 찾을 수 있습니다. GitHub의.

Northcutt는“Cleanlab은 시끄러운 레이블이있는 기계 학습을위한 오픈 소스 Python 패키지입니다. “Cleanlab은 MIT에서 발명 한 자신감 학습이라는 기계 학습의 하위 분야에서 모든 이론과 알고리즘을 구현하여 작동합니다. 저는 다른 연구자들이 (보통 몇 줄의 코드만으로) 자신감있는 학습을 사용할 수 있도록 클린 랩을 만들었지 만 더 중요한 것은 시끄러운 라벨을 사용하여 기계 학습의 과학 발전을 발전시키고 새로운 연구자들이 쉽게 시작할 수있는 프레임 워크를 제공하는 것입니다. ”

데이터 세트의 레이블이 특히 조잡한 경우 복잡한 대규모 신경망을 훈련하는 것이 항상 그렇게 유리한 것은 아닙니다. 큰 모델은 작은 모델보다 데이터에 과적 합되는 경향이 있습니다.

“때때로 더 작은 모델을 사용하면 매우 시끄러운 데이터 세트에 적합합니다. 그러나 매우 시끄러운 데이터 세트에 대해 항상 더 작은 모델을 사용하도록 기본 설정하는 대신 기계 학습 엔지니어가 모델을 벤치마킹하기 전에 테스트 세트를 정리하고 수정해야한다고 생각합니다.”라고 Northcutt는 결론지었습니다. ®

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처 : https://go.theregister.com/feed/www.theregister.com/2021/04/01/mit_ai_accuracy/

계속 읽기
에스 포트1 시간 전

Rogue Energy x Esports Talk 공짜를 놓치지 마세요!

Fintech2 시간 전

Praemium FUA 가동, 에든버러 사무소 개설

Fintech3 시간 전

Mambu 연구에 따르면 글로벌 소비자는 오픈 뱅킹 사용을 주저하고 있습니다.

에스 포트3 시간 전

MSI 2021, 패치 11.9에서 플레이 예정

에스 포트4 시간 전

콜 오브 듀티 모바일 시즌 3 도쿄 이스케이프 : 오아시스, 해안

에스 포트5 시간 전

RLCS X 챔피언십, 지역 주간 이벤트

에스 포트5 시간 전

Unknown 9Z Team, BLAST Premier Showdown에서 활력 제거

에스 포트6 시간 전

2021 콜 오브 듀티 모바일 월드 챔피언십 발표

에스 포트6 시간 전

Valorant Patch 2.08과 함께 도입 될 코칭 슬롯

에스 포트6 시간 전

Abby Trott, 리그 오브 레전드의 그웬에 생명을 불어 넣다

에스 포트6 시간 전

Valve는 CS : GO esports에서 VAC 차단에 대한 RMR 규칙을 업데이트합니다.

에스 포트6 시간 전

2021 년 오버 워치 리그 시즌을 앞둔 팀보고

에스 포트7 시간 전

위치 5 Faceless Void는 패치 2 이후 북미 Dota 7.29 펍에서 파도를 일으키고 있습니다.

에스 포트7 시간 전

시즌 100가 다가 오면서 Apex 레전드가 9 억 명의 플레이어를 돌파했습니다.

에스 포트7 시간 전

용감한 사기꾼 Solista, 라이브 스트림에서 금지됨

에스 포트7 시간 전

오버 워치 리그 프리 시즌 파워 랭킹

에스 포트7 시간 전

CSGO : Valve, 새로운 RMR 적격성 지침 발표

에스 포트7 시간 전

PlayVS, PlayVS 컵 고등학교 대회 발표

에스 포트7 시간 전

CoD : Warzone 시즌 2에서 좀비로 플레이하는 방법

에스 포트7 시간 전

xQc는 Twitch가 봇을 단속하면서 팔로워 2 백만 명을 잃었습니다.

에스 포트7 시간 전

패치 11.8은 Rammus의 이동 속도를 너무 많이 업데이트합니다.

에스 포트7 시간 전

Tribe Gaming, G FUEL과의 파트너십 갱신

에스 포트8 시간 전

Toronto Ultra의 거친 Call of Duty League 패자 대진표 경기 속

에스 포트8 시간 전

Call of Duty : Warzone에서 Sykov 권총을 잠금 해제하는 방법

에스 포트8 시간 전

TikTok 할머니는 아픈 Warzone Hardscopes를 위해 폭발합니다.

블록체인8 시간 전

비트 코인 및 이더 리움 분석 : NUPL-Werte 신호 분석 사이트 Kurssteigerungen

에스 포트8 시간 전

CBCS, Valve Close, CS : GO 팀의 전공 진출 경로를 엽니 다

에스 포트8 시간 전

Fortnite 시즌 6 : 에픽 문제 무기 및 제작 재료의 갑작스러운 밸런스 변경

에스 포트8 시간 전

Sumail의 부재; 갭 이어 또는 은총에서 떨어 졌습니까?

에스 포트8 시간 전

Timthetatman이 DrDisrespect Off Twitch와 함께 플레이 할 수 있습니까? 아마!

인기순