제퍼넷 로고

기계 학습 혁신: 데이터 품질 및 운영상의 필요성

시간

기계 학습

기계 학습 엇갈린 반응을 이끌어냅니다. 한편으로 어떤 사람들은 기계 학습이 회사의 새로운 슈퍼 파워라고 생각합니다.휩쓸린 엔터프라이즈 기술, 대량의 데이터와 알고리즘을 사용하여 예측합니다.” 동시에 기계 학습은 하나의 기술로 간주되었습니다. 과장된 유행과 만병통치약, 전달하지 못했습니다. 둘 다 사실일 수 있지만 기업은 비즈니스를 자동화하기 위해 기계 학습을 고려해야 합니다.

IDC는 "19.1년 전 세계적으로 인지 및 인공 지능(AI) 시스템에 대한 지출이 2020억 달러에 이를 것으로 예상하며, 이는 54.2년 지출 금액보다 2017% 증가한 것입니다." 또한 "2021년까지 디지털 혁신 이니셔티브의 40% 이상이 AI 서비스를 사용할 것입니다." 국가에서도 인공 지능(AI)과 머신 러닝 기능을 강화할 계획입니다. 호주는 "$ 29.9 만 기술을 활용하는 프로젝트를 위해 XNUMX년 동안 자금을 지원합니다.” 과장된 기계 학습 기술을 무시하면 혁신과 비즈니스를 잃는 등 엄청난 대가를 치러야 합니다.

그렇다면 기업에서 기계 학습을 효과적으로 사용하려면 어떻게 해야 할까요? 할리우드는 몇 가지 초기 통찰력을 제공합니다. 전쟁 게임, 1983년 개봉. 영화에서 Stephen Falken 교수는 기계 학습 AI인 Joshua를 만들어 미 공군이 군사 전략을 개선하도록 돕습니다. 십대가 Global Thermal Nuclear War 게임을 플레이하기 위해 시스템을 해킹했지만 게임이 실제 핵전쟁을 시작할 것이라는 사실을 알게되면서 줄거리가 두꺼워집니다. 전쟁 게임 성공 및 실패한 기계 학습 사용 사례를 평가하기 위한 프레임워크를 제공합니다.

  • 기계 학습으로 작게 시작하십시오(공군은 조슈아가 핵 미사일을 제어하고 핵전쟁에서 승리하도록 하기 위해 앞서 나갔습니다)
  • 컴퓨터에는 품질이 필요합니다 데이터 세트 (Joshua의 초기 데이터 세트에는 컴퓨터가 학습하는 데 도움이 되는 구멍이 있었습니다. Falken 교수가 Joshua에게 tic-tac-toe 게임을 소개하면 AI는 핵전쟁의 무익함을 보고 카운트다운을 중지할 수 있습니다.)
  • 마지막으로 기계 학습 프로그램은 상황에 적합해야 합니다. (Joshua는 미사일 발사에 대한 의사 결정 능력이 없었고 운 좋게도 핵전쟁은 승산이 없기 때문에 발사하지 않는 법을 배울 수 있었습니다.)

기계로 작게 시작
러닝

Seth Deland는 의사 결정자 기계 학습 기술에 대한 기술적 이해가 있어야 합니다. 현재 기계 학습 기술은 패턴을 찾고 통찰력을 감지하는 데 탁월합니다. 단계. 이 강점을 최대한 활용하는 프로젝트가 성공합니다.

예를 들어, 세네갈의 프로젝트 감마선으로 수컷 체체파리를 살균하는 것은 수면병의 확산을 막을 수 있었습니다. "머신 러닝은 파리 개체수를 98%까지 감소시켰고 그에 수반되는 수면병도 감소했습니다." 특정한 조명 특징은 수컷 파리와 암컷 파리를 구별합니다. 알고리즘은 구체적인 이미지 세트에서 엄청난 수의 수컷 초파리를 빠르게 분류하는 방법을 학습하여 수컷 체체 불임 수술을 단순화했습니다.

체체 프로젝트는 파리의 성별을 파악하는 구체적이고 개별적인 목표로 AI 기술의 강점을 활용했기 때문에 기계 학습 접근 방식은 특히 인간이 체체 파리를 분류하는 데 시간이 많이 걸리고 노동 집약적이기 때문에 성공적이었습니다.

반면에 광범위한 목표를 가지고 기계 학습 프로젝트를 만드는 것은 쉬울 수 있지만 기술을 작동시키는 데 관련된 전부는 아닙니다. McCormick의 정보 아키텍트인 Terry Moon은 타당성 조사 식품 품질을 위한 기계 학습 사용에 대해.

프로젝트 XNUMX년 동안 McCormick은 기계 학습이 유지 관리에 너무 많은 비용과 시간이 소요된다는 사실을 인식하고 프로젝트의 데이터 세트를 동결했습니다. Moon은 기어를 바꾸고 광범위한 데이터 다양성을 처리하는 방법을 고려했습니다.

McCormick의 데이터 문제를 해결하기 위해 몇 가지 API를 개발하려고 시도한 후 Moon은 도움이 될 플랫폼이 있는 공급업체를 찾았습니다. 그녀는 Ravi Shankar와 연결하고 Denodo 플랫폼을 사용하여 McCormick의 데이터를 한 지점에서 실시간으로 함께 연결하여 접근성을 높였습니다. 이 문제를 해결하면서 McCormick은 기계 학습 프로젝트를 계속했습니다.

3 월 2018 현재, McCormick은 머신 러닝 기술을 사용했으며 향후 XNUMX년 동안 이 기술을 확장했습니다. 그녀의 경험을 통해 Moon은 회사에 시간을 할애하라고 조언합니다. 데이터 가상화 예를 들어 다른 소스 시스템 세트가 아닌 한 세트의 소스 시스템에 연결하기 위해 어떤 정책을 적용해야 하는지와 같은 문제를 해결합니다.

머신러닝 필수
성공을 위한 데이터 품질 확보

기계 학습에는 정확하고 완전한 데이터 품질 데이터가 있어야 합니다. Paramita Ghosh의 보고에 따르면 "해당 데이터를 정리 및 실행하고 그 위에 일부 비즈니스 인텔리전스를 추가하려면 많은 수동 작업이 필요합니다." 과거 프로젝트, 프로그램 또는 직접 사용하는 응용 프로그램에서 양질의 데이터 세트를 손쉽게 사용할 수 있는 사람들에게는 기계 학습을 적용할 때 시작하기 더 쉬운 곳일 수 있습니다.

예를 들어, RR 도넬리 (현 RRD), Fortune 500 기업은 다음을 추가했습니다. 물류 사업부 인쇄 자료를 가장 잘 배송하는 방법을 파악합니다. RRD 직원과 대학은 운전자의 휴대폰에서 이미 신뢰할 수 있고 사용 가능한 지리, 교통 및 날씨 정보를 분석하는 알고리즘을 작성했습니다. 이러한 프로그램은 프로그래밍을 학습하고 업데이트하여 배송 경로에 대한 즉석 변경을 권장합니다. 모바일 GPS 데이터 고정된 기준에서 신뢰할 수 있는 정보를 제공합니다.

실적 기재 그 순매출 부분적으로 물류로 인해 3.7% 증가했습니다. 교훈: 신뢰할 수 있는 표준 데이터 세트에 쉽게 액세스할 수 있는 경우 기계 학습 프로젝트에 먼저 사용하는 것을 고려하십시오.

알고리즘에 제공되는 데이터 품질을 무시하면 기계 학습 프로젝트, 특히 채팅 봇이 실패할 수 있습니다. 제임스 미켄스 설명 이것은 27에서 설득력있게th Usenix 보안 심포지엄. 그는 인터넷에서 사람들과 대화하고 배우기 위해 Microsoft에서 만든 채팅 봇인 Tay의 예를 사용합니다. ~ 안에 어느 날, Tay는 격려 메시지를 트윗하는 것에서 히틀러를 찬양하고 인종 차별적이고 여성 혐오적인 의견을 분출하는 것으로 바뀌었습니다. Tay는 다음날 제거되었고 Microsoft는 사과.

페이스북 또한 자신과 대화하는 언어를 개발하고 사람들과 대화하는 요점을 놓치는 챗봇 앨리스와 밥에 문제가 있었습니다. Amazon의 Echo 장치인 Alexa는 일부 캘리포니아 주민들을 위해 인형 집을 주문하려 했습니다. 아침 뉴스 주석을 명령으로 표시합니다. 좋은 일 없이는 사업이 부끄러워질 것입니다. 데이터 품질 특히 기계가 챗봇을 통해 학습할 때 기계를 목적에 맞게 안내합니다.

 기계 학습 알고리즘은 다음에 따라 다릅니다.
적용 사례

기계 학습 알고리즘은 한 영역에서는 성공하지만 다른 영역에서는 실패할 수 있습니다. ~ 안에 알아야 할 10가지 기계 학습 알고리즘, 의사 결정은 프로그램에 따라 다릅니다. 또한 한 설정에서 실패한 기계 학습 스타일이 다른 설정에서는 성공할 수 있습니다.

IBM의 Watson은 KPMG LLP가 기업 연구 및 개발 부서를 위한 세무 업무를 지원하는 데 엄청난 성공을 거두었습니다. Watson은 자연어 처리를 통해 학습합니다. 은닉 마르코프 모델 시스템 또는 HMM. HMM은 단어를 상태로 설정하고 언어 전환 확률을 계산하므로 법률 언어에 매우 유용합니다. 교육 후 Watson은 올바른 세금 처리를 받았습니다. 네 번 중 세 번.

이를 통해 기업은 연방 정부 정책을 더 잘 활용할 수 있습니다. 연구 및 개발 세액 공제를 통해 IRS 문서 품질을 높이고 작업 시간을 절약할 수 있습니다. Watson은 이 R&D 자극에 대해 좋은 세금 결과를 제공하기 위해 규정, 법률 및 법원 사례 전반에 걸쳐 다양한 변화를 따라갈 수 있었습니다.

이것은 광범위한 암 프로젝트에 대한 작업과 대조적이었습니다. IBM의 Watson Health 프로젝트는 암 진단 및 치료. 2018년 39월 휴스턴의 MD 앤더슨 암 센터는 2.4만 달러 예산이 책정된 기계 학습 프로젝트로 인해 XNUMX만 달러의 손실을 입었습니다.

기계 학습 알고리즘을 약간 변경하여 적응하는 Watson이 암에서 유전자 변이가 어떻게 진행되는지 추론할 수 있다는 비현실적인 기대가 프로젝트 중단에 기여했습니다. 종양 이미지 세트의 데이터 세트를 사용하여 특정 암을 식별하는 것과 같이 프로젝트가 Watson의 학습 강점으로 제한되었다면 프로젝트가 더 많은 성공을 거둘 수 있었을 것입니다.

결론

기계 학습 사용 사례는 기술이 구체적인 목표, 우수한 데이터 세트 및 알고리즘의 강점과 약점에 대한 이해와 함께 가장 잘 작동한다는 것을 보여줍니다. 기계 학습이 다른 목표에 효과적이려면 더 많은 기술 혁신이 필요합니다. 파리에 있는 프랑스 국립 컴퓨터 과학 연구소인 Inria의 AI 연구원인 Pierre-Yves Oudeyer 박사는 기계가 호기심이 필요하다 배우다. 일부 비즈니스 목표가 현재의 기계 학습 혁신을 넘어선다는 점을 감안할 때 기업은 기계 학습을 적용하기 전에 기술 및 사용 사례를 최신 상태로 유지해야 합니다.

Shutterstock.com의 라이센스에 따라 사용 된 이미지

PlatoAi. Web3 재창조. 데이터 인텔리전스 증폭.
액세스하려면 여기를 클릭하십시오.

출처: https://www.dataversity.net/machine-learning-transformed-data-quality-and-operational-necessities/

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?