Salesforce Research, AI를 활용하여 의학, 경제 및 언어 연구

2015 년에 Palo Alto West Elm 가구점의 지하에서 작업하는 Salesforce 연구원들은 제품 전반에 걸친 예측을 지원하는 Salesforce의 AI 플랫폼 인 Einstein이 될 프로토 타입을 개발했습니다. 80 월 현재, 아인슈타인은 수만 개의 기업과 수백만 명의 사용자에게 매일 XNUMX 억 건 이상의 예측을 제공하고 있습니다. 그러나이 기술은 Salesforce 비즈니스의 핵심으로 남아 있지만 Salesforce의 AI R & D 부서 인 Salesforce Research의 범위하에있는 많은 연구 영역 중 하나 일뿐입니다.

신제품, 애플리케이션 및 연구 방향을위한 길을 닦는 AI 기술을 발전시키는 것이 임무 인 Salesforce Research는 매출 원동력으로서 AI에 대한 Salesforce CEO Mark Benioff의 노력의 결과입니다. Salesforce가 처음으로 Einstein을 발표 한 2016 년에 Benioff는 AI를 기업의 향후 애플리케이션과 기능이 구축 될 것이라고 예측 한 "차세대 플랫폼"으로 규정했습니다. 내년에 Salesforce는 고객 관계 관리 소프트웨어를 통한 AI의 영향만으로도 전 세계 국내 총생산에 1 조 달러 이상을 추가하고 800,000 만 개의 새로운 일자리를 창출 할 것이라는 연구를 발표했습니다.

오늘날 Salesforce Research의 작업은 컴퓨터 비전, 딥 러닝, 음성, 자연어 처리 및 강화 학습을 포함한 여러 영역에 걸쳐 있습니다. 본질적으로 독점적으로 상업적인 것과는 거리가 먼이 부서의 프로젝트는 AI를 사용하여 탐지하는 드론의 영역을 실행합니다 백상아리 조직 이미지에서 유방암의 징후를 식별 할 수있는 시스템에. 전염병으로 인해 Salesforce의 과학자들이 예측 가능한 미래. 작년에 Salesforce Research는 환경을 출시했습니다. AI 경제학자 — AI가 경제 설계를 개선 할 수있는 방법, 자연어 모델 견고성을 테스트하는 도구 및 AI 모델의 사용, 위험 및 편향을 설명하는 프레임 워크를 이해합니다.

Einstein GM Marco Casalaina에 따르면 Salesforce Research의 작업 대부분은 순수 연구 또는 응용 연구의 두 범주 중 하나로 분류됩니다. 순수 연구에는 오늘날 Salesforce 또는 고객이 수행하는 작업과 즉시 관련이없는 AI Economist와 같은 항목이 포함됩니다. 반면에 응용 연구에는 명확한 비즈니스 동기와 사용 사례가 있습니다.

Salesforce Research에서 특히 활발하게 활동하는 응용 연구 하위 분야 중 하나는 연설입니다. 지난 봄, 고객 서비스 담당자가 집에서 일하도록 점점 더 많이 주문됨에 따라 마닐라, 미국 및 다른 지역에서는 일부 기업이 AI로 전환하여 그로 인한 서비스 격차를 해소하기 시작했습니다. Casalaina는 이로 인해 Salesforce 비즈니스의 콜 센터 측 작업이 촉진되었다고 말합니다.

“우리는 실시간 음성 신호와 관련하여 고객을 위해 많은 작업을하고 있습니다. 우리는 통화 후 발생하는 고객 서비스 담당자를 위해 이러한 전체 코칭 프로세스를 제공합니다.”라고 Casalaina는 최근 인터뷰에서 VentureBeat에 말했습니다. “이 기술은 좋고 나쁘지만 어떤 방식 으로든 코칭 할 수있는 순간을 식별합니다. 또한 자동 에스컬레이션 및 마무리와 같은 다양한 기능을 개발하고 있으며, 통화 내용을 사용하여 필드를 미리 채우고 삶을 조금 더 쉽게 만들어줍니다. "

의학

건강 관리 애플리케이션이있는 AI는 Salesforce의 또 다른 연구 기둥이라고 Salesforce의 전 수석 과학자 인 Richard Socher가 전화 인터뷰에서 VentureBeat에 말했습니다. 이후 Salesforce에 온 Socher는 2016 년 MetaMind 인수, 2020 년 XNUMX 월에 Salesforce Research를 떠났습니다. 검색 엔진 스타트 업 You.com을 찾았지만 여전히 Salesforce에서 명예 과학자입니다.

Socher는“특히 의료용 컴퓨터 비전은 매우 큰 영향을 미칠 수 있습니다. “흥미로운 점은 인간의 시각 시스템이 X- 레이, CT 스캔, XNUMX 차원 MRI 스캔 또는 암을 나타낼 수있는 세포의 이미지를 읽는 데 반드시 그다지 능숙하지 않게 개발되지 않았다는 것입니다. 문제는 진단을 예측하는 것입니다. 그리고 치료.”

예측 건강 관리 모델을 개발, 교육 및 벤치마킹하기 위해 Salesforce Research는 미국의 클리닉, 병원 및 기타 진료 지점에서 수집 한 수십 테라 바이트의 데이터로 구성된 독점 데이터베이스에서 익명으로 익명화되고 익명화되었습니다. Salesforce Research의 의료 AI는 Salesforce가 환자의 익명 성을 보장하는 연합 학습과 같은 개인 정보 보호 기술을 채택하기 위해 최선을 다하고 있다고 말합니다.

“다음 개척자는 정밀 의학과 개인화 요법입니다.”라고 Esteva는 VentureBeat에 말했습니다. “이미지에있는 것 또는 환자에게있는 것뿐만 아니라 환자의 미래가 어떻게 보이는지, 특히 치료를 받기로 결정한 경우에는 더욱 그렇습니다. 우리는 AI를 사용하여 환자의 모든 데이터 (의료 이미지 기록, 라이프 스타일)를 가져옵니다. 결정이 내려지고 알고리즘은 그들이 살 것인지 죽을 것인지, 건강한 상태로 살 것인지 건강하지 않은 상태로 살 것인지 등을 예측합니다.”

이를 위해 XNUMX 월에 Salesforce Research는 리셉터 넷,이 부서의 기계 학습 시스템 연구원은 University of Southern California의 Lawrence J. Ellison Institute for Transformative Medicine of USC의 임상의와 협력하여 개발했습니다. 유방암 환자를위한 적절한 치료법을 결정할 때 종양 전문의에게 중요한 바이오 마커를 결정할 수있는이 시스템은 저널에 발표 된 연구에서 92 % 정확도를 달성했습니다. 자연 통신.

일반적으로 생검 또는 수술 중에 추출 된 유방암 세포는 에스트로겐 또는 프로게스테론 수용체 역할을하는 단백질이 포함되어 있는지 확인하기 위해 검사됩니다. 호르몬 에스트로겐과 프로게스테론이 이러한 수용체에 부착되면 암 성장을 촉진합니다. 그러나 이러한 유형의 생검 이미지는 널리 사용되지 않으며 병리학자가 검토해야합니다.

대조적으로, ReceptorNet은 세포의 모양, 크기 및 구조를 고려하는 헤 마톡 실린 및 에오신 (H & E) 염색을 통해 호르몬 수용체 상태를 결정합니다. Salesforce 연구원은 전 세계 "수십"병원에서 암 환자의 수천 개의 H & E 이미지 슬라이드로 시스템을 교육했습니다.

연구에 따르면 질병 진단을위한 알고리즘을 훈련하는 데 사용되는 데이터의 대부분이 불평등을 영속화 할 수 있습니다. 최근 영국 과학자 팀이 발견 거의 모든 안구 질환 데이터 세트는 북미, 유럽 및 중국의 환자에서 가져온 것입니다. 이는 안구 질환 진단 알고리즘이 소외된 국가의 인종 그룹에 적합하지 않다는 것을 의미합니다. 또 다른 연구에서 스탠포드 대학 연구원들은 AI의 의료 사용과 관련된 연구에 대한 미국 데이터의 대부분이 캘리포니아, 뉴욕 및 매사추세츠에서 온 것으로 확인했습니다.

그러나 Salesforce는 ReceptorNet에서 연령, 인종 및 지역 관련 편견의 징후를 분석했을 때 성능에 정적으로 차이가 없음을 발견했다고 주장합니다. 회사는 또한 알고리즘이 조직 샘플 준비의 차이에 관계없이 정확한 예측을 제공했다고 말합니다.

"유방암 분류에서 우리는 비용과 시간이 많이 드는 염색 과정없이 일부 이미지를 분류 할 수있었습니다."라고 Socher는 말했습니다. 간단히 말해서 이것은 AI가 최종 애플리케이션에 도움이 될 수있는 문제를 해결할 수있는 영역 중 하나입니다.”

지난 XNUMX 월에 발표 된 논문에 자세히 설명 된 관련 프로젝트에서 Salesforce Research의 과학자들은 다음과 같은 AI 시스템을 개발했습니다. 프로젠 "제어 가능한 방식"으로 단백질을 생성 할 수 있습니다. 분자 기능 또는 세포 구성 요소와 같은 단백질의 원하는 특성이 주어지면 ProGen은 단백질을 구성하는 아미노산을 단락의 단어처럼 처리하여 단백질을 생성합니다.

ProGen의 Salesforce Research 팀은 공개적으로 사용 가능한 최대 규모 인 280 억 XNUMX 천만 개 이상의 단백질 시퀀스 및 관련 메타 데이터로 구성된 데이터 세트에서 모델을 교육했습니다. 모델은 각 훈련 샘플을 가져와 아미노산 당 추측 게임을 공식화했습니다. 백만 라운드 이상의 훈련 동안 ProGen은 이전 아미노산에서 다음 아미노산을 예측하려고 시도했으며 시간이 지남에 따라 모델은 이전에 보지 못했던 서열로 단백질을 생성하는 방법을 배웠습니다.

앞으로 Salesforce 연구자들은 특정 단백질 특성을 연마하여 발견되지 않았 든 존재하지 않든 새로운 단백질을 합성하는 ProGen의 능력을 개선 할 계획입니다.

윤리학

Salesforce Research의 윤리적 AI 작업은 응용 및 순수 연구에 걸쳐 있습니다. 지난 XNUMX 개월 동안 AI의 윤리에 대해 고객과 많은 대화를 나눴다고 말하는 Casalaina에 따르면 고객의 관심이 증가했습니다.

XNUMX 월에 Salesforce 연구원들은 견고 함 체육관, 이는 하나로 하다 자연어 모델 테스트 전략을 강화하기위한 라이브러리 패치 워크. Robustness Gym은 실행할 평가의 우선 순위를 정하는 데 특정 변수가 어떻게 도움이 될 수 있는지에 대한 지침을 제공합니다. 구체적으로, 구조 및 알려진 사전 평가를 통한 작업의 영향과 일반화, 공정성 또는 보안 테스트와 같은 요구 사항을 설명합니다. 전문성, 컴퓨팅 액세스 및 인적 자원과 같은 제약이 있습니다.

자연어 연구에서 견고성 테스트는 표준이 아닌 예외 인 경향이 있습니다. 하나 신고 자연어 처리 모델이 제공 한 답변의 60 ~ 70 %가 벤치 마크 학습 세트 어딘가에 포함되어 모델이 일반적으로 단순히 답변을 암기하고 있음을 확인했습니다. 또 다른 연구에 따르면 AI 및 기계 학습 모델을 벤치마킹하는 데 사용되는 측정 항목은 일관성이없고 불규칙하게 추적되며 특히 정보를 제공하지 않는 경향이 있습니다.

사례 연구에서 Salesforce Research는 Robustness Gym을 사용하여 모델의 편향을 측정하는 "주요 기술 회사"의 감정 모델링 팀을 가졌습니다. 시스템을 테스트 한 후 모델링 팀은 최대 18 %의 성능 저하를 발견했습니다.

XNUMX 월에 발표 된 최근 연구에서 Salesforce 연구원들은 제안 된 단어 임베딩에서 성별 편향을 완화하는 새로운 방법, AI 모델을 교육하여 언어를 요약하고 번역하고 기타 예측 작업을 수행하는 데 사용되는 단어 표현입니다. 단어 임베딩은 단어의 의미 및 구문 적 의미를 포착하고 다른 단어와의 관계를 포착하므로 자연어 처리에 일반적으로 사용됩니다. 그러나 그들은 성 편견을 물려받는 경향이 있습니다.

Salesforce가 제안한 솔루션 인 Double-Hard Debias는 임베딩 공간을 표면적으로는 성별이없는 공간으로 변환합니다. 단어 임베딩을 "서브 스페이스"로 변환하여 인코딩 된 성별에서주의를 분산시키는 빈도 정보를 인코딩하는 차원을 찾는 데 사용할 수 있습니다. 그런 다음 다른 편향성 제거 작업을 실행하기 전에 수정 된 임베딩을 얻기 위해이 차원을 따라 성별 구성 요소를 "투영"합니다.

Double-Hard Debias를 평가하기 위해 연구원들은 pro-gender-stereotype과 anti-gender-stereotype 문장으로 구성된 WinoBias 데이터 세트에 대해 테스트했습니다. Double-Hard Debias는 다음을 사용하여 얻은 임베딩의 편향 점수를 줄였습니다. 글 로베 의미 정보를 유지하면서 알고리즘을 15 (두 가지 유형의 문장)에서 7.7까지.

미래의 일

전염병으로 인해 자동화의 이점이 분명해지면서 Casalaina는 이것이 Salesforce Research의 핵심 초점 영역으로 남을 것으로 예상합니다. 그는 반복적 인 백룸 작업을 처리하는 로봇 프로세스 자동화 기술뿐만 아니라 고객 질문에 답하기 위해 구축 된 챗봇이 현재보다 더 많은 능력을 발휘할 것으로 기대합니다.

Casalaina의 주장을 뒷받침하는 숫자가 있습니다. 300 월에 Salesforce는 아인슈타인 봇 올해 680 월 이후 세션은 2019 년에 비해 전년 대비 700 % 증가했습니다. 이는 상담원 지원 및 서비스 자동화에 대한 예측이 300 % 증가하고 다음과 같은 일일 예측이 XNUMX % 증가한 것입니다. 상거래를위한 아인슈타인 3 년 2020 분기. Marketing Cloud 용 Einstein 과 판매를위한 Einstein, 이메일 및 모바일 개인화 예측은 67 분기에 3 % 증가했으며 다음을 사용하여 잠재 고객을 구매자로 전환하는 비율이 32 % 증가했습니다. 아인슈타인 리드 점수.

“목표는 여기에 있으며 Salesforce Research에서 광범위하게 사람들을위한 기초 작업을 제거하는 것입니다. 모델, 모델의 장점, 그 모든 것에 초점을 맞추고 있습니다.”라고 Casalaina는 말했습니다. “그러나 그것은 방정식의 20 %에 불과합니다. 그것의 80 %는 인간이 그것을 사용하는 방법입니다.”

VentureBeat

VentureBeat의 사명은 기술 의사 결정권자가 혁신적인 기술과 거래에 대한 지식을 습득 할 수있는 디지털 타운 스퀘어가되는 것입니다. 당사 사이트는 데이터 기술 및 전략에 대한 필수 정보를 제공하여 조직을 이끌 때 안내합니다. 다음에 액세스 할 수 있도록 커뮤니티의 일원이되도록 귀하를 초대합니다.

관심있는 주제에 대한 최신 정보
뉴스 레터
통제 된 사고 리더 콘텐츠 및 Transform과 같은 소중한 이벤트에 대한 할인 된 액세스
네트워킹 기능 등

회원 가입

생성 데이터 인텔리전스

Salesforce Research는 AI를 사용하여 의학, 경제 및 연설을 연구합니다.

의학

윤리학

미래의 일

VentureBeat

비트코인 대학살: 암호화폐 분석가, 8% 가격 하락 후 '데스 크로스' 발견

AIEMP, 혁신적인 AI 보안 프로젝트 출시 발표

최신 인텔리전스

Pantera Capital의 Fund V, 다양한 블록체인 투자를 위해 1억 달러 목표

국립 가상 기후 연구소는 기후 과학에 대한 가이드입니다 – CleanTechnica

이 반폐쇄형 전기 세발 자전거는 통근을 훨씬 더 즐겁게 만들어 줄 것입니다 – CleanTechnica

메탄 상쇄 제공업체 Zefiro Mthan, Cboe Canada에 상장

비트코인 네 번째 반감기 블록의 희귀한 'Epic Sat'가 2만 달러 이상에 판매됨

마리화나가 수영복을 입는 데 도움이 될까요?