Zephyrnet-logo

Salesforce Research gebruikt AI om geneeskunde, economie en spraak te studeren

Datum:

In 2015 ontwikkelden Salesforce-onderzoekers die vanuit een kelder onder een meubelwinkel in Palo Alto West Elm werkten het prototype van wat Einstein zou worden, het AI-platform van Salesforce dat voorspellingen voor al zijn producten mogelijk maakt. Sinds november levert Einstein meer dan 80 miljard voorspellingen per dag voor tienduizenden bedrijven en miljoenen gebruikers. Maar hoewel de technologie de kern blijft van de activiteiten van Salesforce, is het maar een van de vele onderzoeksgebieden onder de bevoegdheid van Salesforce Research, de AI R & D-divisie van Salesforce.

Salesforce Research, wiens missie het is om AI-technieken te bevorderen die het pad effenen voor nieuwe producten, toepassingen en onderzoeksrichtingen, is een uitvloeisel van de toewijding van Salesforce-CEO Mark Benioff aan AI als inkomstenbron. In 2016, toen Salesforce Einstein voor het eerst aankondigde, typeerde Benioff AI als "het volgende platform" waarop hij voorspelde dat de toekomstige applicaties en mogelijkheden van bedrijven zullen worden gebouwd. Het volgende jaar bracht Salesforce onderzoek uit dat suggereert dat de impact van AI via software voor klantrelatiebeheer alleen al meer dan $ 1 biljoen aan bruto binnenlandse producten over de hele wereld zal toevoegen en 800,000 nieuwe banen zal creëren.

Tegenwoordig omvat het werk van Salesforce Research een aantal domeinen, waaronder computervisie, deep learning, spraak, natuurlijke taalverwerking en reinforcement learning. De projecten van de divisie zijn verre van exclusief commercieel van aard, maar gaan van drones die AI gebruiken om te spotten geweldige witte haaien naar een systeem dat tekenen van borstkanker kan herkennen aan de hand van afbeeldingen van weefsel. Het werk gaat door, zelfs nu de pandemie de wetenschappers van Salesforce uit het kantoor dwingt voor de nabije toekomst​ Afgelopen jaar heeft Salesforce Research een omgeving uitgebracht - de AI-econoom - om te begrijpen hoe AI het economisch ontwerp zou kunnen verbeteren, een tool om de robuustheid van natuurlijke taalmodellen te testen, en een raamwerk dat het gebruik, de risico's en vooroordelen van AI-modellen beschrijft.

Volgens Einstein GM Marco Casalaina valt het grootste deel van het werk van Salesforce Research in twee categorieën: puur onderzoek of toegepast onderzoek. Puur onderzoek omvat zaken als de AI Economist, die niet direct relevant is voor taken die Salesforce of zijn klanten tegenwoordig doen. Toegepast onderzoek heeft daarentegen een duidelijke zakelijke motivatie en use case.

Een bijzonder actief subgebied van toegepast onderzoek bij Salesforce Research is spraak. Afgelopen voorjaar kregen medewerkers van de klantenservice steeds vaker de opdracht om vanuit huis te werken manilla, de VS en elders, begonnen sommige bedrijven zich tot AI te wenden om de resulterende lacunes in de dienstverlening te overbruggen. Casalaina zegt dat dit het werk aan de callcenterzijde van Salesforce heeft gestimuleerd.

“We doen veel werk voor onze klanten… met betrekking tot realtime gesproken aanwijzingen. We bieden dit hele coachingproces aan voor vertegenwoordigers van de klantenservice dat plaatsvindt na het telefoontje, ”vertelde Casalaina in een recent interview aan VentureBeat. “De technologie identificeert momenten die goed of slecht waren, maar die op de een of andere manier coachbaar waren. We werken ook aan een aantal mogelijkheden, zoals automatische escalaties en afronding, en we gebruiken de inhoud van oproepen om velden voor u in te vullen en uw leven een beetje gemakkelijker te maken. "

Geneeskunde

AI met toepassingen in de gezondheidszorg is een andere onderzoekspijler bij Salesforce, vertelde Richard Socher, voormalig hoofdwetenschapper bij Salesforce, aan VentureBeat tijdens een telefonisch interview. Socher, die naar Salesforce kwam na de overname van MetaMind in 2016, verliet Salesforce Research in juli 2020 om zoekmachine-startup You.com op te richten, maar blijft een emeritus wetenschapper bij Salesforce.

"Met name medische computervisie kan een grote impact hebben", zei Socher. "Wat interessant is, is dat het menselijke visuele systeem niet noodzakelijkerwijs ontwikkeld is om erg goed te zijn in het lezen van röntgenfoto's, CT-scans, MRI-scans in drie dimensies, of nog belangrijker, afbeeldingen van cellen die op kanker kunnen duiden ... De uitdaging is het voorspellen van diagnoses. en behandeling. "

Om voorspellende zorgmodellen te ontwikkelen, op te leiden en te benchmarken, put Salesforce Research uit een eigen database die bestaat uit tientallen terabytes aan gegevens die zijn verzameld in klinieken, ziekenhuizen en andere zorgpunten in de VS. Het is geanonimiseerd en gedeïdentificeerd, en Andre Esteva, hoofd van medische AI ​​bij Salesforce Research, zegt dat Salesforce zich inzet voor het toepassen van privacybeschermende technieken, zoals federatief leren, die patiënten een niveau van anonimiteit garanderen.

"De volgende grens is rond precisiegeneeskunde en personaliserende therapieën", vertelde Esteva aan VentureBeat. “Het gaat niet alleen om wat er in een afbeelding aanwezig is of wat er bij een patiënt aanwezig is, maar ook hoe de toekomst van de patiënt eruit ziet, vooral als we besluiten om hem in therapie te zetten. We gebruiken AI om alle gegevens van de patiënt te verzamelen - hun medische beelden, hun levensstijl. Er worden beslissingen genomen en het algoritme voorspelt of ze zullen leven of sterven, of ze in een gezonde staat of ongezond zullen leven, enzovoort. "

Met het oog hierop heeft Salesforce Research in december open source gemaakt ReceptorNet, een machine-leersysteem dat onderzoekers van de divisie ontwikkelden in samenwerking met clinici van het Lawrence J. Ellison Institute for Transformative Medicine van de USC van de University of Southern California. Het systeem, dat een kritische biomarker voor oncologen kan bepalen bij het beslissen over de juiste behandeling voor borstkankerpatiënten, behaalde een nauwkeurigheid van 92% in een studie gepubliceerd in het tijdschrift Nature Communications.

Meestal worden borstkankercellen die tijdens een biopsie of operatie worden geëxtraheerd, getest om te zien of ze eiwitten bevatten die werken als oestrogeen- of progesteronreceptoren. Wanneer de hormonen oestrogeen en progesteron zich aan deze receptoren hechten, voeden ze de groei van kanker. Maar dit soort biopsiebeelden is minder algemeen verkrijgbaar en moet door een patholoog worden beoordeeld.

Daarentegen bepaalt ReceptorNet de hormoonreceptorstatus via hematoxyline- en eosinekleuring (H&E), waarbij rekening wordt gehouden met de vorm, grootte en structuur van cellen. Salesforce-onderzoekers hebben het systeem getraind op enkele duizenden H & E-beelddia's van kankerpatiënten in "tientallen" ziekenhuizen over de hele wereld.

Onderzoek heeft aangetoond dat veel van de gegevens die worden gebruikt om algoritmen te trainen voor het diagnosticeren van ziekten, ongelijkheden kunnen bestendigen. Onlangs heeft een team van Britse wetenschappers gevonden dat bijna alle gegevenssets voor oogziekten afkomstig zijn van patiënten in Noord-Amerika, Europa en China, wat betekent dat algoritmen voor het diagnosticeren van oogziekten minder zeker zullen werken voor raciale groepen uit ondervertegenwoordigde landen. In een ander onderzoek identificeerden onderzoekers van Stanford University de meeste Amerikaanse gegevens voor onderzoeken met medisch gebruik van AI als afkomstig uit Californië, New York en Massachusetts.

Maar Salesforce beweert dat toen het ReceptorNet analyseerde op tekenen van leeftijds-, ras- en geografie-gerelateerde vooringenomenheid, het ontdekte dat er statisch geen verschil was in zijn prestaties. Het bedrijf zegt ook dat het algoritme nauwkeurige voorspellingen heeft opgeleverd, ongeacht verschillen in de voorbereiding van weefselmonsters.

"Wat de classificatie van borstkanker betreft, waren we in staat om sommige afbeeldingen te classificeren zonder een duur en tijdrovend kleuringsproces", zei Socher. "Om een ​​lang verhaal kort te maken, dit is een van de gebieden waarop AI een probleem kan oplossen, zodat het nuttig kan zijn bij eindtoepassingen."

In een gerelateerd project dat werd beschreven in een paper dat afgelopen maart werd gepubliceerd, ontwikkelden wetenschappers van Salesforce Research een AI-systeem met de naam ProGen die eiwitten op een 'controleerbare manier' kunnen genereren. Gezien de gewenste eigenschappen van een eiwit, zoals een moleculaire functie of een cellulaire component, maakt ProGen eiwitten door de aminozuren waaruit het eiwit bestaat te behandelen als woorden in een alinea.

Het Salesforce Research-team achter ProGen heeft het model getraind op een dataset van meer dan 280 miljoen eiwitsequenties en bijbehorende metadata - de grootste die openbaar beschikbaar is. Het model nam elk trainingsmonster en formuleerde een raadspel per aminozuur. Gedurende meer dan een miljoen trainingsrondes probeerde ProGen de volgende aminozuren van de vorige aminozuren te voorspellen, en na verloop van tijd leerde het model eiwitten te genereren met sequenties die het nog niet eerder had gezien.

In de toekomst willen Salesforce-onderzoekers het vermogen van ProGen verfijnen om nieuwe eiwitten te synthetiseren, of ze nu onontdekt of niet-bestaand zijn, door in te spelen op specifieke eiwiteigenschappen.

Ethiek

Het ethische AI-werk van Salesforce Research gaat over toegepast en puur onderzoek. Volgens Casalaina is er meer belangstelling voor van klanten, die zegt dat hij de afgelopen zes maanden een aantal gesprekken heeft gehad met klanten over de ethiek van AI.

In januari brachten Salesforce-onderzoekers Robuustheid Gym, dat beoogt verenigen een lappendeken van bibliotheken om teststrategieën voor natuurlijke taalmodellen te versterken. Robustness Gym biedt richtlijnen over hoe bepaalde variabelen kunnen helpen bij het stellen van prioriteiten voor welke evaluaties moeten worden uitgevoerd. Specifiek beschrijft het de invloed van een taak via een structuur en bekende eerdere evaluaties, evenals behoeften zoals het testen van generalisatie, eerlijkheid of veiligheid; en beperkingen zoals expertise, computertoegang en human resources.

Bij de studie van natuurlijke taal zijn robuustheidstesten eerder uitzondering dan norm. een verslag ontdekte dat 60% tot 70% van de antwoorden gegeven door natuurlijke taalverwerkingsmodellen ergens in de benchmark-trainingssets waren ingebed, wat aangeeft dat de modellen meestal simpelweg antwoorden onthouden. Een andere studie wees uit dat statistieken die worden gebruikt om AI- en machine learning-modellen te benchmarken, over het algemeen inconsistent, onregelmatig gevolgd en niet bijzonder informatief zijn.

In een casestudy liet Salesforce Research een team voor sentimentmodellering bij een "groot technologiebedrijf" de bias van hun model meten met Robustness Gym. Na het testen van het systeem ontdekte het modelleerteam een ​​prestatievermindering tot 18%.

In een recentere studie die in juli werd gepubliceerd, stellen Salesforce-onderzoekers voorgestelde een nieuwe manier om gendervooroordelen in woordinsluitingen te verminderen, de woordrepresentaties die worden gebruikt om AI-modellen te trainen om talen samen te vatten, te vertalen en andere voorspellingstaken uit te voeren. Insluitingen van woorden vangen semantische en syntactische betekenissen van woorden en relaties met andere woorden op, en daarom worden ze vaak gebruikt bij de verwerking van natuurlijke taal. Maar ze hebben de neiging om gendervooroordelen te erven.

De door Salesforce voorgestelde oplossing, Double-Hard Debias, transformeert de inbeddingsruimte in een ogenschijnlijk geslachtsloze ruimte. Het transformeert woordinsluitingen in een "subruimte" die kan worden gebruikt om de dimensie te vinden die frequentie-informatie codeert die afleidt van de gecodeerde geslachten. Vervolgens “projecteert” het de gendercomponent langs deze dimensie om herziene inbeddingen te verkrijgen voordat een andere debiasing-actie wordt uitgevoerd.

Om Double-Hard Debias te evalueren, testten de onderzoekers het met de WinoBias-dataset, die bestaat uit pro-gender-stereotype en anti-gender-stereotype zinnen. Double-Hard Debias verminderde de bias-score van inbeddingen verkregen met behulp van de Handschoen algoritme van 15 (op twee soorten zinnen) tot 7.7 met behoud van de semantische informatie.

Toekomstwerk

Vooruitkijkend, aangezien de pandemie de voordelen van automatisering duidelijk maakt, verwacht Casalaina dat dit een kerngebied van aandacht zal blijven voor Salesforce Research. Hij verwacht dat chatbots die zijn gebouwd om vragen van klanten te beantwoorden, beter in staat zullen zijn dan ze momenteel zijn, evenals geautomatiseerde technologieën voor procesautomatisering die repetitieve taken in de achterkamer afhandelen.

Er zijn cijfers die de beweringen van Casalaina ondersteunen. In november rapporteerde Salesforce een toename van 300% in Einstein Bot sessies sinds februari van dit jaar, een stijging van 680% op jaarbasis in vergelijking met 2019. Dat komt bovenop een toename van 700% in voorspellingen voor assistentie van agenten en serviceautomatisering en een toename van 300% in dagelijkse voorspellingen voor Einstein voor handel in Q3 2020. Zoals voor Einstein voor Marketing Cloud en Einstein voor verkoop, e-mail- en mobiele personalisatievoorspellingen stegen met 67% in Q3, en er was een toename van 32% in het converteren van prospects naar kopers met Einstein-leadscores.

“Het doel is hier - en bij Salesforce Research in het algemeen - om de basis voor mensen weg te nemen. Er wordt veel aandacht besteed aan het model, de goedheid van het model en al dat soort dingen, ”zei Casalaina. “Maar dat is slechts 20% van de vergelijking. Het 80% deel ervan is hoe mensen het gebruiken. "

VentureBeat

De missie van VentureBeat is om een ​​digitaal stadsplein te zijn voor technische besluitvormers om kennis op te doen over transformatieve technologie en transacties. Onze site biedt essentiële informatie over datatechnologieën en strategieën om u te begeleiden bij het leiden van uw organisaties. We nodigen u uit om lid te worden van onze community, om toegang te krijgen tot:

  • up-to-date informatie over de onderwerpen die u interesseren
  • onze nieuwsbrieven
  • gated thought-leader content en toegang met korting tot onze gewaardeerde evenementen, zoals Transform
  • netwerkfuncties en meer

Word lid

Bron: https://venturebeat.com/2021/02/20/salesforce-research-wields-ai-to-study-medicine-economics-and-speech/

spot_img

Mobile

Laatste intelligentie

spot_img