Zephyrnet-logo

SambaSafety automatiseert aangepaste R-workload, waardoor de veiligheid van de bestuurder wordt verbeterd met Amazon SageMaker en AWS Step Functions | Amazon-webservices

Datum:

At SambaVeiligheid, is het hun missie om veiligere gemeenschappen te bevorderen door risico's te verminderen door middel van data-inzichten. Sinds 1998 is SambaSafety de toonaangevende Noord-Amerikaanse leverancier van cloudgebaseerde software voor het beheer van mobiliteitsrisico's voor organisaties met commerciële en niet-commerciële drijfveren. SambaSafety bedient meer dan 15,000 wereldwijde werkgevers en verzekeringsmaatschappijen met monitoring van bestuurdersrisico's en naleving, online training en diepgaande risicoanalyse, evenals oplossingen voor risicoprijzen. Door het verzamelen, correleren en analyseren van bestuurdersgegevens, telematica, bedrijfs- en andere sensorgegevens, helpt SambaSafety niet alleen werkgevers om het veiligheidsbeleid beter te handhaven en claims te verminderen, maar helpt het ook verzekeraars om weloverwogen acceptatiebeslissingen te nemen en achtergrondscreeners nauwkeurige, efficiënte pre-aanwerving uit te voeren controles.

Niet alle bestuurders vertonen hetzelfde risicoprofiel. Hoe meer tijd u achter het stuur doorbrengt, hoe hoger uw risicoprofiel. Het team van datawetenschappers van SambaSafety heeft complexe en correcte modelleringsoplossingen ontwikkeld die zijn ontworpen om dit risicoprofiel nauwkeurig te kwantificeren. Ze zochten echter ondersteuning om deze oplossing voor batch- en real-time inferentie op een consistente en betrouwbare manier in te zetten.

In dit bericht bespreken we hoe SambaSafety AWS machine learning (ML) en continuous integration and continuous delivery (CI/CD) tools gebruikte om hun bestaande data science-applicatie in te zetten voor batch-inferentie. SambaSafety werkte samen met AWS Advanced Consulting Partner Vuurgeest om een ​​oplossing te leveren die gebruikt wordt AWS CodeStar, AWS Stap Functies en Amazon Sage Maker voor deze werkdruk. Met AWS CI/CD- en AI/ML-producten hoefde het datawetenschapsteam van SambaSafety hun bestaande ontwikkelingsworkflow niet te wijzigen om te profiteren van continue modeltraining en inferentie.

Gebruiksscenario voor de klant

Het data science-team van SambaSafety gebruikte al lang de kracht van data om hun bedrijf te informeren. Ze lieten verschillende bekwame ingenieurs en wetenschappers inzichtelijke modellen bouwen die de kwaliteit van de risicoanalyse op hun platform verbeterden. De uitdagingen waarmee dit team werd geconfronteerd, waren niet gerelateerd aan datawetenschap. Het data science-team van SambaSafety had hulp nodig bij het verbinden van hun bestaande data science-workflow met een continuous delivery-oplossing.

Het data science-team van SambaSafety onderhield verschillende scriptachtige artefacten als onderdeel van hun ontwikkelingsworkflow. Deze scripts voerden verschillende taken uit, waaronder gegevensvoorverwerking, functie-engineering, modelcreatie, modelafstemming en modelvergelijking en -validatie. Deze scripts werden allemaal handmatig uitgevoerd toen er nieuwe gegevens in hun omgeving kwamen voor training. Bovendien voerden deze scripts geen modelversies of hosting uit voor gevolgtrekkingen. Het datawetenschapsteam van SambaSafety had handmatige oplossingen ontwikkeld om nieuwe modellen voor productie te promoten, maar dit proces werd tijdrovend en arbeidsintensief.

Om het zeer bekwame data science-team van SambaSafety vrij te maken om te innoveren op nieuwe ML-workloads, moest SambaSafety de handmatige taken automatiseren die gepaard gaan met het onderhouden van bestaande modellen. Bovendien moest de oplossing de handmatige workflow repliceren die wordt gebruikt door het datawetenschapsteam van SambaSafety en beslissingen nemen over de voortgang op basis van de uitkomsten van deze scripts. Ten slotte moest de oplossing integreren met hun bestaande codebase. Het datawetenschapsteam van SambaSafety gebruikte een codeopslagoplossing buiten AWS; de uiteindelijke pijplijn moest intelligent genoeg zijn om te activeren op basis van updates van hun codebasis, die voornamelijk in was geschreven R.

Overzicht oplossingen

Het volgende diagram illustreert de architectuur van de oplossing, die is gebaseerd op een van de vele open-source-architecturen die worden beheerd door de leveringspartner van SambaSafety Vuurgeest.

Architectuurdiagram

De door Firemind geleverde oplossing voor het datawetenschapsteam van SambaSafety was opgebouwd rond twee ML-pijplijnen. De eerste ML-pijplijn traint een model met behulp van SambaSafety's scripts voor het voorbewerken, trainen en testen van aangepaste gegevens. Het resulterende modelartefact wordt ingezet voor batch- en real-time gevolgtrekkingen voor modeleindpunten die worden beheerd door SageMaker. De tweede ML-pijplijn vergemakkelijkt het deductieverzoek aan het gehoste model. Op deze manier wordt de pijplijn voor training losgekoppeld van de pijplijn voor inferentie.

Een van de complexiteiten in dit project is het repliceren van de handmatige stappen van de datawetenschappers van SambaSafety. Het team van Firemind gebruikte Step Functions en SageMaker Processing om deze taak te voltooien. Met Step Functions kunt u afzonderlijke taken in AWS uitvoeren met behulp van AWS Lambda functies Amazon Elastic Kubernetes-service (Amazon EKS) werknemers, of in dit geval SageMaker. Met SageMaker Processing kunt u taken definiëren die worden uitgevoerd op beheerde ML-instanties binnen het SageMaker-ecosysteem. Elke uitvoering van een Step Function-taak houdt zijn eigen logboeken, uitvoeringsgeschiedenis en details over het slagen of mislukken van de taak bij.

Het team gebruikte Step Functions en SageMaker, samen met Lambda, om de automatisering van trainings-, afstemmings-, implementatie- en inferentieworkloads af te handelen. Het enige overgebleven stuk was de continue integratie van codewijzigingen in deze implementatiepijplijn. Firemind implementeerde een CodeStar-project dat een verbinding onderhield met de bestaande coderepository van SambaSafety. Wanneer het ijverige data science-team van SambaSafety een update plaatst voor een specifieke tak van hun codebasis, pikt CodeStar de wijzigingen op en activeert de automatisering.

Conclusie

De nieuwe serverloze MLOps-pijplijn van SambaSafety had een aanzienlijke impact op hun prestatievermogen. Door de integratie van datawetenschap en softwareontwikkeling kunnen hun teams naadloos samenwerken. Hun oplossing voor geautomatiseerde modelimplementatie verkortte de leveringstijd tot wel 70%.

SambaSafety had ook het volgende te zeggen:

“Door onze data science-modellen te automatiseren en ze te integreren in hun levenscyclus van softwareontwikkeling, hebben we een nieuw niveau van efficiëntie en nauwkeurigheid in onze services kunnen bereiken. Dit heeft ons in staat gesteld om de concurrentie voor te blijven en innovatieve oplossingen aan klanten te leveren. Onze klanten zullen hier enorm van profiteren met de snellere doorlooptijden en verbeterde nauwkeurigheid van onze oplossingen.”

SambaSafety heeft contact opgenomen met AWS-accountteams met hun probleem. AWS-account- en oplossingsarchitectuurteams hebben gewerkt aan het identificeren van deze oplossing door te sourcen uit ons robuuste partnernetwerk. Maak contact met uw AWS-accountteam om vergelijkbare transformatieve kansen voor uw bedrijf te identificeren.


Over de auteurs

gekDan Ferguson is een AI/ML Specialist Solutions Architect (SA) op de Private Equity Solutions Architecture bij Amazon Web Services. Dan helpt door Private Equity gesteunde portfoliobedrijven om AI/ML-technologieën te benutten om hun zakelijke doelstellingen te bereiken.

KhalilAdibKhalil Adib is een Data Scientist bij Firemind en stimuleert de innovatie die Firemind aan hun klanten kan bieden in de magische werelden van AI en ML. Khalil sleutelt aan de nieuwste en beste technologie en modellen, en zorgt ervoor dat Firemind altijd aan de top staat.

Jason MatthewJason Matthew is een Cloud Engineer bij Firemind en leidt de end-to-end levering van projecten voor klanten, van het schrijven van pijplijnen met IaC, het uitbouwen van data-engineering met Python en het verleggen van de grenzen van ML. Jason levert ook een belangrijke bijdrage aan de open source-projecten van Firemind.

spot_img

Laatste intelligentie

spot_img