Zephyrnet-logo

Hoe Federated Learning helpt om obstakels in machine learning te overwinnen

Datum:

Federatief leren is een machine learning techniek waarmee meerdere partijen een model kunnen trainen zonder hun data te delen. Het wordt in verschillende sectoren gebruikt, van toetsenborden voor mobiele apparaten tot de gezondheidszorg, van autonome voertuigen tot boorplatforms. Het is met name handig in situaties waarin het delen van gegevens wordt beperkt door regelgeving, of gevoelig of bedrijfseigen is, omdat het organisaties in staat stelt samen te werken aan machine learning-projecten zonder dat dit ten koste gaat van de privacy van gegevens. Het is ook handig in situaties waarin de gegevens enorm groot zijn, waardoor gegevenscentralisatie traag en kostbaar wordt.

Een van de grootste obstakels bij machine learning is de behoefte aan grote hoeveelheden data. Dit kan een uitdaging zijn voor organisaties die geen toegang hebben tot grote datasets, of voor organisaties die werken met gevoelige gegevens die niet gedeeld kunnen worden. Federated learning stelt deze organisaties in staat om bij te dragen aan een gedeeld model zonder hun gegevens te hoeven delen.

Federated learning kan ook helpen om het probleem van gegevenshomogeniteit te overwinnen. In veel gevallen worden modellen getraind op gegevens uit een klein aantal bronnen die niet de algemene bevolking vertegenwoordigen. Modellen die zijn getraind op beperkte datasets generaliseren niet goed en presteren dus ondermaats wanneer ze breder worden ingezet. Dankzij federatief leren kunnen modellen worden getraind op een grotere en diversere set gegevensbronnen zonder dat de gegevens van al deze gegevensbronnen moeten worden gecentraliseerd, wat leidt tot robuustere modellen met betere prestaties.

Bovendien kunnen de kosten van cloudcomputingbronnen een obstakel vormen bij machine learning. Het trainen van machine learning-modellen kan rekenintensief zijn en vereist dure hardware zoals grafische verwerkingseenheden (GPU's). Het gebruik van cloudinstanties voor training kan erg snel duur worden. Gefederaliseerd leren stelt organisaties in staat om de belasting van modeltraining te delen en onderbenutte computerresources of servers te gebruiken die ze al in hun datacenters hebben. Dit kan leiden tot een aanzienlijke kostenbesparing bij grote rekenintensieve trainingsprocessen.

Veel organisaties maken zich ook zorgen over het maken van overbodige kopieën van grote datasets. Dit kan hoge opslagkosten met zich meebrengen, evenals kosten voor cloudproviders voor het overdragen van de gegevens tussen lokale datacenters en cloudaccounts, of tussen verschillende cloudaccounts. Met federatief leren kunnen organisaties één kopie van hun gegevens behouden en hoeven deze niet naar een andere locatie of cloudaccount te worden verplaatst om modellen met de gegevens te trainen.

Een andere uitdaging die het gebruik van machine learning kan beperken, is privacy en regelgevende beperkingen. De gegevens die worden gebruikt om modellen te trainen, kunnen gevoelige informatie bevatten, zoals persoonlijk identificeerbare informatie (PII) of persoonlijke gezondheidsinformatie (PHI). Dankzij federatief leren kunnen organisaties modellen trainen zonder hun gegevens te hoeven delen, wat kan helpen om deze privacy- en regelgevingsproblemen te verminderen.

Federated learning wordt al in verschillende sectoren gebruikt om de kracht van grotere en meer diverse datasets te ontsluiten zonder dat data gedeeld hoeven te worden. Bijvoorbeeld in 2021 een COVID-algoritme voor beslissingsondersteuning werd getraind met gegevens van 20 ziekenhuizen over de hele wereld met behulp van federated learning (volledige openbaarmaking: dit project werd geleid door onze medeoprichter en CEO), en in 2022 een algoritme voor margedetectie van hersenkanker is getraind met gegevens van 71 ziekenhuizen over de hele wereld met behulp van. Google gebruikt gefedereerd leren om voorspel het volgende getypte woord op Google Android-toetsenborden sinds 2018 (volledige openbaarmaking: voordat ik mijn bedrijf mede-oprichtte, werkte ik bij Google en was ik betrokken bij projecten die federated learning gebruikten).

Samenvattend helpt gefedereerd leren een aantal obstakels bij machine learning te overwinnen, waaronder de behoefte aan grote hoeveelheden gegevens, de kosten van computerbronnen en gegevensopslag en -overdracht, de uitdaging van gegevenshomogeniteit en zorgen over privacy en regelgeving. Het stelt organisaties in staat om samen te werken aan machine learning-projecten zonder in te boeten aan gegevensprivacy, het gebruik van machine learning en toegang tot grote, diverse trainingsgegevens te democratiseren, wat leidt tot robuustere en beter presterende modellen.

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?