Zephyrnet-logo

Een dag uit het leven van een Machine Learning Engineer

Datum:

Foto door Sigmund on Unsplash

 

Het is goed om beter inzicht te krijgen in hoe het dagelijks leven van anderen eruitziet. Veel studenten zijn meer gefocust op de vaardigheden, cursussen en kennisniveau die ze nodig hebben om ervoor te zorgen dat ze zo goed mogelijk worden. 

Maar soms hoef je het alleen maar uit de mond van het paard te horen. Voor degenen onder jullie die nog nooit van dat idioom hebben gehoord, betekent het: Als je iets rechtstreeks uit de mond van het paard hoort, hoor je het van de persoon die er directe persoonlijke kennis van heeft.

Laten we leren van Ibrahim Mukherjee

Ibrahim Mukherjee is een LSE Graduate in BSc Management (Hons) en een datawetenschapper. Na zijn afstuderen aan de LSE in 2008 trad Ibrahim toe tot de olie- en gasindustrie als financieel analist in Trinidad, Singapore, het VK (Aberdeen, Reading, Londen), Noorwegen, Maleisië, Tunesië en Roemenië. 

 

Een dag uit het leven van een Machine Learning Engineer
Ibrahim Mukherjee

 

Dit alles terwijl een latente interesse in gedragseconomie en neurowetenschap bij het lezen van de werken van Daniel Kahneman (Thinking Fast and Slow) en Dan Ariely (Predictably irrational) heeft geleid tot een tweede carrière in Machine Learning en Artificial Intelligence. 

Ibrahim is geïnteresseerd in hoe de hersenen betekenis abstraheren van gebeurtenissen en hoe menselijke cognitie zich onderscheidt van algemene machine learning en patroonherkenning. Naast werk leest Ibrahim graag over wetenschapsfilosofie, religieuze psychologie, cognitieve neurowetenschappen, menselijke reacties op stress, Bayesiaanse methoden en schrijfsoftware.

Hoe ziet een dag in het leven als ML Engineer eruit?

Als ML-engineer besteed ik veel tijd aan 3 hoofdtaken:

  1. Zakelijke behoeften begrijpen 
  2. Informatie verzamelen 
  3. Een haalbare oplossing bieden voor een zakelijk probleem op basis van 1&2 

Hoewel dit relatief eenvoudig klinkt, neemt de complexiteit van de verzamelde gegevens en de gegenereerde resultaten toe naarmate de organisatie waarvoor u werkt groter wordt. 

Laten we elk van deze achtereenvolgens bekijken:

Zakelijke behoeften begrijpen 

Cesar Hidalgo maakt in zijn boek, Why Information Grows, een zeer interessante observatie: als je van bovenaf naar een stad kijkt wanneer een luchtvaartmaatschappij op het punt staat te landen, lijkt het opmerkelijk veel op een printplaat in een computer (een CPU) waarop is ingezoomd. Een stad is een rekeneenheid, en dat geldt ook voor elk bedrijf. Het kan worden geabstraheerd als een algoritme - er is een invoer, een berekening waarbij we die invoer verwerken en er is een uitvoer. 

Als het om een ​​bedrijf gaat, is de berekening het product of de dienst die het bedrijf produceert. Voor een kapper kan de grondstof of input een schaar zijn, de huurruimte voor de kapperszaak, spiegels, stoelen, barricades, etc. het product is een knipbeurt. Geld is in dit geval de opslag van de waarde van die uitvoer. Hoe hoger de kwaliteit en/of kwantiteit van de output, hoe hoger de waarde van de output meestal is. Hierop zijn uitzonderingen: zaken als negatieve externe effecten van de verbrandingsmotor (die mogelijk in toenemende mate door de overheid worden belast) en liefdadigheidsinstellingen die effectieve goodwill produceren. Dit is echter een algemeen resultaat. 

Het is de taak van een datawetenschapper, in plaats van een deskundige datawetenschapper, om de zakelijke propositie te begrijpen. Wat is de input, wat is de output? 

Dan zou de datawetenschapper categorisch en systematisch werken om de problemen in het bedrijf te begrijpen. Wat kan het aanbod van het bedrijf verbeteren, de prijs die het bedrijf ontvangt, of de inkoop van grondstoffen verbeteren, of enig ander aspect van de logistiek dat begint bij de input en eindigt in de output van het bedrijf? 

Het tweede waar je naar moet kijken, is het verzamelen van gegevens

Voordat ik hier dieper op inga, een waarschuwing voor de onoplettende datawetenschapper die het best kan worden uitgelegd in een beroemde oefening in voorzichtigheid uit de Tweede Wereldoorlog. Toen de geallieerden de vliegtuigen wilden versterken voor bombardementen, keken ze naar de frequentie van kogelgaten in de vliegtuigen die terugkeerden. De meeste datawetenschappers of operations research executives die op dat moment werkten, waren van mening dat ze de delen van het vliegtuig met meer kogelgaten moesten versterken. 

Een in Hongarije geboren wiskundige, Abraham Wald, dacht daar anders over. Hij keek naar het versterken van de delen van het vliegtuig die geen kogelgaten hadden. De reden hiervoor was dat het vliegtuig dat in die gebieden werd geraakt, nooit echt terugkwam. Ze werden neergehaald. 

 

Een dag uit het leven van een Machine Learning Engineer
Het vliegtuig uit het overlevingsvooroordeel artikel op Wikipedia

 

Data is dus maar een deel van het verhaal. Zonder een goed gedegen begrip van de mechanica van het bedrijf doen gegevens niet veel. Het kan leiden tot verkeerde beslissingen in grote bedrijven waar oplossingen kleinschalig kunnen zijn in termen van de mate van verbetering of efficiëntie die ze bieden. In die gevallen is een goed begrip van het bedrijf van cruciaal belang. 

Het verzamelen van gegevens vindt plaats in de vorm van spreken met veel zakelijke belanghebbenden en het leren begrijpen van de gegevens in het bedrijf. Gegevens kunnen zich heel goed verbergen in silo's binnen het bedrijf en het is de taak van de datawetenschapper om tot één enkele waarheidsbron te komen, de verschillende gegevenspunten te doorzoeken om de gegevens te begrijpen en de meest relevante en geschikte onderdelen voor analyse te kiezen. Niet alle gegevens zijn vereist en een deel van de vaardigheid is om te kunnen onderscheiden wat belangrijk is en wat niet. Om het signaal van de ruis te scheiden. Gegevens incrementeel toevoegen aan een bestaand stuk analyse is altijd mogelijk, net als het verwijderen van gegevenssets. De sleutel is echter om een ​​kleiner aantal variabelen te vinden die belangrijk zijn om de zakelijke behoefte op te lossen. 

Dit brengt ons bij de belangrijkste gouden regel. Alles moet waarde toevoegen

Bedrijven zijn uiteindelijk geldscheppende proposities in een kapitalistisch kader. Als de analyse geen manier biedt om geld te besparen of geld te verdienen, is het waardeloos. Dat mag dan helemaal niet. Dit is belangrijk en essentieel voor de hele propositie van datawetenschap. Het moet een belangrijk actiepunt of richting geven aan het management en/of belanghebbenden om een ​​monetaire toegevoegde waarde te creëren – hetzij rechtstreeks in termen van kostenbesparing of meer winst maken, hetzij in “zachte” termen zoals marketing of MVO. 

De datawetenschapper moet ook een verhalenverteller zijn. Zoals Steve Jobs zei: "de machtigste persoon ter wereld is de verhalenverteller". Het is van groot belang om de gegenereerde waarde voor de business te kunnen communiceren. Tenzij belanghebbenden de waarde 'zien' – is het bijna een betwistbaar punt dat de analyse waarde creëert omdat ze niet in staat of bereid zijn om het in actie te brengen. 

Het vertellen van de waardepropositie is daarom net zo belangrijk als het creëren van de waarde. Een datawetenschapper moet dus heel goed zijn in het overbrengen van deze inzichten. 

Ik wil Ibrahim Mukherjee bedanken voor de tijd die hij heeft genomen om ons een dag in zijn leven als Machine Learning Engineer uit te leggen. Het is belangrijk om inzicht te hebben in de benaderingen van mensen in hun loopbaan en hoe deze kunnen verschillen van die van jou of die van anderen om je carrière te verbeteren en te verbeteren.

Ik hoop dat dit helpt! Nogmaals bedankt, Ibrahim Mukherjee!

 
 
Nisha Arja is een datawetenschapper en freelance technisch schrijver. Ze is vooral geïnteresseerd in het geven van loopbaanadvies op het gebied van Data Science of tutorials en op theorie gebaseerde kennis rond Data Science. Ze wil ook de verschillende manieren onderzoeken waarop kunstmatige intelligentie de levensduur van de mens ten goede komt. Een scherpe leerling, die haar technische kennis en schrijfvaardigheid wil verbreden, terwijl ze anderen helpt te begeleiden.
 

spot_img

Laatste intelligentie

spot_img