Zephyrnet-logo

5 fouten die ik wou dat ik had vermeden in mijn datawetenschapscarrière

Datum:

5 fouten die ik wou dat ik had vermeden in mijn datawetenschapscarrière

Iedereen maakt fouten, wat een goede zaak kan zijn als ze in de loop van de tijd leiden tot leren en verbeteringen. Maar we kunnen ook proberen eerst van anderen te leren om onze persoonlijke groei te versnellen. Overweeg om te beginnen deze lessen die u op de harde manier hebt geleerd, zodat u dat niet hoeft te doen.


By Tessa Xi, Senior Data Scientist bij Cruise.

Foto door bruce mars on Unsplash.

Toen ik voor het eerst de overstap maakte van financiën naar datawetenschap, had ik het gevoel dat ik aan de top van de wereld stond - ik kreeg een baan in mijn droomveld, mijn carrièrepad staat vast, ik zal gewoon mijn hoofd naar beneden houden en hard werken, wat kan er fout gaan? Nou, er waren een paar dingen... Het volgende jaar als datawetenschapper waren er verschillende fouten waarvan ik blij ben dat ik mezelf die vroeg in mijn carrière betrapte. Op deze manier had ik tijd om na te denken en koers te corrigeren voordat het te laat was. Na een tijdje realiseerde ik me dat deze fouten vrij vaak voorkomen. In feite heb ik veel DS om me heen nog steeds deze fouten zien maken, niet wetende dat ze hun datacarrière op de lange termijn kunnen schaden.

Als mijn "5 lessen die McKinsey me heeft geleerd waardoor je een betere datawetenschapper wordt” waren wat ik van de besten heb geleerd, de lessen in dit artikel zijn de lessen die ik op de harde manier heb geleerd, en ik hoop dat ik je kan helpen voorkomen dat je dezelfde fouten maakt.

Fout 1: Jezelf zien als een voetvolk in plaats van een gedachtepartner

Toen we opgroeiden, zijn we altijd beoordeeld op hoe goed we de regels en bevelen kunnen volgen, vooral op school. Je wordt de beste student als je het leerboek volgt en examens oefent en gewoon hard werkt. Veel mensen lijken deze 'voetsoldaat'-mentaliteit in hun werkomgeving te dragen. Naar mijn mening is dit precies de mentaliteit die veel datawetenschappers belemmert om hun impact te maximaliseren en zich te onderscheiden van hun collega's. Ik heb gezien dat veel DS, vooral junioren, denken dat ze niets kunnen bijdragen aan het besluitvormingsproces en zich liever op de achtergrond terugtrekken en passief beslissingen nemen die voor hen zijn genomen. Dit zet een vicieuze cirkel in gang: hoe minder u bijdraagt ​​aan die discussies, hoe kleiner de kans dat belanghebbenden u bij toekomstige vergaderingen zullen betrekken en hoe minder kans u krijgt om in de toekomst bij te dragen.

Laat me je een concreet voorbeeld geven van het verschil tussen een voetvolk en een gedachtepartner in het geval van modelontwikkeling. In de dataverzamelings- en brainstormbijeenkomsten maakte de oude ik passief aantekeningen van de suggesties van belanghebbenden, zodat ik ze later 'perfect' kan implementeren. Toen iemand een functie voorstelde waarvan ik wist dat we er geen gegevens over hadden, zou ik niets zeggen op basis van de veronderstelling dat ze meer senior zijn en dat ze iets moeten weten dat ik over het hoofd heb gezien. Maar raad eens, dat deden ze niet. Ik zou later geconfronteerd worden met de situatie dat 50% van de functies die we hebben gebrainstormd, aanvullende gegevensverzameling zou vereisen die onze projectdeadline in gevaar zou brengen. Als gevolg daarvan bevond ik me uiteindelijk vaak in de ongewenste positie van de slecht nieuws-dragende boodschapper. Omdat ik tegenwoordig een denkpartner wil zijn, betrek ik mezelf vroeg in het gesprek en maak ik gebruik van mijn unieke positie als de persoon die het dichtst bij de gegevens staat. Op deze manier kan ik in een vroeg stadium de verwachtingen van belanghebbenden managen en suggesties doen om het team vooruit te helpen.

Hoe dit te vermijden:

  • Zorg ervoor dat je je niet inhoudt in vergaderingen waarin je vanuit dataperspectief iets kunt bijdragen: zijn de definities van metrics van stakeholders voldoende voor wat ze willen meten? Zijn er gegevens beschikbaar voor het meten van de set metrieken? Zo niet, kunnen we proxy's vinden voor de gegevens die we WEL hebben?
  • Bedrieger syndroom is echt, vooral onder junior DS. Zorg ervoor dat je je hiervan bewust bent, en wanneer je je afvraagt ​​of je iets moet zeggen dat "anderen misschien al hebben bedacht" of een "domme verhelderende vraag" moet stellen, MOET JIJ.
  • Blijf nieuwsgierig naar waar andere mensen mee bezig zijn. Er zijn veel gelegenheden geweest waarbij ik ontdekte dat ik waarde kon toevoegen door hiaten op te merken die andere mensen misschien over het hoofd hebben gezien vanwege hun gebrek aan begrip van de bedrijfsgegevens.

Fout 2: Duik in een specifiek gebied van datawetenschap

Wil ik data engineer of data scientist worden? Wil ik werken met marketing & sales data of de geospatiale analyse doen? Het is je misschien opgevallen dat ik de term DS tot dusverre in dit artikel als algemene term heb gebruikt datagerelateerde loopbaantrajecten (bijv. data engineer, data scientist, data analist, etc.). Dat komt omdat de scheidslijnen tussen deze titels tegenwoordig zo vaag zijn in de datawereld, vooral in kleinere bedrijven. Ik heb gezien dat veel datawetenschappers zichzelf zien als ENIGE datawetenschappers die modellen bouwen en geen aandacht besteden aan zakelijke aspecten of data-ingenieurs die zich alleen richten op datapipelining en niets willen weten over de modellering die in het bedrijf.

De beste datatalenten zijn degenen die meerdere petten kunnen dragen of op zijn minst de processen van andere datarollen kunnen begrijpen. Dit is vooral handig als je wilt werken in een startup in een vroeg stadium of in een groeifase, waar functies misschien nog niet zo gespecialiseerd zijn, en er wordt van je verwacht dat je flexibel bent en een verscheidenheid aan gegevensgerelateerde verantwoordelijkheden dekt. Zelfs als je een duidelijk gedefinieerd functieprofiel hebt, kun je, naarmate je meer ervaring opdoet, ontdekken dat je geïnteresseerd bent in een overstap naar een ander type gegevensrol. Deze spil zal veel gemakkelijker zijn als je jezelf en je vaardigheden niet in de enge focus van één specifieke rol zou plaatsen.

Hoe dit te vermijden:

  • Nogmaals, wees nieuwsgierig naar de projecten waar andere datarollen aan werken. Plan periodieke bijeenkomsten met collega's om met elkaar te praten over interessante projecten of laat verschillende datateams periodiek hun werk/projecten met elkaar delen.
  • Als je op het werk geen andere datarollen kunt leren kennen, probeer dan de datavaardigheden die je niet gebruikt in je vrije tijd bij te houden/oefenen. Als je bijvoorbeeld een data-analist bent en modelleren al een tijdje niet meer hebt gedaan, overweeg dan om de vaardigheden te oefenen via externe projecten zoals een Kaggle-competitie.

Fout 3: De ontwikkeling in het veld niet bijbenen

Zelfgenoegzaamheid is dodelijk

Elke soldaat weet dit, en elke DS zou dat ook moeten weten. Zelfgenoegzaam zijn over uw datavaardigheden en niet de tijd nemen om nieuwe te leren, is een veelgemaakte fout. Dit doen in het dataveld is gevaarlijker dan op sommige andere gebieden, omdat datawetenschap een relatief nieuw veld is dat nog steeds ingrijpende veranderingen en ontwikkelingen doormaakt. Er worden voortdurend nieuwe algoritmen, nieuwe tools en zelfs nieuwe programmeertalen geïntroduceerd.

Als je niet die ene datawetenschapper wilt zijn die pas in 2021 weet hoe je STATA moet gebruiken (hij bestaat, ik heb met hem gewerkt), dan moet je de ontwikkelingen in het veld bijbenen.

Laat jij dit niet zijn (GIF door GIPHY).

Hoe dit te vermijden:

  • Meld u aan voor online lessen om nieuwe concepten en algoritmen te leren kennen of om de concepten die u al kent, maar die u al een tijdje niet meer hebt gebruikt, op te frissen. Het vermogen om te leren is een spier die iedereen zou moeten blijven oefenen, en een leven lang leren is waarschijnlijk het beste cadeau dat je jezelf kunt geven.
  • Meld u aan voor een DS-nieuwsbrief of volg een DS-blogger/publicatie op Medium en ontwikkel een gewoonte om het DS-'nieuws' te volgen.

Fout 4: Je analytische spier overspannen

Als je alleen een hamer hebt, lijkt alles op een spijker. Wees niet die DS die ML op alles probeert te gebruiken. Toen ik voor het eerst de wereld van datawetenschap binnenstapte, was ik zo enthousiast over alle mooie modellen die ik op school leerde en ik kon niet wachten om ze allemaal uit te proberen op echte problemen. Maar de echte wereld is anders dan academisch onderzoek, en de 80 / 20-regel speelt altijd.

In mijn vorige artikel over “5 lessen die McKinsey me heeft geleerd”, schreef ik over hoe zakelijke impact en interpreteerbaarheid soms belangrijker zijn dan de extra paar procentpunten van de nauwkeurigheid van uw model. Soms is een op aannames gebaseerd Excel-model misschien logischer dan een meerlagig neuraal netwerk. Overspannen in die gevallen uw analytische spieren niet en maak uw benadering niet overdreven. Span in plaats daarvan uw zakelijke spieren aan en wees de DS die ook zakelijk inzicht heeft.

Hoe dit te vermijden:

  • Beschik over een volledige reeks analytische vaardigheden/tools in je arsenaal, van eenvoudige Excel tot geavanceerde ML-modelleringsvaardigheden, zodat je altijd kunt beoordelen welke tool het beste is om in de situatie te gebruiken en geen pistool mee te nemen naar een mesgevecht.
  • Begrijp de zakelijke behoeften voordat u zich verdiept in de analyse. Soms vroegen belanghebbenden om een ​​ML-model omdat het een populair concept is en ze onrealistische verwachtingen hebben over wat ML-modellen kunnen doen. Het is jouw taak als DS om de verwachtingen te managen en hen te helpen betere en eenvoudigere manieren te vinden om hun doelen te bereiken. Herinneren? Wees een gedachtepartner, geen soldaat.

Fout 5: Denken dat het bouwen van een datacultuur iemand anders zijn taak is

In mijn artikel “6 essentiële stappen om een ​​geweldige datacultuur op te bouwen”, schreef ik over hoe het leven van datawetenschappers verschrikkelijk en onproductief kan zijn als het bedrijf geen geweldige datacultuur heeft. Ik heb zelfs veel DS horen klagen over onproductieve ad-hocgegevensverzoeken die gemakkelijk door belanghebbenden op een zelfvoorzienende manier moeten worden afgehandeld (bijvoorbeeld het wijzigen van een aggregatie van maandelijks naar dagelijks in Looker, dat letterlijk uit twee klikken bestaat ). Denk niet dat het veranderen van die cultuur de taak van iemand anders is. Als u wijzigingen wilt zien, maakt u deze. Wie is er immers beter gepositioneerd om de datacultuur op te bouwen en belanghebbenden over data te informeren dan datawetenschappers zelf? Helpen bij het opbouwen van de datacultuur in het bedrijf zal uw leven en uw stakeholders een stuk gemakkelijker maken.

Hoe dit te vermijden:

  • Maak het uw verantwoordelijkheid om trainingen te geven voor de niet-analytische belanghebbenden en om zelfbedieningsbronnen te ontwikkelen.
  • Zorg ervoor dat u begint te oefenen wat u predikt, begin met het koppelen van zoekopdrachten aan dia's, koppel gegevensbronnen van waarheid aan documenten en begin met het documenteren van uw code en databases. Een datacultuur bouw je niet van de ene op de andere dag op, dus geduld is zeker nodig.

Ik wil er wel op wijzen dat het OK is om fouten te maken in je carrière. Het belangrijkste is om van die fouten te leren en ze in de toekomst te vermijden. Of nog beter, schrijf ze op om anderen te helpen voorkomen dat ze dezelfde fouten maken.

ORIGINELE. Met toestemming opnieuw gepost.

Bio: Tessa Xi is een ervaren Advanced Analytics Consultant met kennis van datawetenschap, SQL, R, Python, consumentenonderzoek en economisch onderzoek met een sterke technische achtergrond na een masteropleiding in Financial Engineering van MIT.

Zie ook:


PlatoAi. Web3 opnieuw uitgevonden. Gegevensintelligentie versterkt.
Klik hier om toegang te krijgen.

Bron: https://www.kdnuggets.com/2021/07/5-mistakes-data-science-career.html

spot_img

Laatste intelligentie

spot_img