Zephyrnet-logo

5 lessen die McKinsey me heeft geleerd waardoor je een betere datawetenschapper wordt

Datum:

5 lessen die McKinsey me heeft geleerd waardoor je een betere datawetenschapper wordt

Hoe u zich onderscheidt van uw collega's in de datawereld.


By Tessa Xi, Data scientist



Foto door Dan Dimmock on Unsplash

 

Datawetenschap is een van de populairste vakgebieden van de afgelopen jaren en heeft talloze getalenteerde mensen aangetrokken om mee te doen aan de competitie voor een plaats in de datawetenschapsteams van topbedrijven. Er zijn talloze artikelen die je leren hoe je dat moet doen voorbereiding voor DS-interviews en "onderscheid u van de rest van de geïnterviewden", maar de reis stopt zeker niet bij het aannemen van een baan. Een jobaanbieding krijgen is slechts de eerste stap; niet veel mensen praten echter over hoe u zich kunt onderscheiden van de rest van de wereld gehuurd datawetenschappers zodra u de interviews hebt doorstaan ​​en bij het bedrijf komt werken.

Tijdens mijn jaren bij McKinsey had ik het geluk om samen te werken met talloze slimme datawetenschappers van McKinsey en topbedrijven die ik heb bediend, en ik heb gezien wat de gemeenschappelijke kenmerken zijn van degenen die de hoogste beoordelingen en lof krijgen van zowel partners als klanten. En misschien verrassend voor sommigen van jullie, de best presterende datawetenschappers zijn niet noodzakelijkerwijs degenen die de chicste modellen bouwen of degenen die de meest efficiënte code schrijven (ze moeten natuurlijk een vrij hoge lat van technische vaardigheden halen om te worden aangenomen) maar degenen die een aantal belangrijke bezitten “zachte vaardigheden” bovenop hun analytisch vermogen. Dit artikel vat mijn ervaring en observaties uit mijn tijd bij McKinsey samen in 5 lessen die je zullen helpen een betere datawetenschapper te worden.


via GIPHY


 

Als gegevensmens die van precisie houdt, zou ik erop willen wijzen dat hoewel 'datawetenschapper' als titel tegenwoordig een breed scala aan banen in de industrie omvat, ik me in dit artikel vooral richt op tips voor datawetenschappers die van invloed zijn op zakelijke beslissingen in welke vorm dan ook (in plaats van die in meer onderzoeksgerichte "core data science" -rollen).

Les 1. Top-down communicatie is de sleutel

 
Top-down communicatie, of het piramideprincipe, werd bedacht en gepopulariseerd door McKinsey-partner Barbara Minto en wordt door veel mensen gezien als de meest efficiënte communicatiestructuur als het gaat om zaken (of zelfs privé). Ook al is het een tweede natuur voor sommige mensen, zoals strategische consultants, veel datawetenschappers struikelen over dit communicatiefront. Het idee is simpel: als je een idee/argument probeert over te brengen, is dat het meest efficiënt en voor het publiek het gemakkelijkst te volgen als je begint met een sleutelbericht, gevolgd door meerdere belangrijkste argumenten ondersteuning van deze kernboodschap; indien nodig kan elk argument worden gevolgd door ondersteunende gegevens.

Het toepassen van top-down communicatie is voordelig om de volgende redenen:

  1. De belangrijkste afhaalmaaltijd staat centraal: als je een TLDR aan het begin van een e-mail/memo of een samenvatting aan het begin van een onderzoekspaper, zult u het belang hiervan begrijpen. Als u de belangrijkste boodschap vooraf heeft, zorgt u ervoor dat uw publiek een algemeen idee krijgt, zelfs als ze niet alle details begrijpen.
  2. De presentatie/communicatie kan eenvoudig worden afgestemd op verschillende doelgroepen: u kunt één set communicatie voorbereiden en deze op het niveau van de "kernboodschap" houden met de belangrijkste argumenten voor de c-level executives en deze uitbreiden met details voor collega's en andere analytische doelgroepen die geïnteresseerd zijn in de in-the-weeds dingen.

Helaas voor datawetenschappers, wier werk meestal diepgaande analyses uitvoert, is deze communicatiestructuur misschien niet vanzelfsprekend en kan deze contra-intuïtief zijn. Veel te vaak zie ik hoe datawetenschappers een presentatie of communicatie beginnen met diepgaande details en het publiek de weg kwijt raken zonder de kernboodschap over te brengen.

Hoe het te oefenen: Een gemakkelijke manier om dit te oefenen, is door vóór de vergadering uw gedachten op te schrijven op basis van deze structuur, zodat u op schema blijft bij het communiceren van uw belangrijkste bevindingen uit uw analyse. Het is ook nuttig om regelmatig een stapje terug te doen en jezelf af te vragen welk probleem je eigenlijk probeert op te lossen; dat zou de belangrijkste boodschap moeten zijn die u overbrengt.



Afbeelding door auteur

 

Les 2. Wees zelf de "vertaler".

 
Als je kijkt naar McKinsey's gesuggereerd blauwdruk voor de data-organisaties van bedrijven, benadrukt het het belang van een rol genaamd "vertaler" die zogenaamd functioneert als de brug van communicatie tussen bedrijfs- en datateams die analytische inzichten vertalen naar bruikbare inzichten voor het bedrijf (ik neem aan dat deze rol gedeeltelijk is ontstaan ​​uit de frustratie van het punt dat ik heb gemaakt boven). Ik weet zeker dat je als datawetenschapper gevraagd bent om "het uit te leggen zoals je het aan een vijfjarige uitlegt" of "het in gewoon Engels uit te leggen". De datawetenschappers die zich onderscheiden van de rest zijn degenen die precies dat kunnen: functioneren als hun eigen vertaler; desgevraagd kunnen ze hun ML-modellen goed uitleggen aan CEO's die noch een analytische achtergrond noch tijd hebben om whitepapers te lezen, en ze kunnen de resultaten van hun analyses altijd koppelen aan de zakelijke impact. Die datawetenschappers worden om de volgende redenen gewaardeerd:

  1. Het is moeilijk om "vertalers" te krijgen van niet-analytische mensen: McKinsey heeft geprobeerd een groep strategische adviseurs op te leiden tot "vertalers" voor verschillende analytische studies; maar naar mijn idee nooit gelukt. De reden is vrij eenvoudig: om de belangrijkste conclusies van complexe analyses nauwkeurig uit te leggen en kanttekeningen nauwkeurig weer te geven, heb je een analytische instelling en een diep begrip nodig, wat niet kan worden bereikt door een paar weken analytische bootcamp-training. Hoe verklaar je bijvoorbeeld het aantal clusters dat je hebt gekozen voor K-middelen als je de elleboogmethode niet kent? Hoe leg je de elleboogmethode uit als je niet weet wat SSE is? Als DS kun je de tijd die je besteedt aan het geven van deze meestal mislukte spoedcursus waarschijnlijk beter besteden aan het ontwikkelen van je eigen communicatiestijl en het zelf bedenken van de vertaling.
  2. Verlies van precisie kan worden voorkomen als DS hun eigen analyses kan verklaren: ik geloof dat de meeste mensen het 'telefoon'-spel of een variant daarvan hebben gespeeld. Hoe langer de informatie wordt doorgegeven, hoe moeilijker het is om de nauwkeurigheid te behouden. Stel je nu voor dat hetzelfde proces gebeurt met je analysewerk; als u op anderen vertrouwt om uw werk uit te leggen/vertalen, kan de boodschap nogal afwijken van de werkelijkheid wanneer deze bij de eindgebruiker aankomt.


via GIPHY


 

Hoe dit te oefenen: Oefen dit met een vriend (bij voorkeur iemand zonder enige analytische achtergrond) door uw model/analyses aan hen uit te leggen (uiteraard zonder gevoelige informatie vrij te geven). Dit is ook een goede manier om kennislacunes in je aanpak te ontdekken; zoals "The Great Explainer" Richard Feynman gelooft, als je er niet achter kunt komen hoe je iets op een eenvoudige manier moet uitleggen, komt dat vaak doordat je het zelf niet goed hebt begrepen.

Les 3. Oplossingsgericht zijn is de № 1 regel

 
Dit beperkt zich niet tot datatalenten; het is essentieel voor mensen in elke functie/rol van een bedrijf. Het is natuurlijk super waardevol om problemen te kunnen identificeren en zorgen te uiten, maar wat nog meer gewaardeerd wordt, is het vermogen om mogelijke oplossingen voor te stellen. Zonder een oplossingsgerichte persoon in de kamer, kunnen discussies vaak in cirkels verlopen, obsessie over problemen in plaats van proberen een pad voorwaarts te vinden.

Bij de meeste topadviesbureaus is oplossingsgerichtheid de № 1-regel en naar mijn mening zou deze aanpak ook naar de technische wereld moeten worden overgebracht. Als datawetenschapper kom je vaak in frustrerende situaties terecht waarin mensen belachelijke gegevensvragen stellen vanwege hun gebrek aan analytische achtergrond. Ik heb ontelbare DS gezien die niet wisten hoe ze met die situaties moesten omgaan en faalden in stakeholdermanagement omdat ze de constante nee-zegger waren. In plaats van ze af te sluiten, moet u oplossingsgericht zijn en hen helpen de vraag opnieuw te definiëren en de reikwijdte te beperken met uw beter begrip van de gegevens en analytische hulpmiddelen.

Oplossingsgericht zijn betekent niet dat je nooit ergens nee tegen kunt zeggen of altijd de perfecte oplossing al op papier moet hebben; het betekent dat je altijd een "maar hoe zit het met ..." moet hebben na elk "Nee" dat je zegt.

Hoe dit te oefenen: Als u een probleem tegenkomt, neem dan even de tijd om na te denken over mogelijke manieren waarop u het kunt oplossen voordat u het aan uw team of manager meldt. Gebruik je creativiteit als het gaat om het oplossen van problemen en wees niet bang om degene te zijn die een nieuwe oplossing voorstelt. Het is ook handig om vanuit te vertakken uw werkstroom en leer meer over het bedrijf en het werk van andere teams. Door het grote plaatje te zien, kunt u meestal de punten met elkaar verbinden en naar creatieve oplossingen leiden.


via GIPHY

les4. Interpreteerbaarheid overtreft precisie als het gaat om modellering in een zakelijke context

Niemand wil churn echt voorspellen, iedereen probeert churn te begrijpen


Tegenwoordig, wanneer elk afzonderlijk bedrijf modellen bouwt om churn te voorspellen, is het moeilijk om een ​​stap terug te doen om jezelf af te vragen waarom we churn in de eerste plaats wilden voorspellen. Bedrijven willen churn voorspellen, zodat ze een bruikbare oplossing kunnen vinden om dit te voorkomen. Dus als uw model de CEO vertelt "de derdemachtswortel van #van webbezoeken is een van de belangrijkste kenmerken die churn aangeeft”, wat kan hij met die informatie doen? Waarschijnlijk niets...

Als datawetenschapper concentreerde ik me, zoals velen van jullie, uitsluitend op nauwkeurigheid als de successtatistieken als het gaat om modellering. Maar ik kwam geleidelijk tot het besef dat het verhogen van de nauwkeurigheid van 96% naar 98% door onverklaarbare functies toe te voegen en hyperparameters nauwkeurig af te stemmen, niets betekent voor het bedrijf als je het niet kunt koppelen aan zakelijke impact (nogmaals, dit geldt alleen voor zakelijke- geconfronteerd met DS, voor bepaalde gebieden van ML betekent deze toename waarschijnlijk de wereld).

Het is ook moeilijk om geloofwaardigheid te winnen van de leidinggevenden op C-niveau als het model een zwarte doos is. Een model is een hulpmiddel om zakelijke beslissingen aan het einde van de dag te begeleiden, dus het zou niet moeten verbazen dat de waarde ervan grotendeels gebaseerd is op de bruikbaarheid en interpreteerbaarheid.

Hoe dit te oefenen: Houd bij het bouwen van modellen of het uitvoeren van analyses altijd de businessimpact voor ogen. Vermijd bij het bouwen van modellen willekeurige interactieve functies naar het model te gooien en hoop dat een van hen blijft hangen; in plaats daarvan moet u goed nadenken over de feature-engineeringfase voordat u zelfs maar begint met het bouwen van het model. Het opschrijven van de zakelijke suggesties die uit het model/de analyse komen, zal u ook helpen bij het opnieuw evalueren van de ontwerpkeuzes die u hebt gemaakt bij het bouwen van het model.

Les 5. Zorg ervoor dat je een hypothese hebt, maar ben er niet mee getrouwd

 



Afbeelding door auteur

 

Het is belangrijk om hypothesen als uitgangspunt te hebben voor de meeste analyses, van functieverkenning tot verkennende gegevensanalyses (EDA). Zonder hypothesen heeft u geen richting voor hoe u de gegevens voor EDA moet splitsen en dobbelen of welke functies u eerst moet testen. Zonder hypothesen heeft het zelfs geen zin om AB-testen uit te voeren (daarom heet het hypothesetesten). Maar af en toe zie ik datawetenschappers die zich zonder duidelijke hypothese in de head-down analysefase verdiepen en later verdwalen in een konijnenhol. Of nog vaker laten datawetenschappers het proces van het structureren van hypothesen volledig over aan teamleden die geen inzicht hebben in de gegevens en realiseren zich later dat er niet genoeg gegevens zijn om die hypothesen te testen. De beste benadering is naar mijn mening dat datawetenschappers vanaf het begin betrokken zijn bij die hypothese-brainstormsessies en hypothesen gebruiken om latere analyses te begeleiden en te prioriteren.

Hoe belangrijk hypothesen ook zijn, ze moeten als uitgangspunt dienen, niet als eindpunt. Keer op keer heb ik veel datawetenschappers (of mensen die met datawetenschappers werken) zien vasthouden aan een hypothese ondanks tegenstrijdige bevindingen. Deze "loyaliteit" aan de oorspronkelijke hypothesen zou ertoe leiden dat gegevens worden gesnuffeld en gegevens worden gemasseerd om in een bepaald verhaal te passen. Als je bekend bent met "Simpsons paradox Simpson”, begrijp je de kracht van data bij het vertellen van het ‘verkeerde verhaal’. Goede datawetenschappers moeten in staat zijn om de data-integriteit te behouden en het verhaal zo te draaien dat het bij de data past in plaats van andersom.

Hoe dit te oefenen: Het is belangrijk om zakelijk inzicht en inzicht op te bouwen om tot goede hypothesen te komen. Houd de hypothesen in gedachten om u te begeleiden tijdens het verkennen van gegevens, maar wees ruimdenkend om toe te geven wanneer de gegevens u een ander verhaal vertellen dan uw aanvankelijke "onderbouwde gok". Als u een goed zakelijk inzicht heeft, kunt u uw oorspronkelijke theorie gaandeweg aanpassen en uw verhaal aanpassen aan de hand van de gegevens.

Als het gaat om zakelijke rollen, hebben mensen de neiging om te denken dat talenten in twee categorieën kunnen worden verdeeld: de analytische en de strategische, alsof de twee soorten vaardigheden zich aan de tegenovergestelde kanten van het spectrum bevinden. Nou, ik zal je een geheim verklappen, de beste analytische talenten zijn degenen die ook de strategische/zakelijke kant van de zaak begrijpen en begrijpen hoe te communiceren met zakelijke belanghebbenden, en de beste talenten in strategische rollen hebben een bepaald niveau van begrip van analyses en gegevens.

 
Bio: Tessa Xi is momenteel een datawetenschapper in de AV-industrie en ex-McKinsey datawetenschapper; Fervente reiziger, duiker en schilder.

ORIGINELE. Met toestemming opnieuw gepost.

Zie ook:


PlatoAi. Web3 opnieuw uitgevonden. Gegevensintelligentie versterkt.

Klik hier om toegang te krijgen.

Bron: https://www.kdnuggets.com/2021/07/5-lessons-mckinsey-taught-better-data-scientist.html

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?