Zephyrnet-logo

Word geen gecommoditiseerde datawetenschapper

Datum:

Wees uniek en val op (Foto door Ricardo Gomez Angel on Unsplash)

Een commodity is een basisgoed dat in de handel wordt gebruikt en dat uitwisselbaar is met andere goederen van hetzelfde type. Grondstoffen worden meestal gebruikt als input voor de productie van andere goederen of diensten. […] De kwaliteit van een bepaald product kan enigszins verschillen, maar is in wezen gelijk voor alle producenten.

-Investopedia

 
Granen zijn handelswaar. Rundvlees is een handelswaar. Aardgas, olie en ook goud zijn grondstoffen.

U, als datawetenschapper, hoort geen handelswaar te zijn.

Zijn datawetenschappers allemaal hetzelfde? Kunnen alle pennen met dezelfde vorm in elk gat passen dat een organisatie wil opvullen? Zijn het gewoon verwisselbare warme lichamen?

Natuurlijk niet. Datawetenschappers voeren gevarieerde taken uit in een grote verscheidenheid aan omgevingen en gebruiken enorm verschillende sets van technische en niet-technische vaardigheden om de vereisten van hun rol te kunnen vervullen.

Dat tenminste moet het geval zijn. Het lijkt er echter op dat steeds meer datawetenschappers het datawetenschapslandschap zien als een lijst met vakjes die moeten worden aangevinkt als het gaat om vaardigheden, in alle opzichten, waardoor een leger van gelijk opgeleide individuen ontstaat die strijden om de aandacht van werkgevers.

 
✔️ Basis programmeervaardigheden in Python
✔️ Een overzicht van het wetenschappelijke computerecosysteem van Python
✔️ Enig begrip van neurale netwerken en import tensorflow as tf
✔️ Basisprincipes van natuurlijke taalverwerking en het importeren van HuggingFace Transformers
✔️ Praktische kennis van de basisprincipes van computervisie
✔️ SQL, of in ieder geval hoe SELECT * FROM Customers WHERE Country='Canada';
✔️ Kennis van wat MLOps is, of je er nu wel of niet mee hebt gewerkt
 

Geweldig, nu heb je dezelfde vaardigheden als alle anderen.

Zo val je niet op. Belangrijker nog, zo doe je je werk niet. Als dit het geval was en elke organisatie hetzelfde nodig had voor een datawetenschapper, zouden ze gewoon de volgende van de stapel pakken, ongeacht de vaardigheden van een bepaald individu.

Begrijp me niet verkeerd: we moeten allemaal een solide basis bouwen waarop we onze eigen data science-vaardigheden kunnen ontwikkelen. Maar zelfs als u een gemiddeld tot deskundig niveau van kennis van de hierboven genoemde vaardigheden zou hebben - wat op zichzelf ongetwijfeld al indrukwekkend zou zijn - onderscheidt u zich op papier niet van anderen.

Je hebt de basis geleerd. Je hebt de vakjes aangevinkt. Het is tijd om daarop voort te bouwen.

Organisaties en individuen die verantwoordelijk zijn voor het inhuren van datawetenschappers weten vaak niet waar ze naar op zoek zijn... maar ze zijn wel op zoek iets! Het is tijd dat datawetenschappers opvallen, en daarvoor moet het woord 's' worden gebruikt: specialisatie.

 
Ik vermoed dat je in de datawetenschap terecht bent gekomen omdat je nieuwsgierig bent, een logische denker bent en aan interessante problemen wilt werken. Geen van deze kenmerken zou u moeten suggereren dat u dezelfde vaardigheden en expertise zou moeten verwerven die alle anderen hebben! Alles over de aangeboren kenmerken van een datawetenschapper schreeuwt "individueel", terwijl het algemene pad om er een te worden en de vaardigheden die men onderweg opdoet, "conformiteit" fluistert.

Om uw inzetbaarheid op de lange termijn te verzekeren, moet u zich onderscheiden van de massa, moet u zich onderscheiden, en daarvoor moet u uw individualiteit laten gelden. De dagen van de gegeneraliseerde datawetenschapper zijn voorbij, als ze al ooit echt hebben bestaan.

Bijscholing. Focus. specialiseren. Dit zijn de sleutels tot een lang leven in het data science-spel.

Eenhoorns bestaan ​​niet. Probeer in plaats daarvan een bedreigde diersoort te zijn.

Dat klopt, een bedreigde diersoort. Als je vaardigheden hebt, zowel technische als niet-technische, die anderen om je heen niet hebben, ben je een bedreigde diersoort. In het dierenrijk is dit misschien niet gunstig voor het voortbestaan ​​van een soort op de lange termijn, maar voor een inzetbare datawetenschapper is dat zeker het geval.

Dus, hoe kun je een bedreigde diersoort worden? Ontwikkel een gespecialiseerde vaardigheden, technisch of niet-technisch, of beide.

 
Er zijn tegenwoordig zoveel technische vaardigheden beschikbaar om aan je repertoire toe te voegen, dat het bijna belachelijk lijkt om er een op te sommen. Maar om aan te tonen dat dit niet het moeilijke proces hoeft te zijn dat u misschien denkt dat het is, zal ik dat doen.

Ten eerste willen we nadenken over technische vaardigheden in de zin van niche. Je hebt (vermoedelijk) het landschap van data science-vaardigheden al breed en oppervlakkig behandeld; het is tijd om het te overwegen door de dubbele lenzen van diepte en smalheid.

Er zijn 2 basismanieren die ik kan bedenken om het verwerven van "niche" technische vaardigheden te benaderen.

Nieuw en glanzend

 
Bij het verwerven van vaardigheden die vereist zijn voor de nieuwste technische whatzit, moet je een balans vinden tussen te vroeg en te laat zijn, wat een opwindende high wire-act kan zijn. Niemand is op zoek naar een expert in een nieuwe tool die gisteren uitkwam, maar als iedereen het eenmaal gebruikt, maken je vaardigheden je niet langer tot die bedreigde diersoort.

Een suggestie zou zijn om recentelijk ontwikkelde open source-tools te zoeken die nog moeten aanslaan maar echt veelbelovend zijn. Op de begane grond binnenkomen en wat bijdragen leveren, zou een geweldige manier zijn om jezelf te onderscheiden ten opzichte van die tool, vooral als het prime time gaat.

Beproefd en getest (maar niet mainstream)

 
Dit is de langzame verbranding. De tool bestaat al een tijdje, maar moet nog het succes behalen dat het waarschijnlijk zou moeten genieten. Ik denk dat JAX hier een goed voorbeeld van is. JAX bestaat al enkele jaren, het is van een lager niveau dan andere vergelijkbare tools, dus het heeft een aanhang van mensen die op zoek zijn naar dit voordeel, en zijn populariteit blijft groeien. Als u hier wat expertise toevoegt, onderscheidt u zich van de TensorFlow- of PyTorch-menigte, vooral als u bekend bent met al het bovenstaande.

Kijk, het gaat er niet noodzakelijkerwijs om dat je de andere dingen niet weet, maar om ze te kennen En iets anders.

 
Ik denk dat de 2 manieren waarop je onderscheid kunt maken als het gaat om niet-technische vaardigheden vrij duidelijk zijn, en we zullen deze hieronder bekijken.

Communicatie

 
Communicatie is de sleutel in datawetenschap. Niets nieuws te melden hier. Wat communicatie eigenlijk inhoudt, verandert echter. Kun je je voorstellen hoe weinig de vaardigheid om "ideeën effectief met meerdere collega's tegelijk te communiceren in een synchrone online vergaderomgeving" 3 jaar geleden begeerd zou zijn geweest?

Om jezelf tegenwoordig te onderscheiden, zou je misschien je eigen merk van buy-in-werving kunnen bedenken: besteed tijd aan het ontwikkelen van je artefacten die worden gebruikt om de resultaten van een project over te brengen, en het verhaal dat je eromheen bouwt. Dit is iets waar nieuwe datawetenschappers altijd de nadruk op leggen, maar vaak heeft de glimmende nieuwe tool of techniek voorrang. Er is niets mis mee om de persoon in het team te zijn naar wie anderen kijken voor het effectief verkopen van de resultaten en visie van het team aan andere belanghebbenden.

Domeindeskundigheid

 
Deze is een no-brainer. Wilt u uw machine learning-vaardigheden meenemen naar de financiële sector? Je kunt maar beter leren over de financiële sector!

Dit gaat verder dan de industriedomeinen; er zijn veel te veel mensen die natuurlijke taalverwerking aanvallen vanuit de technische kant die geen gedegen kennis hebben van taalkunde, en dat is te zien. Interesse om jezelf te onderscheiden in NLP? Pak wat taalkundige teksten op. Hetzelfde geldt voor computervisie: als je niets weet over tinten, interpolatie, Gaussiaanse ruis, enz., val dan op door te leren. Het zal je alleen maar helpen om binnen te komen waar je wilt passen.

 
Laten we het idee vergeten dat alle datawetenschappers X, Y en Z moeten kennen. Er zijn veel meer letters in het alfabet van vaardigheden, dus leer jezelf een E, een J of zelfs een kleine M.

En altijd…

 

Word geen gecommoditiseerde datawetenschapper
Afbeelding door auteur

 
 
Matthijs Mayo (@mattmayo13) is een datawetenschapper en de hoofdredacteur van KDnuggets, het baanbrekende online hulpmiddel voor gegevenswetenschap en machine learning. Zijn interesses liggen in natuurlijke taalverwerking, ontwerp en optimalisatie van algoritmen, leren zonder toezicht, neurale netwerken en geautomatiseerde benaderingen van machine learning. Matthew heeft een master in computerwetenschappen en een graduaat in datamining. Hij is te bereiken via editor1 op kdnuggets[dot]com.
 

spot_img

Laatste intelligentie

spot_img