Zephyrnet-logo

Banentrends in data-analyse: deel 2 – KDnuggets

Datum:

Door Andrea De Mauro en Mahantesh Pattadkal

 
Terwijl we verdergaan waar we gebleven waren in deel 1 van de blogreeks “Functietrends in data-analyse“Onze reis door de wereld van banentrends op het gebied van data-analyse en de rol van Natural Language Processing (NLP) gaat verder.
 

In deel 1 introduceerden we de “Functietrends op het gebied van data-analyse'-applicatie, die draait om het verzamelen van gegevens en het toepassen van NLP om deze te analyseren, mogelijk gemaakt door KNIME Analytics-platform. We bespraken de webscraping-fase die wordt gebruikt om live gegevens te verzamelen over de arbeidsmarkt voor data-analyse, gevolgd door het proces van het opschonen van de gegevens met behulp van NLP-technieken. Vervolgens introduceerden we een onderwerpmodel dat zeven homogene vaardigheden binnen vacatures onthulde. Dergelijke vaardigheden vertegenwoordigen de competenties en activiteiten die werkgevers in verschillende sectoren zoeken in professionals op het gebied van data-analyse.

In het tweede deel van de blogserie zullen we de geïdentificeerde vaardigheden beschrijven en enkele op data gebaseerde overwegingen maken over het zich ontwikkelende landschap van professionele carrières in Data Science.

 
Om de vaardigheden te labelen, gebruiken we de meest voorkomende termen en gewichten die zijn geïdentificeerd via het LDA-algoritme dat eerder op de vacatures werd toegepast. We analyseren de functiebeschrijvingen in elk onderwerp verder om de belangrijkste activiteiten, essentiële vaardigheden en sectoren waarin deze het meest voorkomen te benadrukken. Het begrijpen van deze onderwerpen kan werkzoekenden helpen hun vaardigheden af ​​te stemmen op de marktvraag en hun kansen op het veiligstellen van een geschikte positie op het gebied van Data Analytics vergroten. In de volgende paragrafen vindt u een korte beschrijving van elke vaardighedenset.

Onderwerp 0: Onderzoek en data-analyse

 
De volgende tabel toont de vijf belangrijkste termen en hun gewichten voor onderwerp 0. De gewichten verwijzen naar de betekenis van de term bij het definiëren van dat specifieke onderwerp. Gezien deze termen en de documenten die als onderwerp 0 zijn gelabeld, interpreteren we deze vaardigheden als ‘Onderzoek en Data-analyse’.

Termijn Gewicht
Onderzoek 4510
Positie 4195
Informatie 4112
Gezondheid 3404
Universiteit 2118

Tabel 0: Termgewichten voor onderwerp 0
 

Deze vaardigheden omvatten activiteiten zoals het uitvoeren van onderzoek, het analyseren van gegevens en het bieden van inzichten die de besluitvorming in verschillende sectoren stimuleren. Als hoeksteen van data-analyse vergemakkelijkt deze vaardigheden het extraheren van waardevolle inzichten uit data, het identificeren van trends en het nemen van weloverwogen beslissingen.
Uit wat we hebben verzameld binnen het corpus van vacatures, zijn de fundamentele competentievereisten die verband houden met deze vaardigheden:

  • Sterk analytisch en probleemoplossend vermogen
  • Expertise in statistische software (R, Python) 
  • Ervaring met datavisualisatietools
  • Effectieve communicatie- en documentatievaardigheden
  • Een achtergrond in een relevant vakgebied (wiskunde, statistiek of data science)

Onderwerp 1: Beheer en klantenondersteuning

Door te kijken naar de termen en gewichten uit Tabel 1 en naar de documenten die verband houden met Onderwerp 1, hebben we besloten het te bestempelen als “Administratie en klantenondersteuning”. Deze vaardigheden omvatten het beheren van klantinteracties, het bieden van administratieve ondersteuning en het coördineren van logistieke of inkoopprocessen.

Termijn Gewicht
Support 2321
Management 2307
Informatie 2134
Positie 2126
1909

Tabel 1: Termgewichten voor onderwerp 1
 

Naar onze mening zijn de fundamentele competenties die nodig zijn om te slagen in banen waarvoor deze vaardigheden vereist zijn:

  • Sterke organisatorische en tijdmanagementvaardigheden
  • Aandacht voor detail
  • Vaardigheid in kantoorsoftware en communicatiemiddelen
  • Uitstekende interpersoonlijke en probleemoplossende vaardigheden

Onderwerp 2: Marketing en productmanagement

Op basis van de termen in Tabel 2 interpreteren we dit als de “ Marketing en productmanagement " vaardigheden.

Termijn Gewicht
Business 8487
Team 8021
Product 6825
3923
Marketing 3740

Tabel 2: Termgewichten voor onderwerp 2
 

Deze vaardigheden draaien om het ontwikkelen van marketingstrategieën, het beheren van de levenscycli van producten en het stimuleren van marktgroei. Het is van vitaal belang in op data-analyse gerichte banen, omdat het professionals in staat stelt datagestuurde inzichten te gebruiken om weloverwogen beslissingen te nemen over markttrends, klantvoorkeuren en productprestaties.

De essentiële competenties die vereist zijn binnen de vaardigheden op het gebied van Marketing en Productmanagement zijn:

  • Sterk analytisch en strategisch denkvermogen
  • Expertise in marktonderzoek en concurrentie-intelligentie
  • Ervaring met marketingtools en platforms
  • Uitstekende communicatie- en leiderschapsvaardigheden
  • Een achtergrond in bedrijfskunde, marketing of een gerelateerd vakgebied

Onderwerp 3: Bedrijfsbeheer, gegevensbeheer en compliance

Op basis van de termen in Tabel 2 concludeerden we dat het verwees naar de “Bedrijfsbeheer, gegevensbeheer en compliance " vaardigheden.

Deze vaardigheden omvatten het toezicht houden op de bedrijfsvoering, het waarborgen van de gegevenskwaliteit en -beveiliging en het beheren van risico's en wettelijke vereisten. In data-analyse-intensieve banen maakt deze vaardigheden het mogelijk de data-integriteit, compliance monitoring, risico-identificatie en bedrijfsprocesoptimalisatie te behouden met behulp van datagestuurde inzichten.

Termijn Gewicht
Business 14046
Management 10531
Team 5835
Analyse 5672
Project 4309

Tabel 3: Termgewichten voor onderwerp 3
 

Volgens onze bevindingen zijn de vereiste competenties binnen deze vaardigheden:

  • Sterke organisatorische en leiderschapskwaliteiten
  • Expertise in datamanagement, data governance en risicobeoordeling
  • Ervaring met regelgevingskaders en industriestandaarden
  • Effectieve communicatieve en probleemoplossende vaardigheden
  • Een achtergrond in bedrijfskunde, financiën of een gerelateerd vakgebied

Onderwerp 4: Business Intelligence en datavisualisatie

Kijkend naar de termen die we in Onderwerp 4 hebben gevonden, noemen we dit de “Business Intelligence en datavisualisatie" vaardigheden.

Deze vaardigheden omvatten het ontwerpen van altijd aanwezige BI-oplossingen zoals dashboards en rapporten, het creëren van inzichtelijke visualisaties en het analyseren van gegevens voor weloverwogen besluitvorming. Het is van cruciaal belang bij banen waarbij gebruik wordt gemaakt van data-analyse, waarbij ruwe data worden omgezet in bruikbare inzichten die strategische beslissingen aandrijven.

Termijn Gewicht
Business 19372
Analyse 7687
Vermogen bi 7359
intelligentie- 7040
Sql  5836

Tabel 4: Termgewichten voor onderwerp 4
 

Naar onze mening zijn de fundamentele competentie-eisen binnen BI en Datavisualisatie:

  • Sterk analytisch en probleemoplossend vermogen
  • Expertise in BI-tools (zoals Power BI, Tableau, SQL)
  • Ervaring met datavisualisatietechnieken
  • Effectieve communicatie- en storytellingvaardigheden

Onderwerp 5: Datawarehouse en cloudinfrastructuur

Op basis van de termen in Tabel 5 interpreteren we dit als de “Datawarehouse en cloudinfrastructuur " vaardigheden.

Vacatures waarvoor vaardigheden op het gebied van cloud- en big data-engineering vereist zijn, houden doorgaans verband met activiteiten zoals het ontwerpen en implementeren van cloudgebaseerde oplossingen, het beheren van grootschalige gegevensverwerking en het ontwikkelen van softwareapplicaties. Het is van cruciaal belang bij op data-analyse gerichte taken, omdat het een efficiënte verwerking en analyse van grote datavolumes mogelijk maakt voor waardevolle inzichten.

Termijn Gewicht
Ontwikkeling 4525
Cloud 3998
Engineering 3692
Software 3510
Design 3494

Tabel 5: Termgewichten voor onderwerp 5
 

Naar onze mening zijn de fundamentele competentievereisten met betrekking tot vaardigheden dat wel 

  • Sterk programmeer- en probleemoplossend vermogen
  • Expertise in cloudplatforms (zoals AWS, Azure en Google Cloud)
  • Ervaring met big data-technologieën (zoals Hadoop-, Spark- en NoSQL-databases)
  • Kennis van informatiebeveiligingsbeleid en gerelateerde processen

Onderwerp 6: Machinaal leren

Op basis van de termen in Tabel 6 interpreteren we dit als de “Machine leren ”-vaardigheden, die draait om het ontwerpen van AI-modellen, het onderzoeken van geavanceerde ML-technieken en het ontwikkelen van intelligente softwareoplossingen. In data-analyse-intensieve banen vormt het de basis voor AI-modeltraining en prestatie-optimalisatie.

Termijn Gewicht
Machine 9782
Wetenschap 8861
Onderzoek 4686
Computer 4209
Python 4053

Tabel 6: Termgewichten voor onderwerp 6
 

Volgens onze bevindingen zijn dit de fundamentele competenties die vandaag de dag nodig zijn voor machinaal leren

  • Sterke programmeer- en wiskundige vaardigheden
  • Expertise in machine learning-frameworks (zoals TensorFlow, PyTorch)
  • Ervaring met geavanceerde AI-technieken (zoals deep learning en natuurlijke taalverwerking)
  • Effectieve communicatie- en samenwerkingsvaardigheden 

 
In deze aflevering richt onze focus zich op de ingewikkelde analyse van associaties met vaardigheden, zoals onthuld door onderwerpmodellering voor drie verschillende professionele profielen: data-ingenieur, data-analist en data-wetenschapper. Om deze professionele profielen op één lijn te brengen met vacatures, hebben we een op regels gebaseerde classificatie gebruikt. Deze classifier slaagde erin de profielaanduiding van een vacature te bepalen op basis van trefwoorden die binnen de functietitel werden gevonden. Een vacature met de titel ‘Data Architect’ zou bijvoorbeeld worden gecategoriseerd als een Data Engineer-rol, terwijl een vacature met de titel ‘Machine Learning Engineer’ zou worden toegeschreven aan de categorie Data Scientist. 

Met behulp van Latent Dirichlet Allocation (LDA)-onderwerpmodellering krijgen we onderwerpgewichten voor elke vacature, die zeven verschillende vaardigheden omvat. Door het gemiddelde gewicht van elke vaardighedenset voor alle professionele profielen te berekenen, komen we tot het gemiddelde gewicht van de vaardighedenset dat specifiek is voor elke rol. Met name worden deze gewichten vervolgens genormaliseerd en weergegeven als percentages.

Zoals geïllustreerd in figuur 1 presenteren we een inzichtelijke visualisatie van de wisselwerking tussen professionele benamingen en bijbehorende vaardigheden. Deze visual vat de collectieve verwachting van werkgevers samen met betrekking tot de fundamentele vaardigheden die cruciaal zijn voor data-ingenieurs, data-analisten en datawetenschappers.

Zoals verwacht vereist de rol van Data Engineer vooral beheersing van de vaardigheden op het gebied van “Data Warehouse & Cloud Infrastructure”. Bovendien is een aanvullend inzicht in visualisatie en machinaal leren absoluut noodzakelijk. Deze nadruk op de diversiteit van vaardigheden kan worden toegeschreven aan de verwachting dat data-ingenieurs een integraal onderdeel zullen zijn van de ondersteuning van zowel data-analisten als datawetenschappers.

Omgekeerd ligt de voornaamste expertise die voor datawetenschappers wordt verwacht op het gebied van ‘machine learning’, op de voet gevolgd door een vaardigheid in ‘onderzoeks’-methodologieën. Opvallend is dat een hybride vaardigheden die ‘Business Management’ en ‘Product Management’ omvatten ook hoog in belang zijn. Dit omvat de ingewikkelde reeks competenties waarnaar op de arbeidsmarkt wordt gezocht voor aspirant-datawetenschappers.

Als we onze aandacht richten op het domein van data-analisten, komt er een cruciale vereiste naar voren voor vaardigheid in ‘BI en visualisatie’. Gezien hun rol bij het genereren van bedrijfsrapporten, het aansturen van dashboards en het monitoren van de bedrijfsvitaliteit is dit geen verrassing. De parallelle vraag naar “Bedrijfsmanagement” als secundaire sleutelvaardigheid weerspiegelt het strategische inzicht dat van deze rol wordt verwacht. Bovendien is er, net als bij de rol van datawetenschapper, een parallelle vereiste voor vaardigheden op het gebied van productmanagement en onderzoek binnen het spectrum van data-analisten.

Samenvattend onderstreept deze verkenning het genuanceerde landschap van de vereiste vaardigheden voor verschillende Data Analytics-rollen. Het geeft de veelzijdige verwachtingen van werkgevers weer van kandidaten die willen uitblinken in de capaciteiten van data-ingenieurs, data-analisten en datawetenschappers.

 

Figuur 1: Het radardiagram geeft de associatie weer tussen professionele profielen, uitgezet tegen de vaardigheden die in dimensies worden weergegeven.
Figuur 1: Het radardiagram toont de associatie tussen professionele profielen, uitgezet tegen de vaardigheden die in dimensies worden weergegeven (klik om te vergroten).
 

 
Onze analyse van vacatures in het groeiende veld van Data Analytics heeft tot doel banen te categoriseren op basis van verschillende vaardigheden en het diverse scala aan vaardigheden te verduidelijken dat in elke categorie vereist is. Met de exponentiële groei op dit gebied en de kritische aard van beslissingen die op basis van data worden genomen, heeft het proces van het verzamelen, opslaan en analyseren van data opmerkelijke vooruitgang geboekt, wat heeft geleid tot een onverzadigbare vraag naar professionals die bekwaam zijn in data-analyse.

Door de classificatie van vacatures in zeven opmerkelijke vaardighedenonderwerpen werpen we licht op de noodzaak van zowel gespecialiseerde als veelzijdige vaardigheden in dit snel veranderende vakgebied. De onderwerpen varieerden van data-analyse en business intelligence tot machine learning en kunstmatige intelligentie, wat de stijgende vraag onderstreepte naar individuen die bedreven zijn in het benutten van data, technologie en crossfunctioneel teamwerk.

Desondanks kent dit onderzoek een aantal beperkingen. De dynamische aard van de arbeidsmarkt en de opkomst van nieuwe technologieën en methodologieën vereisen een voortdurende actualisering van onze analyse in plaats van een statische ‘momentopname’-visie zoals we hier deden. Bovendien heeft onze aanpak mogelijk niet alle nuances van de diverse functies en vaardigheden op het gebied van data-analyse vastgelegd, gezien de afhankelijkheid van beschikbare vacatures op het moment van onderzoek.

Al ons werk is gratis beschikbaar op KNIME Community Hub Openbare ruimte – “Toepassing van arbeidscompetenties”. Je kunt de workflows downloaden en ermee spelen om ze zelf uit te proberen, te ontdekken en uit te breiden of te verbeteren. 

 
 

 
Vooruitkijkend zien wij mogelijkheden voor een aanzienlijke uitbreiding van dit onderzoek. Dit omvat de ontwikkeling van KNIME-componenten om de 'Stop Phrases Removal'-methode, beschreven in deel 1, en een mens-in-de-loop interactief visualisatieframework in KNIME te implementeren. Een dergelijk raamwerk zou het proces van menselijk oordeel bij het selecteren van het meest coherente onderwerpmodel voor een bepaald corpus vereenvoudigen, waardoor de schaal van ons werk zou worden vergroot. We voorzien ook de toepassing van door LLM ondersteunde mechanismen om de fase van onderwerpmodellering te ondersteunen en te vereenvoudigen: dit scenario laat zeker ruimte voor verder experimenteren en onderzoek.

Professionals op het gebied van data-analyse moeten geïnformeerd blijven en zich kunnen aanpassen aan de opkomende technologieën. Dit zorgt ervoor dat hun vaardigheden relevant en waardevol blijven in het steeds veranderende landschap van datagestuurde besluitvorming. Door de vaardigheden die verband houden met de geïdentificeerde onderwerpen te herkennen en te cultiveren, kunnen werkzoekenden een concurrentievoordeel verwerven in deze levendige markt. Om hun relevantie in het veld te beschermen, moeten Data Analytics-professionals hun hele loopbaan nieuwsgierig blijven en voortdurend blijven leren.

 
 
Mahantesh Pattadkal brengt meer dan 6 jaar ervaring met advies over data science-projecten en -producten met zich mee. Met een masterdiploma in Data Science blinkt zijn expertise uit op het gebied van deep learning, natuurlijke taalverwerking en verklaarbaar machinaal leren. Daarnaast werkt hij actief samen met de KNIME-gemeenschap voor samenwerking aan op datawetenschap gebaseerde projecten.
 

Andrea de Mauro heeft meer dan 15 jaar ervaring met het bouwen van business analytics- en data science-teams bij multinationale bedrijven zoals P&G en Vodafone. Naast zijn zakelijke rol geeft hij graag les in Marketing Analytics en Applied Machine Learning aan verschillende universiteiten in Italië en Zwitserland. Door zijn onderzoek en schrijven heeft hij de zakelijke en maatschappelijke impact van data en AI onderzocht, in de overtuiging dat een bredere analytische kennis de wereld beter zal maken. Zijn nieuwste boek is 'Data Analytics Made Easy', uitgegeven door Packt. Hij verscheen in de wereldwijde 'Forty Under 2022'-lijst van 40 van het CDO-tijdschrift.

spot_img

Laatste intelligentie

spot_img