Zephyrnet-Logo

5 Schlüsselkompetenzen, die man braucht, um ein großartiger Datenwissenschaftler zu werden

Datum:

By Sharan Kumar Ravindran, Senior Manager (Datenwissenschaft)

Man muss kein angeborenes Talent haben, um ein erfolgreicher Data Scientist zu werden. Dennoch sind einige Fähigkeiten erforderlich, um in der Datenwissenschaft erfolgreich zu sein. Alle diese Schlüsselqualifikationen können von jedem mit entsprechender Ausbildung und Übung erworben werden. In diesem Artikel werde ich einige der wichtigen Fähigkeiten teilen, warum sie für einen Datenwissenschaftler als wichtig angesehen werden. Auch, wie diese Fähigkeiten erworben werden können.

Kritisches Denken

 
 
Data Scientists sollten sich kritisches Denken angewöhnen. Es hilft, das Problem besser zu verstehen. Wenn die Probleme nicht bis ins kleinste Detail verstanden werden, kann die Lösung nicht gut sein. Kritisches Denken hilft bei der Analyse der verschiedenen Optionen und hilft bei der Auswahl der richtigen.

Bei der Lösung von Data-Science-Problemen ist es nicht immer eine gute oder schlechte Entscheidung. Viele Optionen liegen in der Grauzone zwischen Gut und Böse. In einem Data-Science-Projekt sind so viele Entscheidungen zu treffen. Wie die Auswahl der richtigen Attribute, der richtigen Methodik, der richtigen Algorithmen, der richtigen Metriken zur Messung der Modellleistung und so weiter. Es erfordert mehr Analyse und klares Denken, um die richtigen Optionen auszuwählen.



Photo by Diana Parkhaus on Unsplash

 

Eine einfache Möglichkeit, kritisches Denken zu entwickeln, besteht darin, so neugierig wie ein Kind zu sein. Stellen Sie so viele Fragen wie möglich, bis es keine Fragen mehr gibt. Je mehr wir fragen, desto mehr verstehen wir. Je besser wir das Problem verstehen, desto besser das Ergebnis.

Lassen Sie mich kritisches Denken an einem Beispiel demonstrieren. Betrachten wir das folgende Szenario bei einem Telekommunikationsunternehmen. Wir wollen treue und vermögende Kunden identifizieren. Um dieses Kundensegment zu identifizieren, müssten wir mit einer Reihe von Fragen beginnen wie:

  • Was sind die verschiedenen Profilkategorien von Kunden?
  • Wie hoch ist das Durchschnittsalter der Kunden?
  • Wie viel gibt ein Kunde aus?
  • Wie häufig interagiert der Kunde?
  • Hat der Kunde die Rechnungen pünktlich bezahlt?
  • Gab es verspätete oder versäumte Zahlungen?
  • Wie hoch ist der Lifetime Value der Kunden?

Diese helfen bei der Identifizierung der Elite-Kunden. Es hilft der Organisation sicherzustellen, dass diese Kunden den besten Service erfahren.

Es gibt Techniken, die helfen, die Fähigkeit zum kritischen Denken zu verbessern. Eine solche Technik ist das First-Principles-Denken. Es ist ein mentales Modell, das hilft, das Problem besser zu verstehen. Hier ist ein Beispiel für die Verwendung der ersten Prinzipien zur Lösung eines datenwissenschaftlichen Problems.

Wie kann First-Principle-Denken verwendet werden, um Data-Science-Probleme zu lösen?
 

Mentale Modelle sind erstaunliche Werkzeuge, die bei klarem Denken und besserer Entscheidungsfindung helfen. Daher hilft die Annahme der mentalen Modelle bei der Verbesserung Ihrer Fähigkeit zum kritischen Denken. Hier ist ein Artikel, der die Vorteile der Übernahme von mentalen Modellen bei der Arbeit hervorhebt.

5 mentale Modelle, mit denen Sie Ihre Data-Science-Karriere ankurbeln können
 

Programmierung

 
 
Programmierkenntnisse sind für einen Data Scientist genauso wichtig wie Augen für einen Künstler. Alles, was ein Datenwissenschaftler tun würde, erfordert Programmierkenntnisse. Vom Lesen von Daten aus mehreren Quellen über die Durchführung explorativer Analysen der Daten bis hin zum Erstellen von Modellen und deren Bewertung.



Photo by Firos NV on Unsplash

 

Was könnte mit den AutoML-Lösungen passieren? Viele AutoML-Produkte sind in den letzten Jahren auf den Markt gekommen. Viele denken sogar, dass man bald keine Programmierkenntnisse mehr braucht. Nehmen wir ein Beispiel,

  • Es gibt 2 Unternehmen, Unternehmen A und Unternehmen B
  • Beide verwenden das beliebteste AutoML-Produkt
  • Sie sind in der Lage, mehrere datenwissenschaftliche Probleme mit AutoML zu lösen
  • Jetzt will einer von ihnen den Markt dominieren
  • Das Unternehmen, das über die mithilfe der AutoML-Lösung implementierte Lösung hinaus kann, hat bessere Chancen.

Es ist unbestreitbar, dass AutoML-Lösungen in Zukunft weit verbreitet sein werden. Viele Standardprobleme, die das Data-Science-Team heute löst, werden automatisiert. Es bedeutet nicht das Ende von Data-Science-Jobs oder das Ende der Notwendigkeit, Code von Data Scientists zu schreiben. Es wird den Data-Science-Teams ermöglichen, sich auf neue Probleme zu konzentrieren.

Die Menge der erfassten Daten ist heute so hoch. Viele Organisationen nutzen heute nur einen Bruchteil der verfügbaren Daten. Mit AutoML verschiebt sich der Fokus auf das Unerforschte.

Interessieren Sie sich für Data Science, haben aber das Gefühl, dass Sie nicht über die Programmierkenntnisse verfügen? Hier ist ein Artikel, der Ihnen beim Erlernen des Programmierens für Data Science helfen wird.

Kann nicht codieren? Hier ist der beste Weg, um das Programmieren für Data Science zu lernen

Mathe

 
 
Mathematik ist eine weitere wichtige Fähigkeit, die von Datenwissenschaftlern verstanden werden muss. Es ist in Ordnung, wenn Sie sich beim Erlernen von Data Science einiger mathematischer Konzepte nicht bewusst sind. Es wird nicht möglich sein, sich als Data Scientist hervorzuheben, ohne die mathematischen Konzepte zu verstehen.



Photo by Dies istEngineering RAEng on Unsplash

 

Lassen Sie mich ein einfaches Beispiel nehmen und zeigen, wie mathematische Konzepte bei der Lösung von Problemen nützlich sind. Lassen Sie uns die Kundenabwanderungsanalyse auswählen.

  • Wir beginnen damit, das Verhalten und die Eigenschaften verschiedener Kundengruppen zu verstehen. Eine Möglichkeit, daran zu arbeiten, besteht darin, verschiedene Beispieldaten auszuwählen und nach Mustern zu suchen. Das mathematische Konzept, das hier benötigt wird, ist die Statistik und die Wahrscheinlichkeit
  • Um die Datenanalyse effizient durchzuführen, ist das Verständnis der linearen Algebra sehr praktisch
  • Angenommen, wir möchten ein Modell erstellen, um die Benutzer vorherzusagen, die wahrscheinlich abwandern. Um die Konzepte des Gradientenabstiegs zu verstehen, ist das Wissen über die Infinitesimalrechnung hilfreich. Wenn Sie einen Entscheidungsbaum verwenden, hilft Ihnen die Kenntnis der Informationstheorie, die Logik zum Erstellen von Bäumen zu verstehen.
  • Wenn Sie sich darauf freuen, die Parameter zu optimieren, kann das Wissen über Betriebsforschung und -optimierung hilfreich sein.
  • Um die Modellbewertung effizient umzusetzen, kann das mathematische Konzept wie Algebra sehr hilfreich sein

Das ist noch nicht alles, es gibt keinen maschinellen Lernalgorithmus ohne Mathematik. Das bedeutet nicht, dass Sie Mathematiker sein müssen, um ein erfolgreicher Data Scientist zu sein. Alles, was es braucht, ist ein High-School-Niveau in Mathematik.

Wenn Sie daran interessiert sind, Mathematik für Data Science zu lernen. Hier ist der beste Kurs für Sie.

Mathematik für die Datenwissenschaft
 

Zusammenarbeit

 
 
Ein Data Scientist kann nicht isoliert arbeiten. Ein Data Scientist sollte mit mehreren Personen zusammenarbeiten, um den Erfolg des Projekts sicherzustellen. Auch heute noch scheitern viele Data-Science-Projekte. Der Hauptgrund für die meisten Misserfolge ist ein Mangel an Verständnis und Zusammenarbeit zwischen den Teams.



Photo by Kaleidiko on Unsplash

 

Die Bedeutung der Zusammenarbeit und des Arbeitens in verschiedenen Teams erklären. Betrachten wir ein Szenario, in dem das Data Science-Team mit dem Kundenwachstumsteam zusammenarbeitet. Ziel ist es, den Grund für die Kundenabwanderung zu verstehen.

Sie beschließen, mit einigen verschiedenen Teams zu sprechen, und hier ist, was sie sagen

Wachstumsteam — Die Kundenabwanderung ist hauptsächlich auf die aggressiven Rabatte zurückzuführen, die von den Wettbewerben angeboten werden

Marketing-Team — Die vom Produktteam veröffentlichte neue Funktion könnte einige Probleme verursachen, was dazu führt, dass die Kunden abwandern

Produktteam — Das Marketingteam konzentriert sich nur darauf, viele neue Kunden zu gewinnen, ohne die Würdigkeit oder Absicht des Kunden festzustellen

Kundenbetreuung — Viele Kunden haben viele zahlungsbezogene Probleme gemeldet. Das könnte der Grund für die Kundenabwanderung sein

Wenn Sie nicht mit den anderen Teams gesprochen hätten, hätten Sie begonnen, an dem Problem zu arbeiten, nur basierend auf den Eingaben des Wachstumsteams. Sie können ein Problem nicht lösen, indem Sie sich nur auf die Beiträge von nur einem Team verlassen. Auch wenn das Wachstumsteam hier der Hauptsponsor ist, reicht es nicht aus, sich nur auf dessen Input zu verlassen. Um ein ganzheitliches Bild zu erhalten, müssen Sie mit einer anderen Gruppe von Interessengruppen sprechen. Wenn Sie die Personen oder Teams einschränken, mit denen Sie zusammenarbeiten, wird die Voreingenommenheit von diesen auf die Lösung übertragen, die Sie erstellen.

Außerdem muss das Data Science-Team in vielen Fällen eng mit dem Data Engineering und den anderen Technologieteams zusammenarbeiten. Ohne eine gute Zusammenarbeit wird es keinen Erfolg geben.

Kommunikation und Storytelling

 
 

  • In das Projekt investierter Aufwand
  • Genauigkeit des endgültigen Modells für maschinelles Lernen, das in der Produktion eingesetzt wird
  • Erkenntnisse aus der explorativen Analyse

All dies ist nutzlos, wenn die Lösungen den Stakeholdern nicht gut kommuniziert werden. Die Probleme und Lösungsansätze von Data Science sind in der Regel viel komplexer. Es ist sehr wichtig, sie zu vereinfachen, bevor sie dem Unternehmen mitgeteilt werden. Die Verwendung des Storytelling-Ansatzes bei der Kommunikation hilft sehr.

Lassen Sie mich ein Beispiel nehmen und die Bedeutung einer guten Kommunikation einfacher erklären. Betrachten wir das folgende Szenario. Das Data-Science-Team arbeitet an einem Prognosemodell, um den Energieverbrauch für Energieeinzelkunden vorherzusagen. Das Data-Science-Team muss das Geschäfts- und das Infrastrukturteam davon überzeugen, wie wichtig es ist, mindestens 10 verschiedene Modelle für eine bessere Genauigkeit zu haben und auszuführen. Dies bedeutet einen höheren Einsatz von Rechenleistung und viel mehr Zeit für das Training der Modelle.

Option A — Sie gehen von der Clustering-Technik aus, die verwendet wird, um den Kunden in verschiedene Gruppen einzuteilen, und sagen daher, dass es ein Modell für jede dieser Gruppen geben muss.

Das Problem hier ist, dass dem Geschäftsteam nicht der Vorteil vermittelt wurde, tatsächlich ein Modell für jede der Gruppen zu haben. Sie sind also möglicherweise nicht überzeugt, wenn sich die Kosten als hoch herausstellen.

Option B — Sie beginnen mit dem Profil und den Merkmalen der Kunden. Sie zeigen das Energieverbrauchsverhalten der Kunden. Sie zeigen dem Geschäftsteam die charakteristischen Muster, dass einige Haushalte am Wochenende fast keinen Strom verbrauchen, vielleicht weil sie das Wochenende im Allgemeinen an einem anderen Ort verbringen. In ähnlicher Weise zeigen Sie die charakteristischen Muster und erklären daher, dass ein Modell nicht zu all diesen verschiedenen Kunden passen wird, und daher müssen jeweils mindestens 10 verschiedene Modelle vorhanden sein, um die 10 verschiedenen einzigartigen Kategorien von Kunden zu bedienen.

Jetzt versteht das Unternehmen, wie wichtig es ist, so viele verschiedene Modelle zu haben. Sie können den inkrementellen Nutzen leicht mit den erforderlichen Infrastrukturkosten vergleichen, um die Optionen zu bewerten.

Es ist die Aufgabe des Data-Science-Teams, die Idee klar an die Stakeholder zu kommunizieren. Es ist keine leichte Aufgabe, da die meisten Menschen nur begrenzte Kenntnisse über Data Science haben. Ein Data-Science-Projekt gilt nur dann als erfolgreich, wenn das Unternehmen daraus einen Nutzen zieht.

Eine gute Möglichkeit, die Zusammenarbeit in Ihrer Organisation zu verbessern, wäre die Bereitstellung einer Umgebung, in der ein guter Informationsfluss zwischen den Teams besteht.

Führungsqualitäten – Gut zu haben

 
 
Nicht zuletzt sind Führungsqualitäten gefragt. Die meisten Organisationen haben ein kleines Data-Science-Team und arbeiten im Allgemeinen an unterschiedlichen Problemstellungen. Es ist üblich, dass ein Datenwissenschaftler in verschiedene Meetings und für Ad-hoc-Befragungen gezogen wird. Es ist die Aufgabe des Data Scientist zu entscheiden, wann er Ja und wann Nein sagt. Es ist sehr wichtig, die richtigen Prioritäten zu setzen.

Außerdem müssen Data Scientists einen klaren Denkprozess haben und in der Lage sein, sich das Ergebnis vorzustellen. Oft wird von den Geschäftsteams viel Druck ausgeübt, die Analyse zu beschleunigen. Es ist die Aufgabe des Datenwissenschaftlers, die Erwartungen zu managen und ein qualitativ hochwertiges Ergebnis zu erzielen.

Um in Verbindung zu bleiben

 
 

 
Bio: Sharan Kumar Ravindran ist ein Senior Manager (Data Science), Top Writer in AI on Medium und ein Data Science Leader mit über 10 Jahren Erfahrung. Er schreibt und spricht über Data Science mit dem Ziel, sie zugänglicher zu machen.

Original. Mit Genehmigung erneut veröffentlicht.

Related:

Quelle: https://www.kdnuggets.com/2021/12/5-key-skills-needed-become-great-data-scientist.html

spot_img

Neueste Intelligenz

spot_img