Zephyrnet-Logo

Die besten Python-Kurse: Eine Zusammenfassung der Analyse

Datum:

By Brendan Martin, Gründer und Chefredakteur, LearnDataSci

Einleitung

 
Was verraten die Daten, wenn wir fragen: „Was sind die 10 besten Python-Kurse?“. Das Sammeln fast aller Kurse von Top-Plattformen zeigt, dass es mit über 3000 Angeboten eine große Auswahl gibt.

Dieser Artikel fasst meine Analyse zusammen und stellt die drei besten Kurse vor. Den vollständigen Artikel, der den gesamten Code enthält, der zum Reproduzieren meiner Ergebnisse erforderlich ist, finden Sie im Original: Die 10 besten Python-Kurse laut Datenanalyse.

TL;DR: Die Gewinner

 
Von allen gesammelten Kursen zeigte die Analyse, dass dies die drei besten waren:

  1. Lernen Sie Python von Codecademy
  2. Einführung in die Python-Programmierung von Udacity
  3. Programmieren für alle (Erste Schritte mit Python) von Coursera

Wenn Sie also nur wegen Empfehlungen hier sind, sehen Sie sich die Top XNUMX an. Wenn Sie jedoch an den Daten und Methoden interessiert sind, die zur Generierung der besten Ergebnisse verwendet wurden, lesen Sie weiter, um eine vollständige Zusammenfassung zu erhalten.

Kompromisse & Annahmen

 
Die Datenanalyse erfordert eine reduktionistische Herangehensweise an die Welt. Häufig müssen Daten aufgrund der Wahrscheinlichkeit ausgewählt werden, dass sie gut mit einer gewünschten Eigenschaft korrelieren. Solche Kompromisse und Annahmen sind unerlässlich, aber ebenso wichtig ist die Fähigkeit, anzugeben, welche Annahmen wir getroffen haben. Auf diese Weise können andere Ihren Ansatz kritisieren und seine Grenzen verstehen.

Annahmen:

  • Suchmaschinenranking von Google spiegelt sowohl die Quantität als auch die Qualität der Backlinks wider
  • Dass die Beliebtheit einer Kursseite positiv mit der Anzahl eindeutiger Links korreliert
  • Dass die Popularität einer Kursseite positiv mit ihrem Traffic korreliert
  • Dass die Auswahl der in der Analyse verwendeten Plattformen umfassend ist
  • Beim Filtern der Daten nach „Python“ in der URL oder dem Top-Keyword für die Seite wurden relevante Kurse weder ausgeschlossen noch irrelevante Kurse eingeschlossen

Einschränkungen:

  • Das grundlegende Ahrefs Der verwendete Plan liefert die Top-50-Suchergebnisse bei Google, nicht die gesamte mögliche Menge
  • Das Domain-Rating von Ahref ist nur eine Schätzung des geheimnisvollen Algorithmus von Google

Datenaufbereitung

 
Die Vorbereitung der Daten für die Analyse ist oft der anspruchsvollste Schritt. In diesem Fall habe ich:

 
1. Jede Kursplattform in separate CSVs exportiert.

Wir wissen bereits, dass wir die Daten weiter filtern müssen, um bestimmte irrelevante Seiten auszuschließen, aber das ist für später.

 
2. Stellen Sie sicher, dass unsere Python-Umgebung über die erforderlichen Bibliotheken verfügt: Pandas, matplotlib/seaborn und scipy.

Diese Bibliotheken helfen bei der Untersuchung und Visualisierung der Daten.

 
3. Erstellen Sie einen leeren DataFrame und verketten Sie jede Datei mit dem DataFrame.

Da jede CSV ihren eigenen Index hat, müssen wir reset_index verwenden, um einen neuen Index für den kombinierten Datenrahmen zu erstellen.

 
4. Untersuchen Sie die Daten, um aussagekräftige Filter zu konstruieren

Dabei geht es um das unter 1.

 
5. Entfernen Sie Duplikate

Die URL könnte beispielsweise „http“ oder „https“ lauten und „www“ enthalten oder auch nicht.

 
6. Angewandtes Feature-Engineering, um einen Interaktionsbegriff zwischen verweisenden Domänen und Verkehr zu erstellen.

Berechnen Sie die Z-Scores von Traffic und Referring Domains, um eine neue Eigenschaft zu erstellen: den Durchschnitt der beiden Z-Scores unter Verwendung der Scipy-Bibliothek.

 
7. Wiederholte eine weitere Reinigungsrunde

Der Kurs von Codecademy für Python 2 zum Beispiel rangiert an der Spitze, wird aber von Python 3 abgelöst. Die Lösung: Wir haben die Position von Codecademy beibehalten und den empfohlenen Kurs gewechselt. Im Moment ist der gesunde Menschenverstand ein entscheidender Beitrag zu dieser Art von Analyse.

Datenvisualisierung

 
Wie üblich begann die Datenvisualisierung während der Datenvorbereitungsphase. Es hilft, ein Gefühl dafür zu bekommen, was das Wasser trübt.

Nachdem zum Beispiel die Kurse anhand ihres Traffics und ihrer verweisenden Domains dargestellt wurden, war klar, dass wir noch eine größere Bereinigung durchführen mussten (Schritt 7 oben), um irrelevante Kurse zu entfernen. Das folgende Diagramm zeigt einige nicht relevante Kurse, die es in die Daten geschafft haben:

Die besten Python-Kurse: Eine Zusammenfassung der Analyse


 

Die Durchführung einer Visualisierung erfordert in der Regel die Erstellung eines neuen Datenrahmens, der Daten in dem von Ihnen benötigten Format gruppiert. Zum Beispiel die Python-Kurse und der Verkehr nach Plattform als gruppiertes Balkendiagramm:

Die besten Python-Kurse: Eine Zusammenfassung der Analyse


 

Der obige Plot führt zu einer interessanten Beobachtung: Mehr Python-bezogene Kurse auf einer Plattform bedeuten zwangsläufig mehr Traffic. Dies scheint das Sprichwort zu bestätigen, dass Qualität wichtiger ist als Quantität.

Qualitative Analyse

 
Die quantitative Analyse lieferte uns unsere Rangfolge. Für eine qualitative Analyse der kostenlosen Versionen der Kurse schloss ich mich ihnen an und sprang hinein, um meine Eindrücke zu teilen.

 
1. Lernen Sie Python von Codecademy

Zertifikat: ✔ Quiz: ✔ Projekte: ✔ Interaktiv: ✔

Ein solider Einsteigerkurs zum Lösen von Problemen mit Python, der grundlegende Themen behandelt, die in anderen Kursen oft völlig ignoriert werden.

 
2. Einführung in die Python-Programmierung von Udacity

Video: ✔ Quiz: ✔

Dieser Anfängerkurs bietet immer noch ein gutes Preis-Leistungs-Verhältnis, obwohl er mich nicht so beeindruckt wie andere. Anders als bei Codecademy hat beispielsweise jede Lektion einen aufgezeichneten Vortrag.

 
3. Programmieren für alle (Erste Schritte mit Python) von Coursera

Zertifikat: ✔ (gegen Bezahlung) Video: ✔ Quiz: ✔

Die Videos dieses Kurses sind viel organisierter und unterhaltsamer als andere, die ich getestet habe. Das Tempo und der Schwierigkeitsgrad beginnen niedrig, aber es bringt Sie (schließlich) auf ein mittleres Python-Wissen. Die Python-Lernumgebung ist besonders ausgereift.

Zusammenfassung

 
Der Kurs von Codecademy scheint eine sichere Wahl zu sein, um Ihre Python-Reise zu beginnen. Aber egal für welchen Studiengang Sie sich entscheiden, gehen Sie so oft wie möglich Projekte an. Finden Sie ein Problem, das Sie interessiert, und programmieren Sie weiter, bis Sie etwas haben, das es löst. Zeigen Sie Ihre Lösung, nutzen Sie sie, um anderen zu helfen, und machen Sie sogar Karriere daraus. Die Verwendung von Python – und der Programmierung im Allgemeinen – zur Schaffung von Wert für sich selbst und andere ist eine lohnende Feedback-Schleife, die Sie weiter arbeiten, vorankommen und besser werden lässt.

Wir hoffen, dass dieser Artikel Ihnen auf Ihrer Python-Reise hilft. Besuche die Original Artikel für mehr Details, vollständigen Code und den Rest der Top 10.

 
 
Brendan Martin ist Gründer und Chefredakteur, LearnDataSci. LearnDataSci macht datenwissenschaftliches Lernen online für jedermann zugänglich. Monatliche Artikel, die darauf ausgerichtet sind, Online-Lernenden dabei zu helfen, ein intuitives Verständnis von Themen der Datenwissenschaft und des maschinellen Lernens zu erlangen, die für eine Karriere in der Datenwissenschaft unerlässlich sind.

spot_img

Neueste Intelligenz

spot_img

Chat mit uns

Hallo! Wie kann ich dir helfen?