Logo Zephyrnet

I migliori corsi Python: un riepilogo dell'analisi

Data:

By Brendano Martin, fondatore e caporedattore, LearnDataSci

Introduzione

 
Cosa rivelano i dati se ci chiediamo: "Quali sono i 10 migliori corsi Python?". La raccolta di quasi tutti i corsi dalle migliori piattaforme mostra che c'è molto da scegliere, con oltre 3000 offerte.

Questo articolo riassume la mia analisi e presenta i primi tre corsi. Per l'articolo completo, che include tutto il codice necessario per riprodurre i miei risultati, vedere l'originale: 10 migliori corsi Python in base all'analisi dei dati.

TL; DR: I vincitori

 
Di tutti i corsi raccolti, l'analisi ha mostrato che questi erano i primi tre:

  1. Impara Python da Codecademy
  2. Introduzione alla programmazione Python di Udacity
  3. Programmazione per tutti (Guida introduttiva a Python) di Coursera

Quindi, se sei qui solo per i consigli, dai un'occhiata ai primi tre. Tuttavia, se sei interessato ai dati e ai metodi utilizzati per generare i risultati migliori, continua a leggere per un riepilogo completo.

Compromessi e ipotesi

 
L'analisi dei dati richiede un approccio riduzionista al mondo. Spesso, i dati devono essere selezionati a causa della probabilità che siano correlati bene con una proprietà desiderata. Tali compromessi e ipotesi sono essenziali, ma lo è ugualmente la capacità di affermare quali ipotesi abbiamo fatto. In questo modo, gli altri possono criticare il tuo approccio e comprenderne i limiti.

Ipotesi:

  • Il posizionamento sui motori di ricerca di Google è un giusto riflesso sia della quantità che della qualità dei backlink
  • Che la popolarità di una pagina del corso sia correlata positivamente al numero di link univoci
  • Che la popolarità di una pagina del corso sia positivamente correlata al suo traffico
  • Che la selezione delle piattaforme utilizzate nell'analisi sia completa
  • Il filtraggio dei dati per "Python" nell'URL o nella parola chiave principale per la pagina non escludeva corsi pertinenti o includeva corsi irrilevanti

limitazioni:

  • Il Ahref di base il piano utilizzato fornisce i primi 50 risultati di ricerca su Google, non l'intero set possibile
  • Il Domain Rating di Ahref è solo una stima dell'algoritmo segreto di Google

Preparazione dei dati

 
La preparazione dei dati per l'analisi è spesso la fase più impegnativa. In questo caso io:

 
1. Esportazione di ciascuna piattaforma del corso in CSV separati.

Sappiamo già che dovremo filtrare ulteriormente i dati per escludere alcune pagine irrilevanti, ma questo è per dopo.

 
2. Assicurati che il nostro ambiente Python abbia le librerie richieste: panda, matplotlib/seaborne scipie.

Queste librerie aiuteranno con l'esplorazione e la visualizzazione dei dati.

 
3. Crea un DataFrame vuoto e concatena ogni file nel DataFrame.

Poiché ogni CSV ha il proprio indice, è necessario reset_index per creare un nuovo indice per il dataframe combinato.

 
4. Esaminare i dati per costruire filtri significativi

Si tratta della questione di cui al punto 1.

 
5. Rimuovere i duplicati

Ad esempio, l'URL potrebbe essere "http" o "https" e potrebbe avere o meno www.

 
6. Ingegneria delle funzionalità applicata per creare un termine di interazione tra i domini di riferimento e il traffico.

Calcola gli z-score del traffico e dei domini di riferimento per creare una nuova proprietà: la media dei due z-score utilizzando la libreria scipy.

 
7. È stato ripetuto un altro ciclo di pulizia

Ad esempio, il corso di Codecademy per Python 2 si è classificato al primo posto ma è stato sostituito da Python 3. La soluzione: abbiamo mantenuto la posizione di Codecademy e cambiato il corso consigliato. Per ora, il buon senso umano è un input cruciale per questo tipo di analisi.

Visualizzazione dati

 
Come di consueto, la visualizzazione dei dati è iniziata durante le fasi di preparazione dei dati. Aiuta a farsi un'idea di ciò che sta confondendo le acque.

Ad esempio, una volta che i corsi sono stati tracciati in base al traffico e ai domini di riferimento, è stato chiaro che dovevamo ancora eseguire alcune importanti operazioni di pulizia (passaggio 7 sopra) per rimuovere i corsi irrilevanti. Il grafico seguente mostra alcuni corsi non rilevanti che sono entrati nei dati:

I migliori corsi Python: un riepilogo dell'analisi


 

L'esecuzione della visualizzazione in genere richiede la creazione di un nuovo dataframe che raggruppi i dati nel formato necessario. Ad esempio, i corsi Python e il traffico per piattaforma come un grafico a barre raggruppato:

I migliori corsi Python: un riepilogo dell'analisi


 

La trama sopra porta a un'osservazione interessante: più corsi relativi a Python su una piattaforma significano necessariamente più traffico. Questo sembra confermare il detto che la qualità è più importante della quantità.

Analisi qualitativa

 
L'analisi quantitativa ci ha dato le nostre classifiche. Per un'analisi qualitativa delle versioni gratuite dei corsi, mi sono unito a loro e sono intervenuto per condividere le mie impressioni.

 
1. Impara Python da Codecademy

Attestato: ✔ Quiz: ✔ Progetti: ✔ Interattivo: ✔

Un solido corso di livello principiante per la risoluzione di problemi con Python, che copre argomenti fondamentali che spesso vengono completamente ignorati da altri corsi.

 
2. Introduzione alla programmazione Python di Udacity

Video: ✔ Quiz: ✔

Questo corso per principianti offre comunque un buon rapporto qualità-prezzo nonostante non mi abbia impressionato tanto quanto gli altri. Ad esempio, a differenza di Codecademy, ogni lezione ha una lezione registrata.

 
3. Programmazione per tutti (Guida introduttiva a Python) di Coursera

Attestato: ✔ (a pagamento) Video: ✔ Quiz: ✔

I video di questo corso sono molto più organizzati e divertenti di altri che ho provato. Il ritmo e il livello di difficoltà iniziano bassi, ma (alla fine) ti portano a una conoscenza di livello intermedio di Python. L'ambiente di apprendimento Python è particolarmente ben progettato.

Conclusione

 
Il corso di Codecademy sembra una scommessa sicura per iniziare il tuo viaggio in Python. Ma, indipendentemente dal corso che scegli, affronta i progetti il ​​più spesso possibile. Trova un problema che ti interessa e continua a programmare finché non hai qualcosa che lo risolva. Mostra la tua soluzione, usala per aiutare gli altri e persino trasformala in una carriera. L'uso di Python, e della programmazione in generale, per creare valore per te stesso e per gli altri è un gratificante ciclo di feedback che ti farà lavorare, andare avanti e migliorare.

Ci auguriamo che questo articolo ti aiuti nel tuo viaggio in Python. Dai un'occhiata al articolo originale per maggiori dettagli, codice completo e il resto dei primi 10.

 
 
Brendano Martin è fondatore e caporedattore, LearnDataSci. LearnDataSci sta rendendo l'apprendimento della scienza dei dati online accessibile a tutti. Articoli mensili orientati ad aiutare gli studenti online a ottenere una comprensione intuitiva della scienza dei dati e degli argomenti di apprendimento automatico che sono essenziali per le carriere nella scienza dei dati.

spot_img

L'ultima intelligenza

spot_img