Zephyrnet-logo

5 geavanceerde projecten voor de Data Science-portfolio

Datum:

5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding door auteur
 

In deze blog verkennen we vijf essentiële data science-projecten die het functieprofiel van zowel laatstejaarsstudenten als professionals een boost kunnen geven. Door deze projecten krijg je een beter begrip van data science-workflows en beheers je essentiële tools voor het opschonen, manipuleren, visualiseren en modelleren van data. Daarnaast leer je hoe je projectrapporten schrijft en machine learning-modellen in de cloud implementeert voor maximale impact.

In het Gerecycleerde energie bespaard in Singapore project analyseer je hoeveel Singapore jaarlijks energie bespaart door plastic, papier, glas en ferro- en non-ferrometalen te recyclen. Het project omvat het samenvoegen van gegevens, het opschonen van gegevens en het uitwisselen van gegevens. Daarna voer je diepgaande data-analyse uit met statistische en visualisatietools. 
 

5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding van Project
 

Uiteindelijk gebruik je technieken voor gegevensmanipulatie om het antwoord op de oorspronkelijke vraag te vinden: totale bespaarde energie van 2003 tot 2020 op basis van vijf soorten afval in Singapore. 

Time Series Forecasting met statsmodels en Prophet project leert u essentiële vaardigheden voor het omgaan met tijdreeksgegevens, het uitvoeren van gegevensanalyse en prognoses. 

 

5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding van Project
 

Je begint met het trainen van gegevens op de ARIMA voorspellingsmodel en het uitvoeren van een modelevaluatie. Daarna voer je time series forecasting uit met het Python pakket Profeet.

In het spaCy CV-analyse project gebruik je spaCy voor entiteitsherkenning op 200 Resume en verschillende NLP-tools voor tekstanalyse. Het doel van het project is om recruiters te helpen snelle en accurate beslissingen te nemen over duizenden sollicitaties. 

 

5 geavanceerde projecten voor de Data Science-portfolio
5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding van Project
 

U begint met het laden van de geschrapte dataset en het spaCy-basismodel voor Engelse talen. Vervolgens maakt u een entiteitsliniaal en maakt u de dataset schoon. Daarna voer je datavisualisatie, entiteitsherkenning en afhankelijkheidsparsing uit. Uiteindelijk maak je een functie voor het matchen van cv's en voer je onderwerpmodellering uit.

De Tripadvisor-gegevensanalyse portfolioproject omvat alle aspecten van datawetenschap, van het laden van gegevens tot het modelleren van gegevens. Je analyseert beoordelingen en beoordelingen op basis van klantervaringen. 

 

5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding van Project
 

In dit project voer je uit:

  1. Gegevensverkenning
  2. Sentimentanalyse met Vader 
  3. Data visualisatie
  4. Trefwoorden toevoegen (Gensim)
  5. Tekstverwerking (NLTK)
  6. Het bouwen van een Deep Learning-model (BiLSTM) met behulp van Keras
  7. Trainen en valideren
  8. Modelevaluatie
  9. Voorspelling
  10. Besparingsmodel

Het is een inleiding tot tekstclassificatie met behulp van deep learning-modellen. Voordat u aan de training begint, gaat u de gegevens voorbewerken (tekstlemmatisatie), gegevensanalyse uitvoeren en de gegevens voorbereiden (tokenisatie) voor een deep learning-model. 

De End-to-end leninggoedkeuringsproject met ChatGPT is mijn favoriet. Je leert GPT-prompts beheersen voor alle stappen die betrokken zijn bij een real-life data science-project. In het project vraagt ​​u ChatGPT om u te helpen bij het maken van een end-to-end leninggoedkeuringsproject met behulp van de gegevens die zijn geëxtraheerd uit LendingClub.com.

 

5 geavanceerde projecten voor de Data Science-portfolio
Afbeelding van Lening classificatie
 

Je leert prompts schrijven om ideeën te genereren, data-analyse, feature-engineering, preprocessing en balancering van de data, modelselectie, modeltuning en evaluatie, een app te bouwen en deze op een server te implementeren. 

We bevinden ons in het stadium waarin bedrijven werknemers gaan vragen om promotievaardigheden te leren en beter te worden in het gebruik van de nieuwe AI-tools. Snelle engineering wordt een essentiële vaardigheid voor datawetenschappers en de recruiter zal vragen om ervaring met het gebruik van GPT voor datawetenschapstaken. 

Dus, waarom wachten? Begin GPT-4 en andere AI-tools te gebruiken om productief te worden en toekomstbestendig te worden. 

Zelfs als je geen ervaring hebt, zullen deze projecten je helpen om je droombaan te vinden. Nadat je aan het project hebt gewerkt, raad ik je ten zeerste aan om ze te delen op GitHub, DagsHub, Deepnote of op Kaggle. Deze platforms worden gebruikt door ontwikkelaars en datawetenschappers om hun projecten en vaardigheden te demonstreren. 

In dit bericht hebben we 5 geavanceerde projecten beoordeeld die betrekking hebben op data-analyse, tijdreeksen, natuurlijke taalverwerking, machine learning en snelle engineering met behulp van ChatGPT. Als je meer wilt weten over projecten die te maken hebben met specifieke gebieden van datawetenschap, bekijk dan de volledige verzameling datawetenschapsprojecten - Deel 1 en Deel 2.

Ik hoop dat de lijst met geavanceerde projecten je helpt, laat het me weten als je betere suggesties hebt.

 
 
Abid Ali Awan (@1abidaliawan) is een gecertificeerde datawetenschapper-professional die dol is op het bouwen van machine learning-modellen. Momenteel richt hij zich op het creëren van content en het schrijven van technische blogs over machine learning en data science-technologieën. Abid heeft een Master in Technologie Management en een Bachelor in Telecommunicatie Engineering. Zijn visie is om een ​​AI-product te bouwen met behulp van een grafisch neuraal netwerk voor studenten die worstelen met een psychische aandoening.
 

spot_img

Laatste intelligentie

spot_img