Zephyrnet-logo

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt – KDnuggets

Dato:

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
Bilde fra DALLE-3
 

Det er nå tydelig at de som tar i bruk AI raskt vil lede an, mens de som motsetter seg endring vil bli erstattet av de som allerede bruker AI. Kunstig intelligens er ikke lenger bare en forbigående kjepphest; det er i ferd med å bli et viktig verktøy i ulike bransjer, inkludert datavitenskap. Utviklere og forskere bruker i økende grad AI-drevne verktøy for å forenkle arbeidsflytene sine, og et slikt verktøy som har fått enorm popularitet nylig er ChatGPT.

I denne bloggen vil jeg diskutere de 7 beste AI-verktøyene som har gjort livet mitt som dataforsker enklere. Disse verktøyene er uunnværlige i mine daglige oppgaver, som å skrive veiledninger, undersøke, kode, analysere data og utføre maskinlæringsoppgaver. Ved å dele disse verktøyene håper jeg å hjelpe andre dataforskere og forskere strømlinjeforme arbeidsflyten deres og ligge i forkant av det stadig utviklende feltet AI.

Alle dataeksperter er kjent med pandaer, en Python-pakke som brukes til datamanipulering og -analyse. Men hva om jeg fortalte deg at i stedet for å skrive kode, kan du analysere og generere datavisualiseringer ved ganske enkelt å skrive en ledetekst eller et spørsmål? Det er hva PandasAI gjør – det er som en AI-agent for Python-arbeidsflyten din som automatiserer dataanalyse ved hjelp av ulike AI-modeller. Du kan til og med bruke lokalt drevne modeller. 

I koden nedenfor har vi laget en agent ved hjelp av pandas-datarammen og OpenAI-modellen. Denne agenten kan utføre ulike oppgaver på datarammen din ved å bruke naturlig språk. Vi stilte det et enkelt spørsmål og ba deretter om en forklaring på hvordan den kom frem til resultatene.

import os
import pandas as pd
from pandasai.llm import OpenAI
from pandasai import Agent

sales_by_country = pd.DataFrame(
    {
        "country": [
            "United States",
            "United Kingdom",
            "France",
            "Germany",
            "Italy",
            "Spain",
            "Canada",
            "Australia",
            "Japan",
            "China",
        ],
        "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000],
    }
)

llm = OpenAI(api_token=os.environ["OPENAI_API_KEY"])
pandas_ai_df = Agent(sales_by_country, config={"llm": llm})

response = pandas_ai_df.chat("Which are the top 5 countries by sales?")
explanation = pandas_ai_df.explain()

print("Answer:", response)
print("Explanation:", explanation)

 

Resultatene er fantastiske. Å eksperimentere med mine virkelige data ville ha tatt minst en halvtime.

Answer: The top 5 countries by sales are: China, United States, Japan, Germany, United Kingdom
Explanation: I looked at the data we have and found a way to sort it based on sales. Then, I picked the top 5 countries with the highest sales numbers. Finally, I put those countries into a list and created a sentence to show them as the top 5 countries by sales.

GitHub Copilot er nå nødvendig hvis du er en fulltidsutvikler eller arbeider med koden hver dag. Hvorfor? Det forbedrer din evne til å skrive ren og effektiv kode raskere. Du kan til og med chatte med filen din og feilsøke raskere eller generere kontekstbevisst kode. 

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

GitHub Copilot inkluderer AI chatbot, inline chatbox, kodegenerering, autofullføring, CLI autofullføring og andre GitHub-baserte funksjoner som kan hjelpe med kodesøk og forståelse.

GitHub Copilot er et betalt verktøy, så hvis du ikke vil betale $10 per måned, bør du sjekke ut Topp 5 AI-kodingsassistenter du må prøve.

ChatGPT har dominert AI-området i 2 år nå. Folk bruker den til å skrive e-post, generere innhold, kodegenerering og alle slags nominelle arbeidsrelaterte oppgaver. 

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

Betaler du for et abonnement får du tilgang til den topp moderne modellen GPT-4, som er utmerket til å løse komplekse problemer. 

Jeg bruker det daglig for kodegenerering, for kodeforklaring, for å stille generelle spørsmål og for innholdsgenerering. Arbeidet generert av AI er ikke alltid perfekt. Du må kanskje gjøre noen endringer for å presentere den for et bredere publikum. 

ChatGPT er et viktig verktøy for dataforskere. Å bruke det er ikke juks. I stedet sparer du tid på å undersøke og finne løsninger sammenlignet med alle andre.

Hvis du verdsetter personvern, bør du vurdere å kjøre AI-modeller med åpen kildekode på den bærbare datamaskinen. Sjekk ut 5 måter å bruke LLM på din bærbare datamaskin.

Hvis du har trent et dypt nevralt nettverk for en kompleks maskinlæringsoppgave, må du først ha trent det på Google Colab på grunn av tilgjengeligheten av fritt tilgjengelige GPUer og TPUer. Med økningen i Generativ AI har Google Colab nylig introdusert noen funksjoner som vil hjelpe deg med å generere kode, feilsøke raskere og autofullfør. 

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

Colab AI er som en integrert AI-kodingsassistent i arbeidsområdet ditt. Du kan generere kode ved ganske enkelt å spørre og stille oppfølgingsspørsmål. Den kommer også med inline-kodemelding, selv om den har begrenset bruk med gratisversjonen. 

Jeg vil på det sterkeste anbefale å kjøpe den betalte versjonen, da den gir bedre GPUer og en generelt bedre kodeopplevelse.

Oppdag Topp 11 AI-kodingsassistenter for 2024 og prøv alle alternativer til Colab AI for å finne den som passer best for deg.

Jeg har brukt Forvirringene til AI som min nye søkemotor og forskningsassistent. Det hjelper meg å lære om nye teknologier og konsepter ved å gi konsise og oppdaterte sammendrag med lenker til relevante blogger og videoer. Jeg kan til og med stille oppfølgingsspørsmål og få et endret svar. 

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

Perplexity AI tilbyr ulike funksjoner for å hjelpe brukerne. Den kan svare på et bredt spekter av spørsmål, fra grunnleggende fakta til komplekse spørsmål, ved å bruke de nyeste kildene. Copilot-funksjonen lar brukerne utforske emnene sine i dybden, slik at de kan utvide kunnskapen og oppdage nye interesseområder. Videre kan brukere organisere søkeresultatene sine i "Samlinger" basert på prosjekter eller emner, noe som gjør det lettere å finne det de trenger i fremtiden.

Sjekk ut 8 AI-drevne søkemotorer som kan forbedre internettsøk- og forskningsmulighetene dine som et alternativ til Google.

Jeg vil fortelle deg det Grammarly er et eksepsjonelt verktøy for personer med dysleksi. Det hjelper meg å skrive innhold raskt og nøyaktig. Jeg har brukt Grammarly i nesten 9 år nå, og jeg elsker funksjonene som korrigerer stavemåten, grammatikken og den generelle strukturen i skrivingen min. Nylig introduserte de Grammarly AI, som lar meg forbedre skrivingen min ved hjelp av generative AI-modeller. Dette verktøyet har gjort livet mitt enklere ettersom jeg nå kan skrive bedre e-poster, direktemeldinger, innhold, veiledninger og rapporter. Det er et viktig verktøy for meg, omtrent som Canva.

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

Klemme ansiktet er ikke bare et verktøy, men et helt økosystem som har blitt en vesentlig del av mitt daglige arbeidsliv. Jeg bruker den for å få tilgang til datasett, modeller, maskinlæringsdemoer og API-er for AI-modeller. I tillegg er jeg avhengig av ulike Hugging Face Python-pakker for opplæring, finjustering, evaluering og distribusjon av maskinlæringsmodeller.

 

De 7 beste AI-verktøyene for datavitenskap arbeidsflyt
 

Hugging Face er en åpen kildekode-plattform som er gratis for fellesskapet og lar folk være vert for datasett, modeller og AI-demoer. Den lar deg til og med distribuere modellens konklusjoner og kjøre dem på GPUer. I løpet av de neste årene vil det sannsynligvis bli den primære plattformen for datadiskusjoner, forskning og utvikling og drift.

Oppdag topp 10 datavitenskapelige verktøy å bruke i 2024 og bli en super dataforsker som løser dataproblemer bedre enn noen andre.

Jeg har brukt Travis, en AI-drevet veileder, for å forske på avanserte emner som MLOps, LLMOps og datateknikk. Den gir enkle forklaringer om disse emnene, og du kan stille oppfølgingsspørsmål akkurat som med hvilken som helst chatbot. Den er perfekt for de som bare vil ha søkeresultater fra topppublikasjoner på Medium.

I denne bloggen har vi utforsket 7 kraftige AI-verktøy som kan forbedre produktiviteten og effektiviteten til dataforskere og forskere betydelig – fra samtaledataanalyse med PandasAI til kodegenerering og feilsøkingsassistanse med GitHub Copilot og Colab AI, som tilbyr spillskiftende muligheter til forenkle komplekse koderelaterte oppgaver og spar verdifull tid. ChatGPTs allsidighet gir mulighet for innholdsgenerering, kodeforklaring og problemløsning, mens Perplexity AI gir en smart søkemotor og forskningsassistent. Grammarly AI tilbyr uvurderlig skrivehjelp, og Hugging Face fungerer som et omfattende økosystem for tilgang til datasett, modeller og API-er for å utvikle og distribuere maskinlæringsløsninger.
 
 

Abid Ali Awan (@1abidaliawan) er en sertifisert dataforsker som elsker å bygge maskinlæringsmodeller. For tiden fokuserer han på innholdsskaping og skriver tekniske blogger om maskinlæring og datavitenskapsteknologier. Abid har en mastergrad i teknologiledelse og en bachelorgrad i telekommunikasjonsteknikk. Hans visjon er å bygge et AI-produkt ved å bruke et grafisk nevralt nettverk for studenter som sliter med psykiske lidelser.

spot_img

Siste etterretning

spot_img