Zephyrnet-logotyp

De 7 bästa AI-verktygen för datavetenskap arbetsflöde – KDnuggets

Datum:

De 7 bästa AI-verktygen för Data Science Workflow
Bild från DALLE-3
 

Det är nu uppenbart att de som snabbt tar till sig AI kommer att leda vägen, medan de som motsätter sig förändring kommer att ersättas av de som redan använder AI. Artificiell intelligens är inte längre bara en förbigående modefluga; det håller på att bli ett viktigt verktyg i olika branscher, inklusive datavetenskap. Utvecklare och forskare använder allt mer AI-drivna verktyg för att förenkla sina arbetsflöden, och ett sådant verktyg som har vunnit enorm popularitet nyligen är ChatGPT.

I den här bloggen kommer jag att diskutera de 7 bästa AI-verktygen som har gjort mitt liv som datavetare enklare. Dessa verktyg är oumbärliga i mina dagliga uppgifter, som att skriva tutorials, forska, koda, analysera data och utföra maskininlärningsuppgifter. Genom att dela dessa verktyg hoppas jag kunna hjälpa andra dataforskare och forskare effektivisera sina arbetsflöden och ligga steget före inom det ständigt utvecklande området AI.

Varje dataproffs är bekant med pandas, ett Python-paket som används för datamanipulation och analys. Men vad händer om jag sa till dig att istället för att skriva kod kan du analysera och generera datavisualiseringar genom att helt enkelt skriva en uppmaning eller en fråga? Det är vad PandasAI gör – det är som en AI-agent för ditt Python-arbetsflöde som automatiserar dataanalys med hjälp av olika AI-modeller. Du kan till och med använda lokalt körda modeller. 

I koden nedan har vi skapat en agent med hjälp av pandas dataram och OpenAI-modell. Denna agent kan utföra olika uppgifter på din dataram med naturligt språk. Vi ställde en enkel fråga och bad sedan om en förklaring av hur den kom fram till resultatet.

import os
import pandas as pd
from pandasai.llm import OpenAI
from pandasai import Agent

sales_by_country = pd.DataFrame(
    {
        "country": [
            "United States",
            "United Kingdom",
            "France",
            "Germany",
            "Italy",
            "Spain",
            "Canada",
            "Australia",
            "Japan",
            "China",
        ],
        "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000],
    }
)

llm = OpenAI(api_token=os.environ["OPENAI_API_KEY"])
pandas_ai_df = Agent(sales_by_country, config={"llm": llm})

response = pandas_ai_df.chat("Which are the top 5 countries by sales?")
explanation = pandas_ai_df.explain()

print("Answer:", response)
print("Explanation:", explanation)

 

Resultaten är fantastiska. Att experimentera med mina verkliga data skulle ha tagit minst en halvtimme.

Answer: The top 5 countries by sales are: China, United States, Japan, Germany, United Kingdom
Explanation: I looked at the data we have and found a way to sort it based on sales. Then, I picked the top 5 countries with the highest sales numbers. Finally, I put those countries into a list and created a sentence to show them as the top 5 countries by sales.

GitHub Copilot är nu nödvändigt om du är en heltidsutvecklare eller hanterar koden varje dag. Varför? Det förbättrar din förmåga att skriva ren och effektiv kod snabbare. Du kan till och med chatta med din fil och felsöka snabbare eller generera kontextmedveten kod. 

 

De 7 bästa AI-verktygen för Data Science Workflow
 

GitHub Copilot inkluderar AI-chatbot, inline chatbox, kodgenerering, autocomplete, CLI autocomplete och andra GitHub-baserade funktioner som kan hjälpa till med kodsökning och förståelse.

GitHub Copilot är ett betalverktyg, så om du inte vill betala $10/månad bör du kolla in Topp 5 AI-kodningsassistenter du måste prova.

ChatGPT har dominerat AI-utrymmet i 2 år nu. Människor använder det för att skriva e-postmeddelanden, generera innehåll, kodgenerering och alla typer av nominella arbetsrelaterade uppgifter. 

 

De 7 bästa AI-verktygen för Data Science Workflow
 

Om du betalar för ett abonnemang får du tillgång till den toppmoderna modellen GPT-4, som är utmärkt på att lösa komplexa problem. 

Jag använder det dagligen för kodgenerering, för kodförklaring, för att ställa allmänna frågor och för innehållsgenerering. Arbetet som genereras av AI är inte alltid perfekt. Du kan behöva göra några ändringar för att presentera den för en bredare publik. 

ChatGPT är ett viktigt verktyg för datavetare. Att använda det är inte fusk. Istället sparar det dig tid på att undersöka och hitta lösningar jämfört med alla andra.

Om du värdesätter integritet, överväg att köra AI-modeller med öppen källkod på din bärbara dator. Kolla upp 5 sätt att använda LLM på din bärbara dator.

Om du har tränat ett djupt neuralt nätverk för en komplex maskininlärningsuppgift måste du först ha tränat på det Google Colab på grund av tillgången på fritt tillgängliga GPU:er och TPU:er. Med ökningen av Generativ AI har Google Colab nyligen introducerat några funktioner som hjälper dig att generera kod, felsöka snabbare och autoslutföra. 

 

De 7 bästa AI-verktygen för Data Science Workflow
 

Colab AI är som en integrerad AI-kodningsassistent i din arbetsyta. Du kan generera kod genom att helt enkelt fråga och ställa uppföljningsfrågor. Den kommer också med inline koduppmaning, även om den har begränsad användning med gratisversionen. 

Jag skulle starkt rekommendera att skaffa den betalda versionen eftersom den ger bättre GPU:er och en överlag bättre kodningsupplevelse.

Upptäck Topp 11 AI-kodningsassistenter för 2024 och prova alla alternativ till Colab AI för att hitta den som passar dig bäst.

Jag har använt AI:s förvirring som min nya sökmotor och forskningsassistent. Det hjälper mig att lära mig om nya tekniker och koncept genom att tillhandahålla kortfattade och uppdaterade sammanfattningar med länkar till relevanta bloggar och videor. Jag kan till och med ställa följdfrågor och få ett modifierat svar. 

 

De 7 bästa AI-verktygen för Data Science Workflow
 

Perplexity AI erbjuder olika funktioner för att hjälpa sina användare. Den kan svara på ett brett spektrum av frågor, från grundläggande fakta till komplexa frågor, med hjälp av de senaste källorna. Dess Copilot-funktion låter användare utforska sina ämnen på djupet, vilket gör det möjligt för dem att utöka sin kunskap och upptäcka nya intresseområden. Dessutom kan användare organisera sina sökresultat i "Samlingar" baserat på projekt eller ämnen, vilket gör det lättare att hitta det de behöver i framtiden.

Checka ut 8 AI-drivna sökmotorer som kan förbättra din internetsökning och forskning som ett alternativ till Google.

Jag vill låta dig veta det Grammarly är ett exceptionellt verktyg för personer med dyslexi. Det hjälper mig att skriva innehåll snabbt och korrekt. Jag har använt Grammarly i nästan 9 år nu, och jag älskar funktionerna som korrigerar min stavning, grammatik och övergripande struktur i mitt skrivande. Nyligen introducerade de Grammarly AI, vilket gör att jag kan förbättra mitt skrivande med hjälp av generativa AI-modeller. Det här verktyget har gjort mitt liv enklare eftersom jag nu kan skriva bättre e-postmeddelanden, direktmeddelanden, innehåll, tutorials och rapporter. Det är ett viktigt verktyg för mig, ungefär som Canva.

 

De 7 bästa AI-verktygen för Data Science Workflow
 

Kramande ansikte är inte bara ett verktyg, utan ett helt ekosystem som har blivit en väsentlig del av mitt dagliga arbetsliv. Jag använder den för att komma åt datauppsättningar, modeller, maskininlärningsdemonstrationer och API:er för AI-modeller. Dessutom förlitar jag mig på olika Hugging Face Python-paket för utbildning, finjustering, utvärdering och implementering av maskininlärningsmodeller.

 

De 7 bästa AI-verktygen för Data Science Workflow
 

Hugging Face är en öppen källkodsplattform som är gratis för communityn och som låter människor vara värd för datamängder, modeller och AI-demos. Det låter dig till och med distribuera dina modellers slutledningar och köra dem på GPU:er. Under de närmaste åren kommer det sannolikt att bli den primära plattformen för datadiskussioner, forskning och utveckling och drift.

Upptäck topp 10 datavetenskapliga verktyg att använda 2024 och bli en superdataforskare som löser dataproblem bättre än någon annan.

Jag har använt Travis, en AI-driven handledare, för att bedriva forskning om avancerade ämnen som MLOps, LLMOps och datateknik. Den ger enkla förklaringar om dessa ämnen och du kan ställa uppföljningsfrågor precis som med vilken chatbot som helst. Det är perfekt för dem som bara vill ha sökresultat från topppublikationer på Medium.

I den här bloggen har vi utforskat sju kraftfulla AI-verktyg som avsevärt kan förbättra produktiviteten och effektiviteten hos datavetare och forskare – från konversationsdataanalys med PandasAI till kodgenerering och felsökningshjälp med GitHub Copilot och Colab AI, som erbjuder spelförändrande möjligheter till förenkla komplexa kodrelaterade uppgifter och spara värdefull tid. ChatGPT:s mångsidighet möjliggör generering av innehåll, kodförklaring och problemlösning, medan Perplexity AI ger en smart sökmotor och forskningsassistent. Grammarly AI erbjuder ovärderlig skrivhjälp, och Hugging Face fungerar som ett omfattande ekosystem för åtkomst till datauppsättningar, modeller och API:er för att utveckla och distribuera lösningar för maskininlärning.
 
 

Abid Ali Awan (@1abidaliawan) är en certifierad datavetare som älskar att bygga modeller för maskininlärning. För närvarande fokuserar han på att skapa innehåll och skriva tekniska bloggar om maskininlärning och datavetenskap. Abid har en magisterexamen i teknikledning och en kandidatexamen i telekommunikationsteknik. Hans vision är att bygga en AI-produkt med hjälp av ett grafiskt neuralt nätverk för studenter som kämpar med psykisk ohälsa.

plats_img

Senaste intelligens

plats_img