제퍼넷 로고

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구 - KDnuggets

시간

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
DALLE-3의 이미지
 

이제 AI를 신속하게 채택하는 사람들이 선두에 설 것이고, 변화에 저항하는 사람들은 이미 AI를 사용하고 있는 사람들로 대체될 것이 분명해졌습니다. 인공지능은 더 이상 일시적인 유행이 아닙니다. 데이터 과학을 포함한 다양한 산업에서 필수적인 도구가 되고 있습니다. 개발자와 연구원은 워크플로를 단순화하기 위해 AI 기반 도구를 점점 더 많이 사용하고 있으며, 최근 엄청난 인기를 얻은 도구 중 하나가 ChatGPT입니다.

이 블로그에서는 데이터 과학자로서의 삶을 더 쉽게 만들어준 최고의 AI 도구 7가지에 대해 논의하겠습니다. 이러한 도구는 튜토리얼 작성, 연구, 코딩, 데이터 분석, 기계 학습 작업 수행과 같은 일상적인 작업에 없어서는 안 될 요소입니다. 이러한 도구를 공유함으로써 동료 데이터 과학자와 연구원이 워크플로를 간소화하고 끊임없이 진화하는 AI 분야에서 앞서 나갈 수 있도록 돕고 싶습니다.

모든 데이터 전문가는 데이터 조작 및 분석에 사용되는 Python 패키지인 pandas에 익숙합니다. 하지만 코드를 작성하는 대신 간단히 프롬프트나 질문을 입력하여 데이터 시각화를 분석하고 생성할 수 있다고 말하면 어떻게 될까요? 그게 다야 판다AI – 이는 다양한 AI 모델을 사용하여 데이터 분석을 자동화하는 Python 워크플로용 AI 에이전트와 같습니다. 로컬로 실행되는 모델을 사용할 수도 있습니다. 

아래 코드에서는 pandas 데이터 프레임과 OpenAI 모델을 사용하여 에이전트를 만들었습니다. 이 에이전트는 자연어를 사용하여 데이터 프레임에서 다양한 작업을 수행할 수 있습니다. 우리는 간단한 질문을 한 후 어떻게 결과가 나왔는지에 대한 설명을 요청했습니다.

import os
import pandas as pd
from pandasai.llm import OpenAI
from pandasai import Agent

sales_by_country = pd.DataFrame(
    {
        "country": [
            "United States",
            "United Kingdom",
            "France",
            "Germany",
            "Italy",
            "Spain",
            "Canada",
            "Australia",
            "Japan",
            "China",
        ],
        "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000],
    }
)

llm = OpenAI(api_token=os.environ["OPENAI_API_KEY"])
pandas_ai_df = Agent(sales_by_country, config={"llm": llm})

response = pandas_ai_df.chat("Which are the top 5 countries by sales?")
explanation = pandas_ai_df.explain()

print("Answer:", response)
print("Explanation:", explanation)

 

결과는 놀랍습니다. 실제 데이터를 실험하는 데는 최소한 30분이 걸렸을 것입니다.

Answer: The top 5 countries by sales are: China, United States, Japan, Germany, United Kingdom
Explanation: I looked at the data we have and found a way to sort it based on sales. Then, I picked the top 5 countries with the highest sales numbers. Finally, I put those countries into a list and created a sentence to show them as the top 5 countries by sales.

GitHub 부조종사 풀타임 개발자이거나 매일 코드를 다루는 경우 이제 필요합니다. 왜? 깔끔하고 효과적인 코드를 더 빠르게 작성하는 능력이 향상됩니다. 파일과 채팅하여 더 빠르게 디버그하거나 상황 인식 코드를 생성할 수도 있습니다. 

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

GitHub Copilot에는 AI 챗봇, 인라인 채팅 상자, 코드 생성, 자동 완성, CLI 자동 완성 및 코드 검색 및 이해에 도움이 될 수 있는 기타 GitHub 기반 기능이 포함되어 있습니다.

GitHub Copilot은 유료 도구이므로 월 10달러를 지불하고 싶지 않다면 확인해 보세요. 반드시 시도해야 할 상위 5가지 AI 코딩 도우미.

ChatGPT 2년 동안 AI 분야를 장악해 왔습니다. 사람들은 이메일 작성, 콘텐츠 생성, 코드 생성 및 모든 종류의 명목상의 업무 관련 작업에 이를 사용합니다. 

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

구독료를 지불하면 복잡한 문제를 해결하는 데 탁월한 최첨단 모델 GPT-4에 액세스할 수 있습니다. 

나는 코드 생성, 코드 설명, 일반적인 질문 및 콘텐츠 생성을 위해 매일 사용합니다. AI가 생성한 작업이 항상 완벽한 것은 아닙니다. 더 많은 청중에게 공개하려면 일부 편집이 필요할 수도 있습니다. 

ChatGPT는 데이터 과학자에게 필수적인 도구입니다. 그것을 사용하는 것은 부정 행위가 아닙니다. 대신, 다른 사람들에 비해 솔루션을 조사하고 찾는 데 시간이 절약됩니다.

개인 정보 보호를 중요하게 생각한다면 노트북에서 오픈 소스 AI 모델을 실행하는 것을 고려해 보세요. 확인해 보세요 노트북에서 LLM을 사용하는 5가지 방법.

복잡한 기계 학습 작업을 위해 심층 신경망을 훈련했다면 먼저 다음과 같이 훈련해야 합니다. 구글 콜랩 자유롭게 액세스할 수 있는 GPU 및 TPU가 있기 때문입니다. Generative AI가 급증하면서 Google Colab은 최근 코드 생성, 디버그 속도 향상, 자동 완성에 도움이 되는 몇 가지 기능을 도입했습니다. 

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

Colab AI는 작업공간에 통합된 AI 코딩 도우미와 같습니다. 간단히 후속 질문을 표시하고 요청하여 코드를 생성할 수 있습니다. 무료 버전에서는 사용이 제한되어 있지만 인라인 코드 프롬프트도 함께 제공됩니다. 

더 나은 GPU와 전반적으로 더 나은 코딩 경험을 제공하므로 유료 버전을 구입하는 것이 좋습니다.

발견 11년 상위 2024개 AI 코딩 도우미 Colab AI의 모든 대안을 시험해보고 자신에게 가장 적합한 것을 찾으세요.

내가 사용 해왔다. 곤혹 AI 나의 새로운 검색 엔진이자 연구 조교로서. 관련 블로그 및 비디오 링크와 함께 간결하고 최신 요약을 제공하여 새로운 기술과 개념을 배우는 데 도움이 됩니다. 후속 질문을 하고 수정된 답변을 얻을 수도 있습니다. 

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

Perplexity AI는 사용자를 돕기 위해 다양한 기능을 제공합니다. 최신 소스를 활용하여 기본적인 사실부터 복잡한 쿼리까지 다양한 질문에 답할 수 있습니다. Copilot 기능을 통해 사용자는 주제를 심층적으로 탐색하여 지식을 확장하고 새로운 관심 영역을 발견할 수 있습니다. 또한 사용자는 검색 결과를 프로젝트나 주제를 기반으로 "컬렉션"으로 구성하여 나중에 필요한 것을 더 쉽게 찾을 수 있습니다.

체크 아웃 8개의 AI 기반 검색 엔진 Google의 대안으로 인터넷 검색 및 조사 기능을 향상시킬 수 있습니다.

나는 당신에게 그것을 알리고 싶습니다 문법 난독증이 있는 개인을 위한 탁월한 도구입니다. 내용을 빠르고 정확하게 작성하는 데 도움이 됩니다. 나는 거의 9년 동안 Grammarly를 사용해 왔으며, 철자, 문법, 글의 전반적인 구조를 교정해 주는 기능을 좋아합니다. 최근에는 생성적 AI 모델의 도움으로 글쓰기 능력을 향상시킬 수 있는 Grammarly AI를 도입했습니다. 이 도구를 사용하면 이제 더 나은 이메일, 다이렉트 메시지, 콘텐츠, 튜토리얼 및 보고서를 작성할 수 있으므로 내 삶이 더 쉬워졌습니다. 그것은 Canva와 마찬가지로 나에게 꼭 필요한 도구입니다.

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

포옹하는 얼굴 는 단순한 도구가 아니라 내 일상 업무에 필수적인 부분이 된 전체 생태계입니다. 저는 이를 사용하여 데이터 세트, 모델, 기계 학습 데모 및 AI 모델용 API에 액세스합니다. 또한 저는 기계 학습 모델의 교육, 미세 조정, 평가 및 배포를 위해 다양한 Hugging Face Python 패키지를 사용합니다.

 

데이터 과학 워크플로를 위한 7가지 최고의 AI 도구
 

Hugging Face는 커뮤니티에 무료로 제공되며 사람들이 데이터 세트, 모델 및 AI 데모를 호스팅할 수 있는 오픈 소스 플랫폼입니다. 모델 추론을 배포하고 GPU에서 실행할 수도 있습니다. 향후 몇 년 안에 데이터 논의, 연구 개발, 운영을 위한 기본 플랫폼이 될 가능성이 높습니다.

발견 10년에 사용할 상위 2024가지 데이터 과학 도구 누구보다 데이터 문제를 잘 해결하는 슈퍼 데이터 사이언티스트가 되어보세요.

내가 사용 해왔다. 트래비스AI 기반 교사인 는 MLOps, LLMOps 및 데이터 엔지니어링과 같은 고급 주제에 대한 연구를 수행합니다. 이러한 주제에 대한 간단한 설명을 제공하며 다른 챗봇과 마찬가지로 후속 질문을 할 수 있습니다. Medium의 최고 출판물의 검색 결과만 원하는 사람들에게 적합합니다.

이 블로그에서는 PandasAI를 사용한 대화형 데이터 분석부터 GitHub Copilot 및 Colab AI를 사용한 코드 생성 및 디버깅 지원에 이르기까지 데이터 과학자와 연구원의 생산성과 효율성을 크게 향상할 수 있는 7가지 강력한 AI 도구를 살펴보았습니다. 복잡한 코드 관련 작업을 단순화하고 귀중한 시간을 절약합니다. ChatGPT의 다재다능함은 콘텐츠 생성, 코드 설명 및 문제 해결을 가능하게 하며 Perplexity AI는 스마트 검색 엔진 및 연구 보조 기능을 제공합니다. Grammarly AI는 귀중한 글쓰기 지원을 제공하며 Hugging Face는 기계 학습 솔루션을 개발하고 배포하기 위해 데이터 세트, 모델 및 API에 액세스하기 위한 포괄적인 생태계 역할을 합니다.
 
 

아비드 알리 아완 (@1abidaliawan)는 기계 학습 모델 구축을 좋아하는 공인 데이터 과학자 전문가입니다. 현재 그는 콘텐츠 제작에 집중하고 있으며 기계 학습 및 데이터 과학 기술에 대한 기술 블로그를 작성하고 있습니다. Abid는 기술 관리 석사 학위와 통신 공학 학사 학위를 보유하고 있습니다. 그의 비전은 정신 질환으로 어려움을 겪고 있는 학생들을 위해 그래프 신경망을 사용하여 AI 제품을 구축하는 것입니다.

spot_img

최신 인텔리전스

spot_img