和風網標誌

適用於資料科學工作流程的 7 個最佳人工智慧工具 – KDnuggets

日期:

適用於資料科學工作流程的 7 個最佳 AI 工具
圖片來自 DALLE-3
 

現在很明顯,那些迅速採用人工智慧的人將引領潮流,而那些抵制變革的人將被那些已經在使用人工智慧的人所取代。人工智慧不再只是曇花一現的時尚;它正在成為包括數據科學在內的各個行業的重要工具。開發人員和研究人員越來越多地使用人工智慧驅動的工具來簡化他們的工作流程,最近廣受歡迎的工具之一就是 ChatGPT。

在這篇部落格中,我將討論 7 個最好的人工智慧工具,它們讓我作為資料科學家的生活變得更加輕鬆。這些工具在我的日常任務中是不可或缺的,例如編寫教程、研究、編碼、分析資料和執行機器學習任務。透過分享這些工具,我希望幫助資料科學家和研究人員簡化他們的工作流程,並在不斷發展的人工智慧領域保持領先地位。

每個資料專業人員都熟悉 pandas,這是一個用於資料操作和分析的 Python 套件。但是,如果我告訴您,您無需編寫程式碼,只需輸入提示或問題即可分析和生成資料視覺化,該怎麼辦?就是這樣 熊貓人工智能 確實如此——它就像 Python 工作流程的 AI 代理,可以使用各種 AI 模型自動進行資料分析。您甚至可以使用本地運行的模型。 

在下面的程式碼中,我們使用 pandas 資料框和 OpenAI 模型建立了一個代理程式。該代理程式可以使用自然語言對您的資料框執行各種任務。我們問了它一個簡單的問題,然後要求它解釋如何得出結果。

import os
import pandas as pd
from pandasai.llm import OpenAI
from pandasai import Agent

sales_by_country = pd.DataFrame(
    {
        "country": [
            "United States",
            "United Kingdom",
            "France",
            "Germany",
            "Italy",
            "Spain",
            "Canada",
            "Australia",
            "Japan",
            "China",
        ],
        "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000],
    }
)

llm = OpenAI(api_token=os.environ["OPENAI_API_KEY"])
pandas_ai_df = Agent(sales_by_country, config={"llm": llm})

response = pandas_ai_df.chat("Which are the top 5 countries by sales?")
explanation = pandas_ai_df.explain()

print("Answer:", response)
print("Explanation:", explanation)

 

結果是驚人的。用我的現實數據進行實驗至少需要半小時。

Answer: The top 5 countries by sales are: China, United States, Japan, Germany, United Kingdom
Explanation: I looked at the data we have and found a way to sort it based on sales. Then, I picked the top 5 countries with the highest sales numbers. Finally, I put those countries into a list and created a sentence to show them as the top 5 countries by sales.

GitHub 副駕駛 如果您是全職開發人員或每天處理程式碼,現在是必要的。為什麼?它增強了您更快地編寫乾淨有效的程式碼的能力。您甚至可以與文件聊天並更快地調試或生成上下文感知代碼。 

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

GitHub Copilot 包括 AI 聊天機器人、內嵌聊天框、程式碼產生、自動完成、CLI 自動完成以及其他基於 GitHub 的功能,可協助搜尋和理解程式碼。

GitHub Copilot 是一款付費工具,因此如果您不想每月支付 10 美元,那麼您應該查看一下 您必須嘗試的 5 款人工智慧編碼助手.

ChatGPT 兩年來一直主導人工智慧領域。人們用它來編寫電子郵件、生成內容、生成程式碼以及各種名義上的與工作相關的任務。 

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

如果您付費訂閱,您就可以獲得最先進的型號 GPT-4,它非常適合解決複雜問題。 

我每天都用它來產生程式碼、解釋程式碼、詢問一般問題以及產生內容。人工智慧生成的工作並不總是完美的。您可能需要進行一些編輯才能將其呈現給更廣泛的受眾。 

ChatGPT 是資料科學家的必備工具。使用它並不是作弊。相反,與其他人相比,它可以節省您研究和尋找解決方案的時間。

如果您重視隱私,請考慮在筆記型電腦上執行開源人工智慧模型。查看 在筆記型電腦上使用 LLM 的 5 種方法.

如果您已經為複雜的機器學習任務訓練了深度神經網絡,那麼您必須先對其進行訓練 谷歌合作實驗室 由於可以免費存取 GPU 和 TPU。隨著生成式 AI 的興起,Google Colab 最近推出了一些功能,可協助您產生程式碼、更快地偵錯和自動完成。 

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

Colab AI 就像是您工作空間中的整合 AI 編碼助理。您只需提示並詢問後續問題即可產生程式碼。它還帶有內聯代碼提示,儘管它在免費版本中的使用有限。 

我強烈建議您購買付費版本,因為它提供更好的 GPU 和整體更好的編碼體驗。

探索 11 年 2024 名人工智慧編碼助手 並嘗試 Colab AI 的所有替代方案,找到最適合您的方案。

我一直在用 困惑人工智能 作為我的新搜尋引擎和研究助理。它提供簡潔且最新的摘要以及相關部落格和視頻的鏈接,幫助我了解新技術和概念。我甚至可以提出後續問題並得到修改後的答案。 

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

Perplexity AI 提供各種功能來幫助使用者。它可以使用最新的資源來回答從基本事實到複雜查詢的各種問題。其 Copilot 功能可讓使用者深入探索他們的主題,使他們能夠擴展知識並發現新的興趣領域。此外,使用者還可以根據項目或主題將搜尋結果組織成“集合”,以便將來更容易找到所需的內容。

付款 8 個由人工智慧驅動的搜尋引擎 作為 Google 的替代品,它可以增強您的網路搜尋和研究能力。

我想讓你知道 grammarly破解 對於患有閱讀障礙的人來說,這是一個特別的工具。它幫助我快速且準確地撰寫內容。我使用 Grammarly 已經將近 9 年了,我喜歡它的功能,可以修正我的拼字、文法和寫作的整體結構。最近,他們推出了 Grammarly AI,它使我能夠在生成式 AI 模型的幫助下提高我的寫作水平。這個工具讓我的生活變得更輕鬆,因為我現在可以寫更好的電子郵件、私訊、內容、教學和報告。它對我來說是一個重要的工具,就像 Canva 一樣。

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

擁抱臉 它不僅僅是一個工具,而是一個完整的生態系統,已成為我日常工作生活的重要組成部分。我用它來存取資料集、模型、機器學習演示和 AI 模型的 API。此外,我還依賴各種 Hugging Face Python 套件來訓練、微調、評估和部署機器學習模型。

 

適用於資料科學工作流程的 7 個最佳 AI 工具
 

Hugging Face 是一個開源平台,對社群免費,讓人們可以託管資料集、模型和 AI 演示。它甚至允許您部署模型推理並在 GPU 上運行它們。未來幾年,它很可能成為數據討論、研發和營運的主要平台。

探索 10 年最常使用的 2024 種資料科學工具 並成為超級數據科學家,比任何人都更能解決數據問題。

我一直在用 特拉維斯是一位人工智慧導師,負責 MLOps、LLMOps 和資料工程等高階主題的研究。它提供了這些主題的簡單解釋,您可以像使用任何聊天機器人一樣提出後續問題。對於那些只想從 Medium 上的頂級出版物搜尋結果的人來說,它是完美的選擇。

在這篇部落格中,我們探索了7 個強大的人工智慧工具,它們可以顯著提高資料科學家和研究人員的生產力和效率——從PandasAI 的對話式資料分析到GitHub Copilot 和Colab AI 的程式碼生成和調試幫助,為資料科學家和研究人員提供改變遊戲規則的功能。簡化複雜的程式碼相關任務並節省寶貴的時間。 ChatGPT 的多功能性允許內容產生、程式碼解釋和解決問題,而 Perplexity AI 則提供智慧搜尋引擎和研究助理。 Grammarly AI 提供了寶貴的寫作協助,Hugging Face 作為一個全面的生態系統,用於存取資料集、模型和 API,以開發和部署機器學習解決方案。
 
 

阿比德·阿里·阿萬 (@1abidaliawan)是一位經過認證的資料科學家專業人士,熱愛建立機器學習模型。目前,他專注於內容創作和撰寫有關機器學習和數據科學技術的技術部落格。阿比德擁有技術管理碩士學位和電信工程學士學位。他的願景是使用圖神經網路為患有精神疾病的學生建立人工智慧產品。

現貨圖片

最新情報

現貨圖片