ゼファーネットのロゴ

データ サイエンス ワークフローに最適な 7 つの AI ツール – KDnuggets

日付:

データ サイエンス ワークフローに最適な 7 つの AI ツール
DALLE-3 からの画像
 

AI を迅速に導入する企業が先頭に立ち、変化に抵抗する企業がすでに AI を使用している企業に取って代わられることは明らかです。人工知能はもはや単なる一時的な流行ではありません。データ サイエンスを含むさまざまな業界で不可欠なツールになりつつあります。開発者や研究者は、ワークフローを簡素化するために AI を活用したツールをますます使用しています。そのようなツールの 1 つが、最近非常に人気を得ています。ChatGPT です。

このブログでは、データ サイエンティストとしての私の生活を楽にしてくれた 7 つの最高の AI ツールについて説明します。これらのツールは、チュートリアルの作成、調査、コーディング、データ分析、機械学習タスクの実行など、私の日常業務に不可欠です。これらのツールを共有することで、仲間のデータ サイエンティストや研究者がワークフローを合理化し、進化し続ける AI 分野で常に時代の先を行くのを支援したいと考えています。

すべてのデータ専門家は、データの操作と分析に使用される Python パッケージである pandas に精通しています。しかし、コードを記述する代わりに、プロンプトまたは質問を入力するだけでデータの視覚化を分析および生成できると言ったらどうなるでしょうか?それが何です パンダAI これは、さまざまな AI モデルを使用してデータ分析を自動化する Python ワークフローの AI エージェントのようなものです。ローカルで実行されるモデルを使用することもできます。 

以下のコードでは、pandas データフレームと OpenAI モデルを使用してエージェントを作成しました。このエージェントは、自然言語を使用してデータフレーム上でさまざまなタスクを実行できます。簡単な質問をして、その結果に至った経緯について説明を求めました。

import os
import pandas as pd
from pandasai.llm import OpenAI
from pandasai import Agent

sales_by_country = pd.DataFrame(
    {
        "country": [
            "United States",
            "United Kingdom",
            "France",
            "Germany",
            "Italy",
            "Spain",
            "Canada",
            "Australia",
            "Japan",
            "China",
        ],
        "sales": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000],
    }
)

llm = OpenAI(api_token=os.environ["OPENAI_API_KEY"])
pandas_ai_df = Agent(sales_by_country, config={"llm": llm})

response = pandas_ai_df.chat("Which are the top 5 countries by sales?")
explanation = pandas_ai_df.explain()

print("Answer:", response)
print("Explanation:", explanation)

 

結果は驚くべきものでした。実際のデータを使って実験すると、少なくとも 30 分はかかるでしょう。

Answer: The top 5 countries by sales are: China, United States, Japan, Germany, United Kingdom
Explanation: I looked at the data we have and found a way to sort it based on sales. Then, I picked the top 5 countries with the highest sales numbers. Finally, I put those countries into a list and created a sentence to show them as the top 5 countries by sales.

GitHubコパイロット フルタイムの開発者である場合、または毎日コードを扱う場合には、これが必要になります。なぜ?これにより、クリーンで効果的なコードをより速く書く能力が強化されます。ファイルとチャットしてデバッグを高速化したり、コンテキストを認識したコードを生成したりすることもできます。 

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

GitHub Copilot には、AI チャットボット、インライン チャットボックス、コード生成、オートコンプリート、CLI オートコンプリート、およびコードの検索と理解に役立つその他の GitHub ベースの機能が含まれています。

GitHub Copilot は有料ツールなので、月額 10 ドルを支払いたくない場合は、チェックしてください。 ぜひ試してほしいAIコーディングアシスタントトップ5.

AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 は 2 年間にわたり AI 分野を支配しています。人々は、電子メールの作成、コンテンツの生成、コードの生成、およびあらゆる種類の名目上の仕事関連タスクにこれを使用します。 

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

サブスクリプションの料金を支払うと、複雑な問題の解決に優れた最先端のモデル GPT-4 にアクセスできるようになります。 

私はコードの生成、コードの説明、一般的な質問、コンテンツの生成に毎日使用しています。 AIによって生み出される仕事は必ずしも完璧であるとは限りません。より多くの聴衆に提示するには、いくつかの編集が必要になる場合があります。 

ChatGPT はデータ サイエンティストにとって不可欠なツールです。それを使用することは不正行為ではありません。その代わり、他の人に比べて、調査や解決策の発見にかかる時間を節約できます。

プライバシーを重視する場合は、ラップトップでオープンソース AI モデルを実行することを検討してください。チェックアウト ラップトップで LLM を使用する 5 つの方法.

複雑な機械学習タスク用にディープ ニューラル ネットワークをトレーニングした場合は、まず次の条件でトレーニングしておく必要があります。 グーグルコラボ 自由にアクセスできる GPU と TPU が利用できるためです。 Generative AI の急増に伴い、Google Colab は最近、コードの生成、デバッグの高速化、オートコンプリートに役立ついくつかの機能を導入しました。 

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

Colab AI は、ワークスペースに統合された AI コーディング アシスタントのようなものです。プロンプトを表示してフォローアップの質問をするだけで、コードを生成できます。インライン コード プロンプトも付属していますが、無料版では使用が制限されています。 

より優れた GPU と全体的に優れたコーディング エクスペリエンスを提供するため、有料版を入手することを強くお勧めします。

発見 11 年の AI コーディング アシスタント トップ 2024 Colab AI の代替手段をすべて試して、自分に最適なものを見つけてください。

私は使っている 困惑AI 私の新しい検索エンジンおよび研究アシスタントとして。関連するブログやビデオへのリンクを含む簡潔で最新の概要が提供されるため、新しいテクノロジーや概念について学ぶのに役立ちます。フォローアップの質問をして、修正された回答を受け取ることもできます。 

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

Perplexity AI は、ユーザーを支援するさまざまな機能を提供します。最新のソースを使用して、基本的な事実から複雑な質問まで、幅広い質問に答えることができます。そのコパイロット機能を使用すると、ユーザーはトピックを深く探索でき、知識を広げ、新しい興味分野を発見できるようになります。さらに、ユーザーは検索結果をプロジェクトやトピックに基づいて「コレクション」に整理できるため、将来必要なものを見つけやすくなります。

チェックアウト 8 つの AI を活用した検索エンジン Google に代わるものとして、インターネットの検索と調査機能を強化できます。

お知らせしたいのですが 文法 ディスレクシアの人にとっては優れたツールです。コンテンツを迅速かつ正確に書くのに役立ちます。私はもう 9 年近く Grammarly を使用していますが、スペル、文法、文章の全体的な構造を修正してくれる機能が気に入っています。最近、Grammarly AI が導入されました。これにより、生成 AI モデルの助けを借りて文章を改善できるようになりました。このツールのおかげで、より良いメール、ダイレクト メッセージ、コンテンツ、チュートリアル、レポートを作成できるようになり、作業が楽になりました。 Canvaと同じように、私にとって不可欠なツールです。

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

ハグ顔 は単なるツールではなく、エコシステム全体であり、私の日々の仕事生活に不可欠な部分となっています。これを使用して、データセット、モデル、機械学習デモ、AI モデルの API にアクセスします。さらに、機械学習モデルのトレーニング、微調整、評価、デプロイには、さまざまな Hugging Face Python パッケージを利用しています。

 

データ サイエンス ワークフローに最適な 7 つの AI ツール
 

Hugging Face は、コミュニティに無料で提供されるオープンソース プラットフォームで、データセット、モデル、AI デモをホストできるようになります。モデル推論をデプロイし、GPU 上で実行することもできます。今後数年間で、これはデータの議論、研究開発、運用のための主要なプラットフォームになる可能性があります。

発見 10 年に使用すべきデータ サイエンス ツール トップ 2024 誰よりもデータの問題を解決できるスーパー データ サイエンティストになりましょう。

私は使っている トラビスは、MLOps、LLMOps、データ エンジニアリングなどの高度なトピックに関する研究を行う、AI を活用した家庭教師です。これらのトピックに関する簡単な説明が提供され、他のチャットボットと同様にフォローアップの質問をすることができます。 Medium のトップ出版物からの検索結果のみが必要な場合に最適です。

このブログでは、PandasAI による会話型データ分析から、GitHub Copilot と Colab AI によるコード生成とデバッグ支援まで、データ サイエンティストや研究者の生産性と効率を大幅に向上させる 7 つの強力な AI ツールを検討してきました。複雑なコード関連のタスクを簡素化し、貴重な時間を節約します。 ChatGPT の多用途性により、コンテンツの生成、コードの説明、問題解決が可能になり、Perplexity AI はスマートな検索エンジンとリサーチ アシスタントを提供します。 Grammarly AI は非常に貴重な執筆支援を提供し、Hugging Face はデータセット、モデル、API にアクセスして機械学習ソリューションを開発および展開するための包括的なエコシステムとして機能します。
 
 

アビッド・アリ・アワン (@ 1abidaliawan) は、機械学習モデルの構築を愛する認定データ サイエンティストのプロフェッショナルです。現在はコンテンツ制作に注力し、機械学習やデータサイエンス技術に関する技術ブログを執筆している。アビッドは、テクノロジー管理の修士号と電気通信工学の学士号を取得しています。彼のビジョンは、精神疾患に苦しむ学生のためにグラフ ニューラル ネットワークを使用して AI 製品を構築することです。

スポット画像

最新のインテリジェンス

スポット画像