ゼファーネットのロゴ

初めてのデータ サイエンスの仕事に就くための 7 つのステップ – KDnuggets

日付:

初めてのデータ サイエンスの仕事に就くための 7 つのステップ
著者による画像
 

データサイエンスのキャリアへの転職を検討していますか?もしそうなら、すでにオンラインコースやブートキャンプなどにサインアップしている可能性があります。おそらく、これから取り組む予定の独習データ サイエンス ロードマップをブックマークしているかもしれません。それでは、さらにもう 1 つのガイド、つまりこのガイドはどのように役立つのでしょうか?

データ サイエンスのキャリアを追求すると決めた場合は、それに向かって努力する必要があります。他に方法はありません。また、データ サイエンスの仕事に就くことは、単にデータ サイエンスの概念を学ぶだけではありません。また、学習の過程であっても、学習する必要がある概念、ツール、テクニック、ライブラリの量が膨大になる場合があります。

この記事はクリックベイトではありません。したがって、X 日以内にデータ サイエンスの仕事に就くことができるという高尚な約束はありません。むしろ、私たちはデータ サイエンスの就職プロセスに対して総合的なアプローチを提供します。これには以下が含まれます:

  • データサイエンスの概念を学ぶ 
  • 技術的な専門知識を披露するプロジェクトに取り組む 
  • プロとして自分自身をマーケティングする
  • 面接に向けて戦略的に準備する 

このガイドがあなたのお役に立てば幸いです。

データ サイエンスに参入するには、まずプログラミングと問題解決における強固な基礎を築く必要があります。 Python を第一言語として学ぶことをお勧めします。 

わかりやすい構文といくつかの優れた学習リソースにより、数時間で Python を使い始めることができます。その後、Python を使用した次のプログラミングの基礎に集中して数週間を費やすことができます。

  • 組み込みデータ構造
  • ループ 
  • 機能 
  • クラスとオブジェクト 
  • 関数型プログラミングの基礎
  • Python の機能: 内包表記とジェネレーター

Python のクイックスタート ガイドが必要な場合は、次のリンクを参照してください。 今回のPython講座は ハーバード大学のCS50コースで。より没入型の学習については、こちらをご覧ください Python によるプログラミングの概要、ハーバード大学の無料コースでもあります。 

練習として、上記の Python コースのプロジェクトに取り組み、いくつかの問題を解決する練習もできます。 ハッカークラン

また、この段階では、快適なはずです コマンドラインで作業する。作成方法や操作方法を学ぶことも役立ちます。 Python の仮想環境.

どのようなデータ ロールに適用するかに関係なく、SQL を学習して習熟することは非常に重要です。次のトピックから始めることができます。

  • 基本的なSQLクエリ 
  • 条件付きフィルタリング 
  • ジョイン 
  • サブクエリ 
  • SQL 文字列関数 

Python と同様に、SQL にも専用の練習が必要であり、役立つものがいくつかあります。 SQLを練習するためのプラットフォーム。チュートリアルを使いたい場合は、こちらをご覧ください Mode Analytics による SQL チュートリアル.

これで Python の基礎ができたので、Python を使用して Web スクレイピングを学習して、その基礎を築くことができます。データの専門家として、データ収集に慣れている必要があるからです。具体的には、プログラムで Web をスクレイピングし、API からの JSON 応答を解析します。

基本的な HTTP メソッドに慣れたら、次のことを学習して Python スキルを高めることができます。

この時点で、単純な Web スクレイピング プロジェクトのコーディングを試すことができます。興味を持ってもらえるように、シンプルでありながら共感できるものにしてください。たとえば、後で分析できるように、Amazon からショッピング データを収集したいとします。これは単なる例です。興味のあるプロジェクトに取り組むことができます。

データ サイエンスの学習のこの時点では、Python と SQL の両方に慣れているはずです。これらの基本的なスキルがあれば、データの分析と視覚化を進めてデータをより深く理解できるようになります。

この無料 Pythonによるデータ分析 freeCodeCamp の認定コースでは、知っておく必要がある重要な Python データ サイエンス ライブラリをすべてカバーしています。いくつかの簡単なプロジェクトをコーディングすることもできます。

ここでも、プロジェクトを構築する機会があります。Web スクレイピングを使用してデータを収集してみてください。パンダを使用して分析します。次のような図書館を学びます ストリームライト 分析結果を表示する対話型ダッシュボードを作成します。

プログラミングとデータ分析を使用すると、興味深いプロジェクトを構築できます。ただし、機械学習の基礎を学ぶことも役立ちます。

アルゴリズムの動作を詳しく学ぶ時間がない場合でも、次の点に重点を置いてください。

  • アルゴリズムがどのように機能するかについての高レベルの概要を取得し、 
  • scikit-learn を使用してモデルを構築する

この scikit-learn 短期集中コース scikit-learn を使用した機械学習モデルの構築を迅速に行うのに役立ちます。 scikit-learn を使用してベースライン モデルを構築する方法を学習したら、より良いモデルを構築するために次の点にも重点を置く必要があります。

  • データ前処理 
  • 機能エンジニアリング 
  • ハイパーパラメータ調整 

今度はプロジェクトを構築します。融資不履行予測プロジェクトなどの単純なものから始めて、徐々に従業員減少予測やマーケット バスケット分析などに移行することができます。

前のステップでは、学習を強化するためのプロジェクトの構築について説明しました。ただし、意欲的なデータ プロフェッショナルのほとんどは、次の点に重点を置く傾向があります。 学習 そして、興味深いプロジェクトのポートフォリオを構築するこのステップを見逃してください。 適用 部。

どれだけ学んで(知っていても)、自分の専門知識をアピールできるプロジェクトがなければ、採用担当者にあなたの専門知識を納得させることはできません。

プロジェクトを紹介する単純なページの作成にはフロントエンドのコーディングが多くかかるため、ほとんどの学習者はポートフォリオを構築しません。おそらく、プロジェクトのコードへの変更を追跡するために、有益な README ファイルを備えた GitHub リポジトリを使用しているでしょう。ただし、プロジェクトを紹介するデータ サイエンス ポートフォリオを構築するには、他のものをチェックしてください。 Kaggle や DataSciencePortfol.io などの無料プラットフォーム.

ヘルスケア、フィンテック、サプライ チェーンなど、データ サイエンスの役割を獲得したいドメインに応じてプロジェクトを選択してください。そうすることで、自分の興味と熟練度の両方を示すことができます。あるいは、いくつかのプロジェクトを構築して、興味のある分野を見つけ出すこともできます。

オンラインで検索して自分の経験をアピールすることは、どちらも就職活動のプロセス、特にキャリアの初期段階で役立ちます。そのため、オンラインでの強力なプレゼンスを構築することが次のステップとなります。

この目的を達成するには、以下を使用して独自の個人 Web サイトを構築するのが最善の方法です。

  • 有益な「概要」ページと連絡先情報
  • あなたが書いた記事やチュートリアルを特集するブログ 
  • あなたが取り組んだプロジェクトの詳細が記載されたプロジェクト ページ  

個人のウェブサイトを持つことが常に推奨されます。ただし、就職活動のプロセスでは、少なくとも LinkedIn プロフィールと Twitter (現在は X) ハンドルを持っている必要があります。 

Twitter では、関連する見出しを追加し、共有される技術的およびキャリアに関するアドバイスに有意義に取り組みます。 LinkedIn では、プロフィールが可能な限り完全かつ正確であることを確認してください。

  • あなたの専門知識を反映するように見出しを更新してください
  • 経験と教育のセクションに記入します 
  • 「プロジェクト」セクションで、プロジェクトを簡単な説明とともに追加します。プロジェクトへのリンクも
  • 公開した記事をプロフィールに追加する

これらのプラットフォームでネットワークを構築する場合は、積極的に行ってください。また、学んだことを定期的に共有してください。まだ自分のブログを書き始めたくない場合は、ライティング スキルを高めるためにソーシャル メディアに書いてみてください。 

学んだばかりのデータ サイエンスの概念や取り組んでいるプロジェクトについて、LinkedIn の投稿や記事を書くことができます。または、学んだことやその過程で犯した間違い、そこから学んだことについてツイートします。 

このステップがプロジェクト ポートフォリオの構築と完全に分離しているわけではないことに注意してください。技術スキルを磨き、プロジェクト (そう、ポートフォリオ) を構築することに加えて、オンラインでのプレゼンスも構築したいと考えています。採用担当者が候補者を探しているときにあなたを見つけて、関連する機会を提供できるようにします。

データ サイエンスの面接を突破するには、問題解決スキルをテストするコーディング ラウンドと、データ サイエンスについての理解を示すことができる重要な技術面接の両方に取り組む必要があります。

少なくともデータ構造とアルゴリズムに関する入門コースを受講し、その後問題を解決することをお勧めします。 ハッカークラン & リートコード。時間が足りない場合は、次のような問題集に取り組むことができます。 ブラインド75。この問題集には、配列、動的プログラミング、文字列、グラフなど、すべての主要な概念にわたる質問が含まれています。

すべてのデータ サイエンス面接では、少なくとも SQL ラウンドが行われます。 Hackerrank や Leetcode でも SQL を練習できます。さらに、以前に尋ねられた面接の質問を、次のようなプラットフォームで解決することができます。 ストラタスクラッチ & データキツネザル.

これらのコーディング面接に合格して次のラウンドに進むと、データ サイエンスに関する熟練度を証明できるはずです。自分のプロジェクトを詳しく知っている必要があります。あなたが取り組んだプロジェクトを説明するときは、次のことも説明できる必要があります。

  • あなたが解決しようとしたビジネス上の問題
  • なぜそのようにアプローチしたのか
  • このアプローチがどのように、そしてなぜ良いのか

アルゴリズムと概念の観点だけでなく、ビジネス目標の理解とビジネス上の問題の解決の観点からも準備することに重点を置きます。

そしてそれはラップです。このガイドでは、最初のデータ サイエンスの役割に就くためのさまざまな手順について説明しました。 

また、データサイエンスの概念を学ぶことに加えて、専門家および将来の候補者として自分自身をマーケティングすることの重要性についても説明しました。データ サイエンスの概念の学習に関連する手順については、役立つリソースも検討しました。

データ サイエンスの旅の幸運を祈ります。
 
 

バラ プリヤ C インド出身の開発者兼テクニカル ライターです。 彼女は、数学、プログラミング、データ サイエンス、コンテンツ作成が交わる場所で働くのが好きです。 彼女の興味と専門分野には、DevOps、データ サイエンス、自然言語処理が含まれます。 彼女は読書、執筆、コーディング、コーヒーが好きです。 現在、彼女はチュートリアル、ハウツー ガイド、意見記事などを作成して、学習し、開発者コミュニティと知識を共有することに取り組んでいます。

スポット画像

最新のインテリジェンス

スポット画像