ゼファーネットのロゴ

データサイエンティストになるべきではない7つの理由 – KDnuggets

日付:

データサイエンティストになるべきではない7つの理由
編集者による画像
 

あなたは意欲的なデータサイエンティストですか? もしそうなら、データ サイエンスのキャリアへの転向に成功した多くの人を見たり聞いたりしたことがあるでしょう。 そして、あなたもいつかは切り替えたいと思っているはずです。

データサイエンティストとして働くことには、いくつかの興味深い点があります。 あなたはできる:

  • ドメイン間で移転可能なハードスキルとソフトスキルを構築する 
  • データを使ってストーリーを伝える 
  • ビジネス上の質問にデータで答える
  • ビジネス上の問題に対する影響力のあるソリューションを構築する 

さらに多くのこと。 これらすべてが刺激的であるように聞こえるかもしれませんが、データ サイエンティストであることも、それ以上ではないにしても、同様に困難です。 しかし、それらの課題にはどのようなものがあるでしょうか? 

さあ、ダイビングしましょう。

コーディングと技術スキルを磨いていると、おそらく一人で作業することに慣れてくるでしょう。 ただし、データ サイエンティストとしては、コラボレーションとコミュニケーションを優先する必要があります。 なぜなら、データ サイエンスは、データを解析したり、個別に数値を処理したりすることではないからです。 

同じチームだけでなく、多くの場合、複数のチームにまたがる他の専門家と協力する必要があります。 したがって、多様なチームや関係者と協力する能力は、技術的なスキルと同じくらい重要です。 

さらに、調査結果や洞察を、ビジネス リーダーなど、技術以外の関係者に伝えることもできなければなりません。

ニシャ・アリア・アーメッドデータサイエンティスト兼テクニカルライターである 氏は、次のように共有しています。

「データ サイエンス チームでは、各タスク、その責任、すべてがどのように連携して機能するかについて、他のデータ サイエンスの専門家と協力することになります。 すでに行った作業を繰り返して、より多くの時間とリソースを消費したくないので、これは重要です。 また、協力しなければならないのはデータ専門家だけではなく、製品、マーケティング、その他の関係者を含む部門横断的なチームの一員となることになります。」

– Nisha Arya Ahmed 氏、データ サイエンティスト兼テクニカル ライター

プロジェクトに取り組み、完了し、本番環境に移行することが好きな人にとっては、データ サイエンスがやりがいのあるキャリアだとは思えないかもしれません。

一連の目標を設定してプロジェクトを開始し、繰り返し洗練および改善しますが、組織のビジネス目標の変化に応じてプロジェクトの範囲を変更する必要が生じることがよくあります。 おそらく、関係者は新たな有望な方向性を見出しているのでしょう。

したがって、プロジェクトの範囲を効果的に再優先順位付けして変更する必要があります。 そして最悪の場合、必要に応じてプロジェクトを放棄することになります。 

また、スタートアップの初期段階では、多くの場合、複数の帽子をかぶる必要があります。 つまり、あなたの仕事はモデルの構築だけでは終わりません。 機械学習モデルを運用環境にデプロイできたとしても、モデルのパフォーマンスを監視し、ドリフトに注意し、必要に応じてモデルを回帰し、再トレーニングする必要があります。

アビッド・アリ・アワンKDnuggets のライター、編集者、データ サイエンティストは、次のように共有しています。

「会社で働いていると、複数のチームを切り替えて、異なるプロジェクトに同時に取り組む必要が生じることがよくあります。 ただし、取り組んでいるプロジェクトのほとんどは、本番環境にすら到達しない可能性があります。 

会社の優先順位が変更されたり、プロジェクトの影響が十分に大きくなかったりする可能性があるためです。 チームやプロジェクトを頻繁に切り替えるのは疲れる可能性があり、自分が何に貢献しているのかがわからなくなるかもしれません。」

– Abid Ali Awan、KDnuggets ライター、編集者、データ サイエンティスト

したがって、データ サイエンス プロジェクトに取り組むことは、プロジェクトを終了して次のプロジェクトに進むという、開始から終了までの直線的なプロセスではありません。 

XNUMX つの異なる組織で働くデータ サイエンティストの XNUMX 日は、まったく異なるものになる可能性があります。 データ サイエンティスト、機械学習エンジニア、MLOps エンジニアの役割には、多くの重複する機能があることがよくあります。

あなたがデータ サイエンティストで、予測モデルの構築に非常に興味があるとします。 そして、あなたは興味のある組織でデータ サイエンティストの役割を獲得しました。 

ただし、スプレッドシートで数値を計算したりレポートを作成したりするのに XNUMX 日を費やしたとしても、驚かないでください。 または、SQL を使用してデータベースからデータを取得します。 SQL を使用してデータをラングリングし、ビジネス上の質問に対する答えを見つけるほうがデータ アナリストの役割に適していると考えるかもしれません。

また、場合によっては、モデルの構築と運用環境へのデプロイ、ドリフトの監視、必要に応じたモデルの再トレーニングを担当することもあります。 この場合、あなたはデータ サイエンティストであり、データ サイエンティストの帽子もかぶっています。 MLOps エンジニア

データキャリアにおける役割の流動性についてアビッド氏の意見を聞いてみましょう。

「私は「データサイエンティスト」と呼ばれることにいつも戸惑っています。 それは一体何を意味するのでしょうか? 私はデータ アナリスト、ビジネス インテリジェンス エンジニア、機械学習エンジニア、MLOps エンジニア、またはそのすべてですか? 小規模な会社や新興企業で働いている場合、会社内での役割は流動的です。 ただし、大規模な組織では、役割がより明確に区別される場合があります。 ただし、役割が完全に定義されているという保証はありません。 あなたはデータサイエンティストかもしれません。 しかし、あなたが行う仕事の多くは、ビジネス目標に沿った分析レポートを作成することになるでしょう。」

– Abid Ali Awan、KDnuggets ライター、編集者、データ サイエンティスト

データ サイエンティストは、技術的には興味深いが関連性が低いプロジェクトを追求するのではなく、ビジネスに最も重大な影響を与えるプロジェクトに取り組みを向けるべきです。 この目的を達成するには、次の理由からビジネス目標を理解することが重要です。

  • ビジネス目標を理解すると、組織の変化するニーズに基づいてプロジェクトを適応させ、優先順位を再設定することができます。
  • データ サイエンス プロジェクトの成功は、多くの場合、ビジネスへの影響によって測られます。 したがって、ビジネス目標をよく理解すると、プロジェクトの成功を評価するための明確なフレームワークが提供され、技術的な側面が具体的なビジネス成果に結び付けられます。

マシュー・メイヨーKDnuggets の編集長兼データ サイエンティストは、ビジネスの成果に対する無関心がもたらすコストについて次のように語っています。

「データ サイエンティストとして、ビジネス目標に無関心であれば、レーザー ポインターを追いかける猫になるのと同じかもしれません。自分が過剰に活動的で目的もなく、あまり価値のあるものを何も達成できないことに気づくでしょう。 ビジネス目標を理解し、それをビジネスからデータスピーキングに変換できることは重要なスキルであり、これがなければ、最も洗練された無関係なモデルの構築に時間を費やすことになるでしょう。 機能するディシジョン ツリーは、毎日最先端の失敗に打ち勝ちます。」

– Matthew Mayo 氏、KDnuggets 編集長兼データ サイエンティスト

これに関してニシャは次のように述べています。

「何をするにも、その背後に理由が必要です。 これはあなたの意図であり、行動の前にあります。 データの世界に関しては、ビジネスと課題を理解することが不可欠です。 これがなければ、プロセス全体で混乱するだけです。 データ サイエンス プロジェクトを進めるたびに、プロジェクトの動機となる目標を参照したくなるでしょう。」 

– Nisha Arya Ahmed 氏、データ サイエンティスト兼テクニカル ライター

したがって、データ サイエンスは、単に数値を計算して複雑なモデルを構築することだけを意味するものではありません。 それよりもデータを活用してビジネスの成功を推進することが重要です。 

ビジネス目標をしっかりと理解していなければ、プロジェクトは解決すべきビジネス上の問題から逸脱し、その価値と影響力の両方が低下してしまう可能性があります。

モデルを構築するのは楽しいです。 ただし、そこに至るまでの道のりはそれほど面白くないかもしれません。 

かなりの時間を費やすことが予想されます。

  • データの収集 
  • 使用するデータの最も関連性の高いサブセットを特定する
  • データをクリーニングして分析に適したものにする 

さて、これはあまりエキサイティングな仕事ではありません。 多くの場合、機械学習モデルを構築する必要さえありません。 データをデータベースに保存したら、SQL を使用して質問に答えることができます。 この場合、機械学習モデルを構築する必要さえありません。

アビッドは、重要な仕事が往々にして面白くないことについて、彼の見解を共有しています。

「同じことを繰り返し行うのは面倒かもしれません。 多くの場合、データのクリーニングというタスクが割り当てられることがありますが、特に多様なデータセットを扱う場合、これは非常に困難になる可能性があります。 さらに、データ検証や単体テストの作成などのタスクは、それほど楽しいものではないかもしれませんが、必要です。」

– Abid Ali Awan、KDnuggets ライター、編集者、データ サイエンティスト

したがって、データ サイエンスのキャリアで成功するには、データ (良いもの、悪いもの、醜いものを含む) を扱うプロセスを楽しむ必要があります。 データサイエンスとは、データから価値を引き出すことがすべてだからです。 多くの場合、それは最も派手なモデルを構築することではありません。

データ サイエンティストとして、すべてを学習したと言えるレベルに到達することは (おそらく) 決して不可能です。 何をどれだけ学ぶ必要があるかは、取り組んでいる内容によって異なります。

今後は新しいフレームワークを学習して使用するなど、非常に単純なタスクになる可能性があります。 または、セキュリティとパフォーマンスを強化するために既存のコードベースを Rust などの言語に移行するなど、より面倒な作業もあります。 技術的に強いことに加えて、フレームワーク、ツール、プログラミング言語を必要に応じて迅速に学習し、強化できる必要があります。 

さらに、必要に応じて、そのドメインとビジネスについてさらに学ぶ意欲が必要です。 データ サイエンスのキャリアを通じて、単一のドメインで働くことはほとんどありません。 たとえば、ヘルスケア分野のデータ サイエンティストとしてスタートし、その後フィンテックや物流などの分野に進むこともできます。

大学院時代、私は病気の予後プロジェクトで医療分野の機械学習に取り組む機会がありました。 高校生以降は生物学を読んだことがありませんでした。 そのため、最初の数週間は、特定の生体信号の特性、特徴など、その専門性を探ることに専念しました。 これらは、レコードの前処理に進む前に非常に重要でした。

カンワル・メーリーン、テクニカル ライターが自分の経験を次のように語っています。

「ようやく新しいスキルを習得して、「ああ、これでいいんだ」と思ったときの気持ち、わかりますか? まあ、データサイエンスでは、その瞬間は決してやって来ません。 この分野は常に進化しており、新しいテクノロジー、ツール、方法論が頻繁に登場しています。 したがって、学習を後回しにして一定のレベルに達することを好む人には、データ サイエンスのキャリアは最適ではないかもしれません。 

さらに、データ サイエンスは、統計、プログラミング、機械学習、専門分野の知識が美しく融合したものです。 ヘルスケアから金融、マーケティングに至るまで、さまざまな領域を探索するという考えに興奮を覚えないと、自分のキャリアに迷ってしまうことになるかもしれません。」

– Kanwal Mehreen、テクニカル ライター

したがって、データサイエンティストとして、継続的な学習とスキルアップを決して避けてはなりません。

データ サイエンティストになるためのいくつかの課題についてはすでに概説しました。

  • コーディングとモデル構築の技術的スキルを超えて
  • ドメインとビジネス目標を理解する 
  • 現状を維持するために継続的に学習しスキルアップする 
  • 文字通りの意味でのプロジェクトの完了を心配せずに積極的に行動する 
  • 優先順位の再設定、後退、変更を行う準備ができている
  • 退屈だが必要な仕事をする 

他の技術職と同様に、難しいのは データサイエンティストとしての職に就く。 それは成功するデータサイエンスのキャリアを構築することです。

Mathew Mayo は、データ サイエンティストとしてこれらの課題にどのように対処すべきかを適切に要約しています。

「仕事を始めた瞬間に学習をやめて、最新のツール、コツ、テクニックについて心配する必要がない、のんびりとしたキャリアをお探しですか? まあ、データサイエンスのことは忘れてください! データプロフェッショナルとして静かなキャリアを期待することは、カクテル傘と楽観的な態度だけを武器に、モンスーンの中を乾いた散歩を期待するのと同じです。 

この分野は、技術的なパズルと非技術的な謎のノンストップのジェットコースターです。ある日、アルゴリズムを深く掘り下げていると、次の日には、回帰をある種の世界への後退だと考える人に自分の発見を説明しようとしています。子供のような行動状態。 しかし、スリルはこうした挑戦の中にあり、それがカフェインだらけの脳を楽しませてくれるのです。 

挑戦することにアレルギーがある場合は、編み物にもっと慰めを見つけるかもしれません。 しかし、データの氾濫との対決からまだ身を引いていないのであれば、データ サイエンスは単なるコーヒーかもしれません。」

– Matthew Mayo 氏、KDnuggets 編集長兼データ サイエンティスト

これについてKanwal氏の意見を聞いてみましょう。

「この事実に直面しましょう。データ サイエンスは常に順風満帆ではありません。 データは必ずしもきちんと整理されたパッケージで提供されるわけではありません。 データは嵐を経験したかのように見える場合があり、不完全であったり、一貫性がなかったり、さらには不正確である可能性があります。 このデータをクリーニングして前処理して、分析との関連性を確認するのは困難な場合があります。

学際的な分野で働いているときは、技術以外の関係者とやり取りする必要がある場合があります。 彼らに技術的な概念を説明し、それが彼らの目的とどのように一致するかを説明することは、非常に困難な場合があります。

したがって、明確で単純なキャリアパスを好む人にとって、データサイエンスのキャリアは障害に満ちている可能性があります。」

– Kanwal Mehreen、テクニカル ライター

したがって、データ サイエンスは単に数学とモデルに関するものではありません。 データから意思決定を行うことです。 そしてその過程では、常に学習してスキルを向上させ、ビジネス目標や市場動向などを理解する意欲が必要です。

回復力を持って乗り越えたい、やりがいのあるキャリアを探しているのであれば、データサイエンスは確かに良いキャリアオプションです。 楽しく探検してください!

データ サイエンスのキャリアのさまざまな側面について洞察を共有してくれた Matthew、Abid、Nisha、Kanwal に感謝します。 そして、この記事をより興味深く楽しい読み物にしていただきありがとうございます。
 
 

バラ プリヤ C インド出身の開発者兼テクニカル ライターです。 彼女は、数学、プログラミング、データ サイエンス、コンテンツ作成が交わる場所で働くのが好きです。 彼女の興味と専門分野には、DevOps、データ サイエンス、自然言語処理が含まれます。 彼女は読書、執筆、コーディング、コーヒーが好きです。 現在、彼女はチュートリアル、ハウツー ガイド、意見記事などを作成して、学習し、開発者コミュニティと知識を共有することに取り組んでいます。

スポット画像

最新のインテリジェンス

スポット画像