ゼファーネットのロゴ

需要のあるデータキャリア:Crowd SolutionsArchitectの説明

日付:

需要のあるデータキャリア:Crowd SolutionsArchitectの説明

クラウドソーシングは、組織のデータチームのアプリケーションをどのようにサポートできますか? より高品質のデータに対する需要がますます高まる中、Crowd Solutions Architect(CSA)の新しい役割は、大衆の可能性を活用して、効果的なAI主導のソリューションを提供するビジネスの能力に利点をもたらすことができます。


By ダリア・バイダコワ、Tolokaの教育プログラムのディレクター.

データ関連の役割のキャリアランドスケープ内では、多くの職業が共存しており、その正確な定義は、長年の経験を持つ人々の間でさえ、しばしば議論の対象となります。 データキャリアの展望は、増大するビジネス上の課題に対応するために絶えず進化しており、事実上毎年新しい役割が追加されているため、これは驚くべきことではありません。

最近で KDナゲット 記事、最も一般的なデータ関連の職業のいくつかが説明されました:

  • データアーキテクト(データの管理と保存に関心があります)。
  • データエンジニア(データパイプラインの構築と保守に関係します)。
  • データアナリスト(データの分析と表現に関心があります)。
  • 機械学習エンジニア(機械学習アルゴリズムの開発と最適化に関心があります)。
  • データサイエンティスト(データが提供できる洞察に関心がある)。

この記事では、もうXNUMXつの需要の高い役割であるクラウドソリューションアーキテクトの役割を簡単に評価します。

クラウドソーシング

今日、これまで以上に多くの開発者 必要とする あらゆる段階でAIモデルにフィードするための大量のデータ。 その結果、データのラベル付けが優先事項になりました。 クラウドソーシングは、何よりも、この目的のための十分な機会を提供します。 たとえば、データにラベルを付ける必要があります。数十万のWebドキュメントを分類するか、大量の音声録音を書き写します。 このようなタスクに取り組むには、基本的にXNUMXつの方法があります。

  • タスク固有の分野の専門家の小グループを取得し、彼らに多額の支払いをして、配達を数週間または数か月待つことができます。
  • 多数のユーザーを引き付け、スキルでフィルタリングし、目前のタスクのためにユーザーをすばやく事前トレーニングし、各ユーザーに小さな部分を提供してもらい、最後のステップとして、収集できたものを集約します。 そうすれば、はるかに短い期間で、より低いコストで、完了したタスクを取得できます。

MITPressから出版された本、Daren Brabhamは、クラウドソーシングを単に「オンラインコミュニティのエネルギーの統合…ボトムアップのオープンで創造的なプロセスとトップダウンの組織目標の意図的なブレンド」と定義しています。 したがって、クラウドソーシングは本質的に、データ生成のための一種の大規模なアウトソーシングです。

グループインテリジェンスクラスター(異なるデータポイントは異なる意見またはタスクセグメントを表します)出典:Toloka.ai

Crowd Solutions Architect(CSA)

今約束された仕事のために。 クラウドソーシングは、クラウドソーシングタスクの実行を理解し、モデル化し、最終的に促進する役割を持つCSAなしでは不可能です。 この役割でどれだけ快適かは、いくつかの要因(特に、作業するITインフラストラクチャ)によって異なりますが、より広義には、この仕事は初心者とベテランの両方に適しています。 十分な訓練を受けた新人であり、ドアに足を踏み入れたいと考えている場合でも、スキルセットを拡大したい中レベルの機械学習スペシャリストでも、クラウドソーシングを会社のデータラベリングに利用したいと考えている定評のあるエキスパートでも、これらはすべて実行可能なシナリオがいたるところに発生しています。

あなたの経歴が何であれ、まだエントリー要件があります。 間違いなく、最も重要なのはコーディングスキル(Python、SQL、HTML、CSS、JavaScript)と、MLと統計の適切な把握です。 しかし、それだけではありません。 CSAの仕事を他の多くのITポジションと一線を画すのは、ビジネスの目標と戦略を理解することと、コードだけでなく人間と連携する方法を知ることのXNUMXつの重要なスキルが必要なことです。 前者は、タスクの商業的目的(技術的な側面だけでなく)を完全に理解する必要があることを意味しますが、後者は、必要に応じて貢献者を支援する準備ができている人間志向の人である必要があることを意味します。 このため、この仕事を「データと人の両方のエンジニア」と考える人もいます。

アプリケーション

クラウドソーシングとCSAの両方が、研究と製品開発の複数の領域にわたって観察されます。 それらの中には、自然言語処理、コンピュータービジョン、データセットの強化、および情報検索があります。

今日のすべてのAI開発は、アルゴリズム、ハードウェア/パフォーマンス、データラベリングというXNUMXつの異なるパラダイムに基づいています。 最初のXNUMXつはすでに「商品」になっており、多くのプレーヤーがほぼ同じツールと手法を使用していますが、ほとんどのAIプロジェクトが完了したとしても、リストの最後の項目であるデータラベリングは最も探索されていません。 彼らの成功の大部分は 正確なラベリングに。

出典:Toloka.ai

データラベリングの問題を最も効果的かつ迅速に解決できる人は誰でも、スケーラブルなデータラベリングパイプラインの構築と維持に至るまで、ビジネスで優位に立つことができます。 企業の人力がこの重要な側面に専念すればするほど、そのビジネスとそのニーズを迅速に合理化できる可能性が高くなります。 これは、機械学習のためにより多くのデータセットを探索し、新しいアルゴリズム(古き良き試行錯誤)を継続的に実験することを意味します。

CSAになる

CSAになることに興味がある場合は、スタンフォード大学から業界で有利なスタートを切ることができる高品質のコースが利用可能です。 Courseraの機械学習コース ハーバードへ データサイエンスの専門資格、コーネル大学 ML証明書、およびMITの AIのプロフェッショナル認定プログラム.

アカデミアの世界以外のクラウドソーシングの実践者から学ぶことを好む人は、タイトルが付けられた新しいコースに登録できるようになりました 効率的な機械学習のための実用的なクラウドソーシング。 このハンズオンオンラインコースは初心者に適しており、完了するまでに約23時間かかり、完了時に共有可能な証明書を提供します。 他の主題の中で、データラベリングの品質と正確さが教えられています。 成功した卒業生は、フルサイクルのクラウドソーシングプロジェクトを実行することにより、アルゴリズムを試運転する機会があります。

関連する

コインスマート。 BesteBitcoin-ヨーロッパのBörse
出典:https://www.kdnuggets.com/2021/06/data-careers-crowd-solutions-architect.html

スポット画像

最新のインテリジェンス

スポット画像

私たちとチャット

やあ! どんな御用でしょうか?