By John P. Desmond、AIトレンド編集者
AIインフラストラクチャアライアンス は形になりつつあり、「AIおよび機械学習操作(MLOps)の正規スタック」を定義する取り組みにサインアップするパートナーを追加しています。 プログラミングでは、「規則に従った標準的な手段」は、 ウェブペディア.
組織の使命には、そのWebサイトによると、次のものも含まれます。企業組織でAI / MLを大規模に実行するためのベストプラクティスとアーキテクチャを開発する。 AI / MLのアルゴリズム、ツール、ライブラリ、フレームワーク、モデル、データセットのオープン性を促進します。 データセットの匿名化とプライバシーの保護に役立つ差分プライバシーなどのテクノロジーを提唱する。 AI / MLアプリケーション間でデータを共有するための普遍的な標準に向けて取り組みます。
組織のウェブサイトにリストされているコアメンバーは次のとおりです。 決定されたAI, 機械学習とAIアプリケーションに関する開発者の生産性の向上、リソース使用率の向上に焦点を当てた初期段階の企業, リスクを軽減します。
defined.aiチームには、Spark MLlib、Apache Mesos、PostgreSQLの主要な貢献者を含む、機械学習と分散システムの専門家が含まれます。 カリフォルニア大学バークレー校とシカゴ大学の博士号。 カーネギーメロン大学の教員。 投資家には、GV(以前のGoogle Ventures)、Amplify Partners、CRV、Haystack、SV Angel、The House、およびSpecializedTypesが含まれます。 Crunchbaseによると、2017年に設立された同社は、これまでに総額13.6万ドルを調達しました。
決定されたCEOのエバンスはAIスタックを「定義する必要がある」と述べています
「At 決定、私たちは常にAIの民主化に注力してきました。私たちのチームは、AIネイティブのソフトウェアインフラストラクチャをより広い市場にもたらす将来について、非常に楽観的です」と、決定された共同創設者兼CEOのEvan Sparksは、AITrendsからの問い合わせに対するメールの返信で述べています。会社が同盟に加わった理由について。 「これと同じ考え方が私たちを オープンソース 昨年、業界全体でより多くのチームにリーチするためのソフトウェア。 ソフトウェアがAIによってますます強化されるにつれて、ソフトウェアの開発と実行をサポートするインフラストラクチャスタックを定義する必要があると考えています。」
彼は、XNUMXつの会社にとって課題が大きすぎると感じました。 「AIアプリケーションがR&Dから本番環境に移行する過程で、複数の企業がさまざまな問題を解決し、データサイエンティストや機械学習エンジニアに利益をもたらすインターフェースと標準を定義するために協力する必要があります。 AIインフラストラクチャアライアンスは、これを実現するための強力な力となる準備ができています。」
スパークス氏は、AIインフラストラクチャアライアンスの使命が重要である理由を尋ねられ、次のように述べています。 で 決定、私たちはコラボレーションをこれを達成するために重要であると考えています。 AIインフラストラクチャアライアンスに参加することで、AIの成功がどのように見えるかについての長期的なフレームワークを作成しながら、私たち自身のスペースでより志を同じくする企業と協力し、AIの未来を創造するために不可欠な構成要素をまとめる機会が得られました。 」
トレーニング用のデータセットの品質に焦点を当てたスーパーAI
別のコアメンバーは 優れたAI, AIアプリケーションのデータセットのトレーニングを支援することに焦点を当てた会社。 同社は、ラベリングツール、トレーニングデータの品質管理、事前トレーニング済みのモデル予測、高度な自動ラベル付け、データセットのフィルタリングと検索の機能を提供しています。
CEO兼共同創設者の金賢洙は2018年に他のXNUMX社とともに会社を立ち上げました 共同創設者。 彼はデューク大学でロボット工学とAIの博士号を取得しているときに、この会社のアイデアを思いつきました。 AIアルゴリズムでコンピューターをトレーニングするためにデータにラベルを付けるプロセスは、費用がかかり、手間がかかり、エラーが発生しやすくなりました。 「これは、ディープラーニングシステムを構築するには、労働集約的な手作業を伴う大量のラベル付きデータが必要であり、スタンドアロンのAIシステムは、ほとんどの状況で完全に信頼できるほど正確ではないためです」とキム氏は フォーブス.
Crunchbaseによると、これまでに同社は2.3万ドルを調達しました。 シリコンバレーのスタートアップアクセラレーターであるYCombinator、デューク大学、シリコンバレー、ソウル、ドバイのVC企業からの支持を集めています。
Pachydermのプラットフォームはデータサイエンティストをターゲットにしています
別のコアメンバーは 厚皮類、 d説明可能で再現性のある開発をサポートするためのオープンソースデータサイエンスプラットフォームとして記述, スケーラブルなML / AIアプリケーション。 このプラットフォームは、バージョン管理とツールを組み合わせて、スケーラブルなエンドツーエンドのML / AIパイプラインを構築すると同時に、開発者が選択した言語とフレームワークを使用できるようにします。
同社の顧客の中には、ボストンを拠点とするユニファイドコミュニケーションとコラボレーションのためのクラウドベースのSaaSサービスのサプライヤーであるLogMeInがあります。 イスラエルにあるLogMeInのAIセンターオブエクセレンスでは、同社のチームがテキスト、オーディオ、ビデオを扱っており、データサイエンティストが製品ライン全体に機械学習機能を提供するために、迅速に処理してラベルを付ける必要があります。
「AIハブでの私たちの仕事は、私たちの場合、音声認識とNLPのクラス最高のMLモデルをもたらすことです」と、音声AI製品マネージャーのEyal Heldenbergは、PachydermWebサイトに投稿されたケーススタディで述べています。 「MLサイクルにはトレーニングだけでなく、多くのデータ準備手順と反復が含まれていることが明らかになりました。」 たとえば、オーディオを処理するXNUMXつのステップは、Amazon WebServicesが提供する最大のコンピューターマシンで最大XNUMX週間かかります。 「これは、研究チームにとって多くの非生産的な時間を意味します」と、LogMeInデータサイエンスエンジニアのMosheAbramovitch氏は述べています。
Pachydermのテクノロジーは、その並列処理によりほぼ無制限のスケーリングが可能であったため、概念実証テストに選択されました。 その結果、データの変換に10〜XNUMX週間かかる代わりに、Pachydermの製品はXNUMX〜XNUMX時間で作業を実行できました。 この技術には他にもメリットがありました。
「私たちのモデルはより正確であり、生産と顧客の手にはるかに早く到達しています」とヘルデンバーグは述べています。 「時間の無駄なビルディングブロックのようなデータ準備を削除すると、チェーン全体がその影響を受けます。 データの処理に数週間から数時間かかることができれば、それはすべての人に大きな影響を及ぼします。 このようにして、研究、モデルの操作、より優れたモデルとより優れたモデルの作成など、楽しいことに集中できます。」
Crunchbaseによると、2014年に設立されたPachydermは、これまでに28.1万ドルを調達しました。
で詳細はこちら AIインフラストラクチャアライアンス, 決定されたAI, 優れたAI, in フォーブス とで 厚皮.