ゼファーネットのロゴ

dotDataは、機械学習を便利にするために主要なデータ機能を抽出します

日付:

でエンタープライズデータテクノロジーと戦略を向上させます 変換2021.


多くの人工知能の専門家は、AIアルゴリズムの実行は仕事の一部にすぎないと言います。 データの準備とクリーニングは始まりですが、本当の課題は、何を研究し、どこで答えを探せばよいかを理解することです。 トランザクション元帳に隠されていますか? それともカラーパターンで? AIアルゴリズムが調査する適切な機能を見つけるには、AIアルゴリズムが適切な場所を探すようにガイドされるために、ビジネス自体に関する深い知識が必要になることがよくあります。

ドットデータ その作業を自動化したいと考えています。 同社は、企業が AI処理、およびそのような機能を探すのに最適な場所を見つける。 同社は、ユーザーが概念実証(POC)をすばやく構築できるようにする、機械学習ツールキットのコンテナ化バージョンであるdotDataPyLiteをリリースしました。 回答を探しているデータ所有者は、ツールキットをダウンロードしてローカルで実行するか、dotDataのクラウドサービスで実行することができます。

VentureBeatは、dotDataの創設者兼CEOである藤巻遼平氏と話し合い、新製品と、時間よりも多くのデータを持っている人のためにAIワークロードを簡素化する同社の幅広いアプローチにおけるその役割について話し合いました。

VentureBeat:ツールをデータベースまたはAIエンジンとして考えていますか?

藤巻 Ryo平: 私たちのツールはAIエンジンに近いものですが、データと[緊密に統合]されています。 多くの企業にはXNUMXつの主要なデータステージがあります。 まず、主に生データであるデータ レイクがあります。 次に、データウェアハウスの段階があります。これは、いくらかクレンジングされ、設計されています。 良好な状態ですが、まだ簡単には消耗しません。 次に、データマートがあります。これは、目的指向の目的固有のデータテーブルのセットです。 それは簡単に消費されます ビジネス・インテリジェンス または機械学習アルゴリズム。

間のデータの処理を開始します データレイクとデータウェアハウス ステージ。 [それから準備する] 機械学習アルゴリズム用。 私たちの真のコア・コンピタンスであるコア・ケイパビリティーは、このプロセスを自動化することです。

VentureBeat:広大な海で適切なデータを見つけるプロセス?

藤巻: これは、データレイクとデータウェアハウスの段階の間のどこかで生データから始まり、多くのデータクレンジングを実行し、機械学習アルゴリズムを提供する「機能エンジニアリング」と考えています。

VentureBeat:機械学習は重要な機能を見つけるのに役立ちますか?

藤巻: はい。 機能エンジニアリング 基本的には、ドメインの専門知識に基づいて機械学習の問題を調整しています。

VentureBeat:それはどれくらいうまく機能しますか?

藤巻: 私たちの最高の顧客事例研究の300つは、サブスクリプション管理ビジネスから来ています。 そこで同社はプラットフォームを使用して顧客を管理しています。 問題は、取引の拒否または遅延が多いことです。 それは彼らにとってほぼXNUMX億ドルの問題です。

dotDataの前は、112のクエリを手動で作成して、14つのテーブルの75の元の列に基づいて機能セットを構築していました。 それらの精度は約122,000%でした。 しかし、データセットから90つのテーブルを取得し、XNUMXの機能パターンを発見しました。 精度はXNUMX%以上に跳ね上がりました。

VentureBeat: 手動で発見された特徴は良かったのですが、あなたの機械学習は何千倍もの特徴を発見し、精度が飛躍的に向上しましたか?

藤巻: はい。 この精度は技術的な改善にすぎません。 最終的に、彼らは悪い取引のほぼ35%を回避することができました。 それはほぼ100億ドルです。

14つのテーブルの300の異なる列から、XNUMXつのテーブルのほぼXNUMXの列を検索しました。 私たちのプラットフォームは、どの機能パターンがより有望でより重要であるかを特定し、重要な機能を使用することで、精度を大幅に向上させることができます。

VentureBeat:では、どのような機能を発見するのでしょうか?

藤巻: 製品需要予測の別のケーススタディを見てみましょう。 発見された機能は非常に単純です。 機械学習では、過去14日間の売上などのトランザクションテーブルからの時間的集計を使用しています。 明らかに、これは来週の製品需要に影響を与える可能性があるものです。 販売または家庭用品の場合、機械学習アルゴリズムは28日間のウィンドウが最良の予測因子であることを発見していました。

VentureBeat:それはただのウィンドウですか?

藤巻: 私たちのエンジンは、家庭用品の特定の販売傾向パターンを自動的に検出できます。 これは、部分的または年次の周期的パターンと呼ばれます。 このアルゴリズムは、クリスマスや感謝祭などの季節イベントの効果にとって特に重要な年次の周期的パターンを検出します。 このユースケースでは、多くの支払い履歴があり、非常に魅力的な履歴です。

VentureBeat: 良いデータを見つけるのは難しいですか?

藤巻: 多くの場合それはたくさんありますが、それは必ずしも良いとは限りません。 一部の製造業の顧客は、サプライチェーンを研究しています。 私は製造会社からのこのケーススタディが好きです。 彼らはdotDataを使用してセンサーデータを分析しており、それはたくさんあります。 彼らはいくつかの故障パターンを検出するか、製造プロセスからの歩留まりを最大化しようとします。 工場内の[モノのインターネット]センサーにストリーム予測エンジンを導入することで、それらをサポートしています。

VentureBeat: あなたのツールは、人間がこれらすべての組み合わせを探したり想像したりする手間を省きます。 データサイエンスをより簡単にする必要があります。

藤巻: 従来、このタイプの機能エンジニアリングでは、データが非常に大きく、組み合わせが非常に多いため、多くのデータエンジニアリングスキルが必要でした。

現在、ほとんどのユーザーはデータサイエンティストではありません。 いくつかのプロファイルがあります。 XNUMXつは、[ビジネスインテリジェンス]タイプのユーザーのようなものです。 記述的分析のためのダッシュボードを構築していて、予測分析の実行にステップアップしたい視覚化の専門家のように。

もうXNUMX人は、この種のデータモデルの概念に精通しているデータエンジニアまたはシステムエンジニアです。 システムエンジニアは、私たちのツールを簡単に理解して使用し、機械学習とAIを行うことができます。 データサイエンティスト自身からの関心が高まっていますが、私たちの主な製品は主にそのようなタイプの人々に役立ちます。

VentureBeat:発見のプロセスを自動化していますか?

藤巻: 基本的に、この特徴抽出を自動化していることを示したとき、お客様は非常に驚いています。 これは最も複雑で長い部分です。 通常、これは多くのドメイン知識を必要とするため、自動化することは不可能であると言われています。 しかし、この部分は自動化できます。 データを操作するための機械学習の前に、プロセスを自動化できます。

VentureBeat: つまり、これは最高の機能を見つける段階ではなく、その前に行われる作業です。 機能自体を識別する作業。

藤巻: はい! AIを使用して生成します AI入力。 最終的な機械学習を自動化できるプレーヤーはたくさんいます。 最初に機能を見つける部分を自動化できるため、ほとんどのお客様がdotDataを選択しました。 この部分は私たちの秘密のソースの一種であり、私たちはそれを非常に誇りに思っています。

VentureBeatの

VentureBeatの使命は、技術的な意思決定者が革新的なテクノロジーと取引についての知識を習得するためのデジタルタウンスクエアになることです。 私たちのサイトは、あなたが組織を率いるときにあなたを導くためのデータ技術と戦略に関する重要な情報を提供します。 以下にアクセスして、コミュニティのメンバーになることをお勧めします。

  • あなたが興味を持っている主題に関する最新情報
  • ニュースレター
  • ゲート付きのソートリーダーコンテンツと、次のような貴重なイベントへの割引アクセス 変換2021: もっと詳しく知る
  • ネットワーク機能など

会員になる

コインスマート。 BesteBitcoin-ヨーロッパのBörse
ソース:https://venturebeat.com/2021/06/11/dotdata-extracts-key-data-features-to-make-machine-learning-useful/

スポット画像

最新のインテリジェンス

スポット画像