ゼファーネットのロゴ

音声をテキストからテキストへの分析に自動化することにより、定性的研究を変革します

日付:

この投稿は、ZSAssociatesのインテリジェントオートメーションマネージャーであるSatishJha、データサイエンスマネージャーであるMatt Docherty、アソシエイトコンサルタントであるJayesh Muley、およびラピッドプロトタイピングであるTapanVoraによって作成されました。

ZSアソシエイツでは、かなりの量の定性的市場調査を行っています。 この作業には、関連する主題(医療専門家や営業担当者など)へのインタビューと、インタビューデータに関する特注の分析の開発が含まれます。 AI、機械学習(ML)、クラウドコンピューティングの進歩を利用して、定性的な市場調査を再考し、音声からテキストへの変換と自然言語処理(NLP)を実行するためのスケーラブルなソリューションを開発しました。インタビュー対象の音声録音。 このソリューションは、現在の作業方法(手動解釈)よりも優れており、安価で、高速であり、この分野での競争上の優位性をもたらします。

この投稿では、ZSの使用方法について説明します Amazon Transcribe, アマゾンコンプリヘンドメディカル、およびテキストの要約とグラフの視覚化のためのカスタムNLPにより、スケーラブルで自動化されたソリューションを作成し、より速く、より良く、より効率的な方法で洞察を提供できるようにします。

背景評価

定性的市場調査を実施する従来の方法では、人間の介入と解釈が必要であり、これは本質的に非常に主観的です。 高度なAIとMLを使用して、次の機能を備えたプラットフォームを開発しました。

  • 音声からテキストへの変換の実行。 特に高精度で、定性的な市場調査を目的として実施されたインタビューオーディオ録音の変換
  • 最先端のNLPモデルを使用して、変換されたテキストから分析的洞察を引き出す

これを実現するために、最先端のAWS AIサービスとクラウドコンピューティング機能を、適切なNLPとテキスト要約アルゴリズムと組み合わせて、大規模な影響を推進しました。

ソリューションの概要

ソリューションを構築するために、小規模から始めて価値を強調し、迅速にスケーリングする方法を採用しました。 主要なユーザーグループを特定し、音声認識と分析を自動化するソリューションのフェーズXNUMXを定義しました。 主要なユーザーインターフェイスを定義し、ソリューションのテクノロジアーキテクチャを開発しました。 ZSはAWSパートナーであり、エンタープライズ製品とソリューションにすでに複数のAWSクラウドサービスを使用しているため、このプロジェクトではAWSが推奨されました。 音声文字変換とテーマの識別の目的で、AmazonTranscribeとAmazonComprehendMedicalを使用しました。 カスタムNLP分析APIをホストするために、サーバーレスインフラストラクチャを使用しました。 アマゾンAPIゲートウェイ, AWSラムダ, Amazon エラスティック コンテナ サービス (Amazon ECS) AWSファーゲート。 これらのサービスはHIPAAに適格であり、製薬規制要件に準拠しています。

このプロセスには、次の段階が含まれます。

  • AmazonS3へのファイルのアップロード –このプロセスは、ユーザーが音声文字変換用のXNUMXつ以上のオーディオ録音ファイルをツールがホストされているサイトにアップロードしたときに開始されます。 ファイルをにアップロードするには Amazon シンプル ストレージ サービス (Amazon S3)、ユーザーには、AmazonS3アクセスを提供するAPIGatewayを使用して一時的に書き込まれたトークンまたは事前署名されたURLが提供されます。
  • 音声文字変換 –アップロードされたファイルのタイプに応じて、適切なワークフローを開始するためのさまざまなトリガーが用意されています。
    • 辞書ファイルなしでアップロードされたオーディオファイル –ユーザーが辞書ファイルを提供しなかった場合、ツールはAmazonTranscribeを使用してオーディオファイルを処理します。
    • 辞書ファイルでアップロードされたオーディオファイル –ユーザーが辞書ファイルを提供した場合、特定の AWSステップ関数 ステップがトリガーされ、AmazonTranscribeを使用して辞書ファイルが処理されます。 辞書の処理が完了すると、ツールはAmazonTranscribeを使用してオーディオファイルを転記します。
  • トランスクリプトファイルの生成 –上記のXNUMXつのケースのいずれかで、文字起こしが進行中の場合、ツールは Amazon CloudWatchイベント 音声文字変換ステータスを更新します。 Lambda関数は、ツールをトリガーしてRDBMSのステータスを更新し、ソケットを使用してツールのUIを介してユーザーにステータスを伝達します。 音声文字変換が完了すると、最終的な出力ファイルがAmazonS3に保存されます。
  • ファイルタイプ変換 –出力ファイルが生成された後、ツールはトリガーを使用して.docまたは.xlsxファイルを作成し、AmazonS3に再度保存します。
  • 分析的洞察の生成 – Amazon Comprehend Medicalおよび特定のZS社内NLPツールを使用すると、ツールは転記されたデータに基づいて分析を生成し、サイトのダッシュボードを更新してリアルタイムでアクセスします。
  • AmazonTranscribeを使用したオーディオストリーミング - を使用しております アマゾンCloudFrontの オーディオストリーミングは、AmazonTranscribeから生成された最終出力ファイルとペアになっています。 ユーザーは、録音を聞くと同時にトランスクリプトを読むことができます。

次の図は、高レベルのアーキテクチャとワークフローを示しています。

このプラットフォームは、多数のファイルをリアルタイムで処理するように設計されています。 したがって、このソリューションは、プロセスをより効率的にし、まったく新しい次元を与えることで、現在のZS定性的研究チームの作業を大幅に強化します。

全体として、私たちのソリューションには次の機能があります。

  • 単一または複数のオーディオファイルをアップロードする機能
  • カスタム辞書を追加する機能を備えた自動音声からテキストへの変換
  • アップロードされた音声を聞いてテキストを洗練する機能
  • テキストの要約と分析

プロセスマップ

次の図は、開発したソリューションの高レベルの視覚化を次の段階で示しています。

  • 音声をアップロードする –プロセスは、ユーザーがオーディオ録音(辞書ファイルの有無にかかわらず)をツールにアップロードすることから始まります
  • テキストへのスピーチ –これらのアップロードされたオーディオファイルは、音声をテキストに変換することによって転記されます
  • 聞いて洗練する –ユーザーは、録音を聞くと同時にトランスクリプトを読み、必要に応じて変更を加えることができます
  • 音声からテキストへの出力 –統合ファイルには、変換されたトランスクリプトとそれに対応する分析が含まれます

このソリューションをエンドツーエンドで開発するのに約 5 ~ 6 か月かかりました。
Rメンバーチーム。 現在、このツールは 300 人以上が使用しており、このツールは何千時間もの音声を処理してきました。

使用したAWSサービス

このソリューションは、複数のAWサービスを使用します。

  • AWSラムダ & APIゲートウェイ –サーバーレスAPIと関数をホストしました。
    • 複数のAPIゲートウェイを開発して、外部APIとの緩い結合と簡単な統合を保証します。 カスタム認証者は、トークンベースの認証を有効にし、Webコンテンツへの不正アクセスを制限するために実装されました。
    • また、ECSコンテナーでホストされているWebサイトと簡単に対話でき、次のリンクも簡単にできるLambda API(PythonとNodeJSを使用)を構築しました。 PostgreSQL用のAmazonリレーショナルデータベースサービス(Amazon RDS)。 ソリューションでLambda関数を使用すると、クラスターが実行されているときにのみクラスターが実行されるため、クラスターの負荷分散、復元、停止の作業を回避し、全体的なコストを削減できました。 さらに、サーバーレスアーキテクチャにより、ソリューションを簡単に拡張できました。
  • Amazon Transcribe –一度に最大100のオーディオファイルのバッチ処理を簡単に構成し、組み込みのキューイングメカニズムを使用してより大きな負荷をスケーリングするオプションを提供しました。 また、カスタム辞書をロードして、オーディオデータをより正確に転記することもできました。
  • アマゾンコンプリヘンドメディカル –組み込みのNLP機能を使用してテキストデータから分析的洞察を生成し、テキストを並べ替えて貴重な情報を取得します。
  • AWS CloudFormation –使用しました AWS CloudFormation ステージ変数を使用して、環境(さまざまなS3バケットと同じバケット内の複数の環境(本番環境や開発など))にLambda関数とAPIをデプロイします。
  • AWS CodeBuild、AWS CodeDeploy、およびAWS CodePipeline –使用しました AWS コードビルド, AWS コードデプロイ, AWS コードパイプライン フロントエンドと分析バックエンドのECSクラスターへの継続的デプロイを実行します。

次の図は、これらのサービスのアーキテクチャを示しています。

まとめ

AWSサービスを使用して、チームが最先端のAIをプロジェクトに適用するのに役立つプラットフォームを開発しました。 それは私たちのチームが次のことをするのを助けました:

  • 音声からテキストへの変換プロセスを自動化し、精度の低い側面のみに焦点を当てます。
  • NLPアルゴリズムを使用して洞察の自動化を推進します。
  • セルフサービスを推進します。 特定のサーバーを起動する必要がないため、Lambda関数を簡単に作成し、コードをその場で変更し、プラグアンドプレイとして主要なMLサービスを提供できるため、ユーザーはデータサイエンティストである必要がありません。

現在、このソリューションは300人以上が使用しており、数千時間のオーディオを処理してきました。 現在、ソリューションを他のアプリケーションと統合して、音声文字変換用の音声ファイルをアップロードするか、分析的洞察を引き出すために音声文字変換されたファイルを直接アップロードする柔軟性をユーザーに提供しています。

また、AWSを使用してプラットフォームを構築することで複数のメリットが得られました。

  • エンドツーエンドのクラウドベースのアーキテクチャを使用することは、ビジネスアプリケーションの環境を管理するという点で有益であることが証明されました
  • CloudWatch、AWS CloudFormation、CodeBuild、CodeDeploy、CodePipelineなどの管理ツールを使用すると、開発の変更を監視、追跡、デプロイするのが簡単になりました
  • 仮想プライベートクラウドを備えたAWSの組み込みセキュリティと、カスタマイズされたポリシーを備えたID管理を使用しました
  • 迅速なホスティングとデプロイの追加のメリットとともに、貴重なマイクロサービスの負荷を軽減することができました

ZSについて

ZSアソシエイツ イリノイ州エバンストンに本社を置き、製薬、ヘルスケア、テクノロジーのクライアントにサービスを提供する、コンサルティング、ソフトウェア、テクノロジーに焦点を当てたコンサルティングおよび専門サービス会社です。 同社は、北米、南米、ヨーロッパ、およびアジアの10,000のオフィスで30人以上の従業員を雇用しています。 ZSは、最大の製薬会社49社のうち50社および最大の医療機器メーカー17社のうち20社と協力し、消費者向け製品、金融サービス、工業製品、電気通信、運輸、およびロジスティクス業界にサービスを提供しています。

免責事項:AWSは、この投稿の内容または正確性について責任を負いません。 この投稿の内容と意見は、第三者の作者のもののみです。 HIPAAの対象であるかどうか、および対象である場合は、HIPAAとその施行規則に準拠するための最善の方法を決定するのは、各顧客の責任です。 保護されたヘルス情報に関連してAWSを使用する前に、お客様はAWS Business Associate Addendum(BAA)を入力し、その構成要件に従う必要があります。


著者について

サティシュジャ ZSアソシエイツのマネージャーです。 彼は会社のIntelligentAutomationPracticeのリーダーであり、複数の製薬会社のクライアントと協力して業務を変革し、影響力を高めています。

マット・ドチャティ フィラデルフィアオフィスのZSアソシエイツのデータサイエンスマネージャーです。 彼は製薬業界でのデータサイエンスの適用に焦点を当てています。

ジェイシュ・ミューリー ZSアソシエイツのプロセスエクセレンス&トランスフォーメーションのアソシエイトコンサルタントです。 彼は、予測、プロセスの卓越性、およびデジタルトランスフォーメーションの分野で製薬会社のクライアントにアドバイスを提供してきた4年の経験があります。 彼は、ZSの卓越した自動化センターを設立する上で重要な役割を果たしました。 彼は常に新しいテクノロジーの学習に熱心であり、常に彼の役割を進化させています。

タパンヴォラ ZSアソシエイツのラピッドプロトタイピングのマネージャーです。 Tapanは、14年以上の技術およびエンジニアリング管理の経験があります。 彼は、ビジネスアナリスト、ピープルマネージャー、ソリューションデザイナー、データアナリスト、製品リーダーなど、チームで複数の役割を果たしています。

スポット画像

最新のインテリジェンス

スポット画像