ゼファーネットのロゴ

CCC、NIH のデータサイエンス戦略計画 2023~2028 について RFI に回答 » CCC ブログ

日付:

本日、CCCは次の質問に対する回答を提出しました。 国立衛生研究所 (NIH) がデータ サイエンスの 2023 ~ 2028 年の戦略計画に関して発表した情報要請。この回答は次のコンピューティング専門家によって書かれました: Tony Capra (カリフォルニア大学サンフランシスコ校)、David Danks (カリフォルニア大学サンディエゴ校、CCC 評議会メンバー)、Haley Griffin (CCC)、Carl Kingsford (カーネギーメロン大学)、Rittika Shamsuddin (オクラホマ州)、Katie A. Siek (インディアナ大学、CCC 評議会メンバー)、Mona Singh (プリンストン大学、CCC 評議会メンバー)、Donna Slonim (タフツ大学)、Tammy Toscos (パークビュー ヘルス、CRA-I 評議会メンバー) 。

著者らは、NIHが戦略計画に掲げた素晴らしい目標リストを称賛したが、計画の実施に必要な訓練、専門知識、データ、追加資金については懸念を表明した。彼らはまた、推奨事項の多くは提案されるよりも要求されるべきであると指摘した。

彼らはまた、戦略計画を改善するために次の勧告を行いました。

実装を有効にするために必要な追加の詳細: 

  • 将来のデータ サイエンス分析で使用できる定性的かつメディアリッチなデータを取得する方法を検討します。
  • 収集されたデータのコンテキストと履歴をキャプチャするメタデータの定義と保守を奨励します。
  • 医療 IT 標準を採用する際には、州および地方の保健部門の IT リーダーを含めてください。
  • 収集されるデータが代表的で、倫理的に調達され、有意義な影響力を持つものであることを保証するために、個人/コミュニティの社会的ニーズに対処するための戦略的方法の設計をサポートします。
  • 透明性が自動的に地域社会の理解につながるわけではないため、研究での健康データの使用に関する一般の人々の間での誤解や認識の欠如に対処するための戦略を定義します。
  • 高等教育機関に対し、学際的な研究をどのように支援しているかを文書化するよう義務付ける。
  • 医療システムに対する現実世界の圧力に対処するために、官民パートナーシップを明確に定義し、支援します。
  • AI/ML システムによって生成された合成データの問題と機会について考えてみましょう。
  • 誤ったデータが統合された場合の計画を含めます。エラーを特定して修正するための AI/ML ツールがサポートされる必要があります。
  • 歴史的に排除されてきたグループの人々に本物の研究経験が提供され、倫理的に扱われることを保証するために、各機関に抑制と均衡を義務付ける。
  • 必要に応じてメカニズム、文書化、報告書を活用して、資金提供を受けた機関が「レジリエンス」について多様なグループに教える必要性を減らすためにどのように取り組んできたかを示してください。
  • 医療システムに定期的にアクセスできない地域のデータのギャップを埋めることを計画の主要な目標またはサブ目標として含めます。
  • すべての医療機関が資金を利用できるようにするために、資金が豊富で確立された機関と、助成金予算にそれほど多くの資金やアクセスがない機関との間のデータアクセスにおける機会ギャップを考慮してください。 

導入をサポートするための追加の資金/リソース:

  • 二重任用職および学際的な職位をサポートすることを目的とした取り組みを強化します。 
  • おそらく、新しいソフトウェア技術の開発に実装科学フレームワークを適応させるよう呼びかける形で、実装科学トレーニングをサポートします。
  • さまざまな機関の新しいハードウェアへの資金提供を通じて GPU などのコンピューティング リソースへのアクセスをサポートし、現在の NIH 補助金予算レベルを考慮すると手頃な料金で共有クラウド リソースへのアクセスを提供します。
  • 応用生物医学研究のみではなく、生物学的データに応用できる純粋な計算研究 (研究セクションおよび審査基準中) をサポートします。
  • データを AI システムに挿入して分析できるように、データ内容に関する要件 (必須フィールド、標準化された用語) を含む標準化されたデータ形式をサポートします。
  • 将来のデータ サイエンス研究者のパイプラインを支援するために、修士課程の学生の夏季研究の機会をサポートします。
  • メンターに資金を提供して、指導するだけでなく、低コストの研究資金提案で研究を継続できるようにします。さらに、歴史的に排除されてきたグループの研究指導が、奉仕、教育、研究における昇進や在職期間においてどのように評価されるかについて、機関に文書を要求すること。
  • 研修生が研修パイプラインに留まるのを支援する資金調達メカニズムを提供します。
  • ユーザーがこれらのリソース (NIH の Web サイトなど) に簡単に貢献し、データにアクセスし、そこから得られる情報を解釈できるようにするツールを開発して、データへのアクセスと活用の容易さを拡大します。  

著者らはまた、NIH が関与できる以下のパートナーシップについても示唆しました。

  • 地元の非営利団体/コミュニティ組織は、NIH が資源の不足しているコミュニティに到達し、最も必要とされている場所に資金を提供し、影響を受ける人々とコミュニケーションをとるのを支援します。 
  • データサイエンスとデータ管理に重点を置く FFRDC を含む、データおよび/またはシステム研究をサポートする連邦機関 (ソフトウェアエンジニアリング協会など)。
  • 公衆衛生の専門家。公衆衛生のネットワークと患者ケアがどのように適合するかを理解することが不可欠であるためです。公衆衛生の専門家は、最新の EHR やコンピューティング テクノロジーとの統合に必要な資金を持っていないことがよくあります。
  • 製薬会社は、データを共有する可能性はほとんどありませんが、多くの公開データを使用し、公衆衛生のニーズに対応しているため、協力することは有益です。
  • NSF (特にスーパーコンピューティング センター)。これには、生物医学的課題 (AI-CARING など) に焦点を当てた NSF AI Institute と、システム、プログラミング言語、計算生物学、およびアルゴリズムに焦点を当てた CISE 理事会内の部門が含まれます。
  • エネルギー省(DOE)
  • 軍事研究システム
  • 退役軍人庁 (VA) – 退役軍人省の病院と関連ケア システムは、一般的な健康問題 (心血管など) と特殊な健康問題 (戦闘関連の PTSD など) の両方を表す大量の患者データを収集します。彼らと提携することで、独自のデータ リソースが提供され、患者と医療提供者のまったく異なる視点が強調される可能性があります。   

著者らは、高いレベルで、生物医学研究の多くの取り組みには、プログラミング言語、アルゴリズム、システムなどの分野を含む基礎的なコンピューターサイエンス研究の進歩が必要であることを強調しました。この計画の目標を達成するには、特にデータの相互運用性、再現可能な分散処理、低遅延のデータ可用性、データの圧縮、検索、ストレージをサポートするために、これらの領域を前例のない規模でサポートする必要があります。

CCC の回答全文を読む こちら.

スポット画像

最新のインテリジェンス

スポット画像