Logo Zéphyrnet

Le CCC répond à la RFI sur le plan stratégique du NIH pour la science des données 2023-2028 » Blog du CCC

Date :

Aujourd'hui, la CCC a soumis une réponse à une Demande d'informations publiée par les National Institutes of Health (NIH) sur leur plan stratégique pour la science des données 2023-2028. La réponse a été rédigée par les experts en informatique suivants : Tony Capra (Université de Californie à San Francisco), David Danks (Université de Californie à San Diego, membre du conseil du CCC), Haley Griffin (CCC), Carl Kingsford (Université Carnegie Mellon), Rittika. Shamsuddin (État de l'Oklahoma), Katie A. Siek (Université d'Indiana, membre du conseil du CCC), Mona Singh (Université de Princeton, membre du conseil du CCC), Donna Slonim (Université Tufts) et Tammy Toscos (Parkview Health, membre du conseil CRA-I) .

Les auteurs ont félicité le NIH pour la liste impressionnante d'aspirations contenues dans le plan stratégique, mais ont exprimé leurs inquiétudes concernant la formation, l'expertise, les données et les fonds supplémentaires nécessaires à la mise en œuvre du plan. Ils ont également noté qu'un plus grand nombre de recommandations devraient être exigées plutôt que suggérées.

Ils ont également formulé les recommandations suivantes pour améliorer le plan stratégique :

Détails supplémentaires nécessaires pour permettre la mise en œuvre : 

  • Réfléchissez à la manière de capturer des données qualitatives et riches en médias qui peuvent être utilisées dans les futures analyses scientifiques des données.
  • Encourager la définition et la maintenance de métadonnées qui capturent le contexte et l’historique des données collectées.
  • Incluez les responsables informatiques des départements de santé de l’État et locaux lors de l’adoption de normes informatiques de santé.
  • Soutenir la conception de moyens stratégiques pour répondre aux besoins sociaux des individus/communautés afin de garantir que les données collectées sont représentatives, d’origine éthique et ont un impact significatif.
  • Définir des stratégies pour remédier aux problèmes de communication et au manque de sensibilisation du grand public à l'utilisation des données de santé à des fins de recherche, car la transparence ne conduit pas automatiquement à la compréhension de la communauté.
  • Exiger des établissements d’enseignement supérieur qu’ils documentent la manière dont ils soutiennent la recherche interdisciplinaire.
  • Définir et soutenir clairement les partenariats public-privé pour tenir compte de la pression réelle exercée sur les systèmes de santé.
  • Considérez les enjeux et les opportunités des données synthétiques générées par les systèmes AI/ML.
  • Incluez un plan lorsque des données incorrectes sont intégrées. Les outils d’IA/ML pour identifier et corriger les erreurs doivent être pris en charge.
  • Exiger que les institutions disposent de freins et contrepoids pour garantir que les personnes issues de groupes historiquement exclus bénéficient de véritables expériences de recherche et sont traitées de manière éthique.
  • Utiliser des mécanismes, de la documentation et des rapports si nécessaire pour montrer comment les institutions financées ont travaillé pour réduire le besoin d'enseigner à divers groupes la « résilience ».
  • Inclure la réduction des lacunes dans les données des communautés qui n'ont pas un accès régulier aux systèmes de soins de santé comme objectif majeur ou sous-objectif du plan.
  • Tenir compte des lacunes en matière d'opportunités en matière d'accès aux données entre les institutions bien financées et établies et celles qui ne disposent pas d'autant de financement et d'accès aux budgets de subventions afin de rendre le financement accessible à toutes les organisations de santé. 

Fonds/ressources supplémentaires pour soutenir la mise en œuvre :

  • Augmenter les initiatives visant à soutenir les postes à double nomination et les postes interdisciplinaires. 
  • Soutenir la formation en science de la mise en œuvre, peut-être sous la forme d’un appel à adapter les cadres scientifiques de la mise en œuvre dans le développement de nouvelles technologies logicielles.
  • Prend en charge l'accès aux ressources de calcul telles que les GPU via le financement de nouveaux matériels dans diverses institutions et fournit un accès aux ressources cloud partagées à des tarifs abordables compte tenu des niveaux budgétaires actuels des subventions des NIH.
  • Soutenir la recherche informatique pure (au cours des sections d’étude et des critères d’examen) qui s’applique aux données biologiques plutôt qu’à la seule recherche biomédicale appliquée.
  • Prend en charge des formats de données standardisés qui incluent des exigences sur le contenu des données (champs obligatoires, terminologie standardisée) afin que les données soient prêtes à être insérées dans les systèmes d'IA et analysées.
  • Soutenir les opportunités de recherche d’été pour les étudiants en MS afin de contribuer au recrutement de futurs chercheurs en science des données.
  • Fournir un financement aux mentors non seulement pour encadrer, mais également pour poursuivre leurs recherches grâce à des propositions de financement de recherche à faibles frais généraux. De plus, exiger des institutions qu’elles fournissent des documents sur la manière dont le mentorat de recherche de groupes historiquement exclus est valorisé dans leur promotion et leur mandat dans le service, l’enseignement et la recherche.
  • Fournir des mécanismes de financement qui aident les stagiaires à rester dans le pipeline de formation.
  • Développer des outils pour aider les utilisateurs à contribuer facilement, à accéder aux données et à interpréter les informations dérivées de ces ressources (comme le site Web du NIH) afin d'élargir l'accès et de faciliter l'exploitation des données.  

Les auteurs ont également suggéré les partenariats suivants dans lesquels les NIH pourraient s'engager :

  • Organisations communautaires/à but non lucratif locales pour aider les NIH à atteindre les communautés défavorisées, à fournir des financements là où ils sont le plus nécessaires et à communiquer avec les populations touchées. 
  • Institutions fédérales qui soutiennent la recherche sur les données et/ou les systèmes, y compris les FFRDC qui mettent l'accent sur la science des données et la gestion des données (par exemple, le Software Engineering Institute).
  • Experts en santé publique, car il est essentiel de comprendre le réseau de santé publique et la façon dont les soins aux patients s'y intègrent. Souvent, les professionnels de la santé publique ne disposent pas du DSE le plus récent, ni du financement nécessaire pour s'intégrer aux technologies informatiques.
  • Les sociétés pharmaceutiques, même si elles sont très peu susceptibles de partager des données, utilisent beaucoup de données publiques et répondent aux besoins de santé publique. Il serait donc bénéfique de travailler avec elles.
  • NSF (en particulier les centres de calcul intensif), y compris les instituts d'IA de la NSF axés sur les défis biomédicaux (par exemple, AI-CARING) ainsi que les divisions au sein de la direction du CISE qui se concentrent sur les systèmes, les langages de programmation, la biologie computationnelle et les algorithmes.
  • Département de l'énergie (DOE)
  • Systèmes de recherche militaire
  • Veteran Affairs (VA) – Les hôpitaux VA et les systèmes de soins associés collectent de grandes quantités de données sur les patients représentant à la fois des problèmes de santé courants (par exemple cardiovasculaires) et uniques (par exemple le SSPT lié au combat). Un partenariat avec eux pourrait fournir des ressources de données uniques et mettre en évidence des perspectives très différentes des patients et des prestataires.   

À un niveau élevé, les auteurs ont souligné que de nombreux efforts de recherche biomédicale nécessitent des progrès dans la recherche fondamentale en informatique, notamment dans des domaines tels que les langages de programmation, les algorithmes et les systèmes. Ces domaines doivent également être pris en charge à une échelle sans précédent afin d'atteindre les objectifs de ce plan, notamment pour prendre en charge l'interopérabilité des données, le traitement reproductible et distribué, la disponibilité des données à faible latence, la compression, la recherche et le stockage des données.

Lire la réponse complète de CCC ici.

spot_img

Dernières informations

spot_img