Logotipo de Zephyrnet

La CCC responde a la RFI sobre el plan estratégico de los NIH para la ciencia de datos 2023-2028 » Blog de la CCC

Fecha:

Hoy, CCC presentó una respuesta a una Solicitud de información publicada por los Institutos Nacionales de Salud (NIH) sobre su Plan Estratégico de Ciencia de Datos 2023-2028. La respuesta fue escrita por los siguientes expertos en informática: Tony Capra (Universidad de California-San Francisco), David Danks (Universidad de California San Diego, miembro del Consejo de la CCC), Haley Griffin (CCC), Carl Kingsford (Universidad Carnegie Mellon), Rittika Shamsuddin (Estado de Oklahoma), Katie A. Siek (Universidad de Indiana, miembro del Consejo de la CCC), Mona Singh (Universidad de Princeton, miembro del Consejo de la CCC), Donna Slonim (Universidad de Tufts) y Tammy Toscos (Parkview Health, miembro del Consejo de CRA-I) .

Los autores aplaudieron a los NIH por una impresionante lista de aspiraciones en el Plan Estratégico, pero expresaron preocupaciones sobre la capacitación, la experiencia, los datos y los fondos adicionales necesarios para implementar el plan. También señalaron que deberían exigirse más recomendaciones que sugerirse.

También hicieron las siguientes recomendaciones para mejorar el Plan Estratégico:

Detalles adicionales necesarios para permitir la implementación: 

  • Considere cómo capturar datos cualitativos y ricos en medios que puedan usarse en futuros análisis de ciencia de datos.
  • Fomentar la definición y el mantenimiento de metadatos que capturen el contexto y el historial de los datos recopilados.
  • Incluir a líderes de TI de los departamentos de salud estatales y locales al adoptar estándares de TI para la salud.
  • Apoyar el diseño de formas estratégicas de abordar las necesidades sociales de individuos/comunidades para garantizar que los datos que se recopilen sean representativos, de origen ético y de impacto significativo.
  • Definir estrategias para abordar la falta de comunicación y la falta de conciencia entre el público en general sobre el uso de datos de salud para la investigación, ya que la transparencia no conduce automáticamente a la comprensión de la comunidad.
  • Exigir a las instituciones de educación superior que documenten cómo apoyan la investigación interdisciplinaria.
  • Definir y apoyar claramente las asociaciones público-privadas para dar cuenta de la presión del mundo real sobre los sistemas de salud.
  • Considere los problemas y oportunidades de los datos sintéticos generados por los sistemas AI/ML.
  • Incluya un plan para cuando se integren datos incorrectos. Se deben admitir herramientas de IA/ML para identificar y corregir errores.
  • Exigir que las instituciones tengan controles y contrapesos para garantizar que las personas de grupos históricamente excluidos reciban experiencias de investigación reales y sean tratadas éticamente.
  • Utilice mecanismos, documentación e informes según sea necesario para mostrar cómo las instituciones financiadas han trabajado para disminuir la necesidad de enseñar a grupos diversos sobre la “resiliencia”.
  • Incluir el cierre de brechas en los datos de las comunidades que no tienen acceso regular a los sistemas de atención médica como una meta o submeta principal del plan.
  • Considere las brechas de oportunidades en el acceso a los datos entre instituciones establecidas y bien financiadas e instituciones sin tanta financiación y acceso en los presupuestos de subvenciones para que la financiación sea accesible a todas las organizaciones de salud. 

Fondos/recursos adicionales para apoyar la implementación:

  • Incrementar las iniciativas destinadas a apoyar puestos de doble nombramiento y puestos interdisciplinarios. 
  • Apoyar la capacitación en ciencias de la implementación, tal vez en forma de un llamado a adaptar los marcos de las ciencias de la implementación en el desarrollo de nuevas tecnologías de software.
  • Apoyar el acceso a recursos informáticos como GPU a través de financiación para nuevo hardware en diversas instituciones y proporcionar acceso a recursos compartidos en la nube a precios asequibles dados los niveles actuales del presupuesto de subvenciones de los NIH.
  • Apoyar la investigación computacional pura (durante las secciones de estudio y los criterios de revisión) que tenga aplicación a datos biológicos en lugar de solo investigación biomédica aplicada.
  • Admitir formatos de datos estandarizados que incluyan requisitos sobre el contenido de los datos (campos obligatorios, terminología estandarizada) para que los datos estén listos para insertarse en sistemas de IA y analizarse.
  • Apoyar las oportunidades de investigación de verano para estudiantes de maestría con el fin de ayudar en el proceso de futuros investigadores de ciencia de datos.
  • Proporcionar financiación a los mentores no sólo para que sean mentores, sino también para que mantengan su investigación con propuestas de financiación de investigación de bajos gastos generales. Además, exigir documentación de las instituciones sobre cómo se valora la tutoría en investigación de grupos históricamente excluidos en su promoción y permanencia en el servicio, la docencia y la investigación.
  • Proporcionar mecanismos de financiación que ayuden a los alumnos a permanecer en el proceso de formación.
  • Desarrollar herramientas para ayudar a los usuarios a contribuir, acceder a datos e interpretar la información derivada de estos recursos (como el sitio web de los NIH) fácilmente para ampliar el acceso y la facilidad de aprovechar los datos.  

Los autores también sugirieron las siguientes asociaciones en las que los NIH podrían participar:

  • Organizaciones comunitarias/sin fines de lucro locales para ayudar a los NIH a llegar a comunidades de escasos recursos, proporcionar financiación donde más se necesita y comunicarse con las poblaciones afectadas. 
  • Instituciones federales que apoyan la investigación de datos y/o sistemas, incluidos los FFRDC que tienen un énfasis importante en la ciencia y la gestión de datos (por ejemplo, el Instituto de Ingeniería de Software).
  • Expertos en salud pública, ya que es esencial comprender la red de salud pública y la forma en que encaja la atención al paciente. Los profesionales de la salud pública a menudo no tienen los últimos EHR ni la financiación necesaria para integrarse con las tecnologías informáticas.
  • Las empresas farmacéuticas, aunque es muy poco probable que compartan datos, utilizan muchos datos públicos y abordan necesidades de salud pública, por lo que trabajar con ellas sería beneficioso.
  • NSF (especialmente centros de supercomputación), incluidos los Institutos de IA de NSF centrados en desafíos biomédicos (por ejemplo, AI-CARING), así como divisiones dentro de la dirección del CISE que se centran en sistemas, lenguajes de programación, biología computacional y algoritmos.
  • Departamento de Energía (DOE)
  • Sistemas de investigación militar
  • Asuntos de Veteranos (VA): los hospitales de VA y los sistemas de atención asociados recopilan grandes cantidades de datos de pacientes que representan desafíos de salud tanto comunes (por ejemplo, cardiovasculares) como únicos (por ejemplo, trastorno de estrés postraumático relacionado con el combate). Asociarse con ellos podría proporcionar recursos de datos únicos y resaltar perspectivas muy diferentes de pacientes y proveedores.   

A alto nivel, los autores enfatizaron que muchos esfuerzos de investigación biomédica requieren avances en la investigación fundamental en ciencias de la computación, incluso en áreas como lenguajes de programación, algoritmos y sistemas. Estas áreas también necesitan apoyo a una escala sin precedentes para cumplir los objetivos de este plan, especialmente para respaldar la interoperabilidad de datos, el procesamiento reproducible y distribuido, la disponibilidad de datos de baja latencia, la compresión, la búsqueda y el almacenamiento de datos.

Lea la respuesta completa de CCC esta página.

punto_img

Información más reciente

punto_img