Zephyrnet-logo

CCC reageert op RFI over het Strategisch Plan voor Data Science 2023-2028 van NIH »CCC Blog

Datum:

Vandaag heeft CCC een reactie ingediend op een Verzoek om informatie vrijgegeven door de National Institutes of Health (NIH) over hun Strategisch Plan voor Data Science 2023-2028. Het antwoord is geschreven door de volgende computerexperts: Tony Capra (University of California-San Francisco), David Danks (University of California San Diego, lid van de CCC-raad), Haley Griffin (CCC), Carl Kingsford (Carnegie Mellon University), Rittika Shamsuddin (Oklahoma State), Katie A. Siek (Indiana University, CCC-raadslid), Mona Singh (Princeton University, CCC-raadslid), Donna Slonim (Tufts University) en Tammy Toscos (Parkview Health, CRA-I-raadslid) .

De auteurs prezen NIH voor een indrukwekkende lijst van ambities in het Strategisch Plan, maar uitten hun bezorgdheid over de training, expertise, gegevens en aanvullende fondsen die nodig waren om het plan uit te voeren. Ze merkten ook op dat er meer aanbevelingen nodig zouden moeten zijn in plaats van voorgesteld.

Zij deden ook de volgende aanbevelingen ter verbetering van het Strategisch Plan:

Aanvullende details die nodig zijn om implementatie mogelijk te maken: 

  • Overweeg hoe u kwalitatieve en mediarijke gegevens kunt vastleggen die kunnen worden gebruikt in toekomstige datawetenschapsanalyses.
  • Stimuleer de definitie en het onderhoud van metadata die de context en geschiedenis van de verzamelde gegevens vastleggen.
  • Betrek IT-leiders van staats- en lokale gezondheidsdepartementen bij het adopteren van IT-standaarden voor de gezondheidszorg.
  • Ondersteun het ontwerp van strategische manieren om tegemoet te komen aan de sociale behoeften van individuen/gemeenschappen om ervoor te zorgen dat de verzamelde gegevens representatief, ethisch verantwoord en zinvol impactvol zijn.
  • Strategieën definiëren om miscommunicatie en gebrek aan bewustzijn bij het grote publiek over het gebruik van gezondheidsgegevens voor onderzoek aan te pakken, aangezien transparantie niet automatisch leidt tot begrip binnen de gemeenschap.
  • Vereisen dat instellingen voor hoger onderwijs documenteren hoe zij interdisciplinair onderzoek ondersteunen.
  • Definieer en ondersteun publiek-private partnerschappen duidelijk om rekening te houden met de reële druk op de gezondheidszorgsystemen.
  • Denk na over de problemen en kansen van synthetische gegevens die worden gegenereerd door AI/ML-systemen.
  • Voeg een plan toe voor het geval er onjuiste gegevens worden geïntegreerd. AI/ML-instrumenten voor het identificeren en corrigeren van fouten moeten worden ondersteund.
  • Vereisen dat instellingen over checks and balances beschikken om ervoor te zorgen dat mensen uit historisch uitgesloten groepen echte onderzoekservaringen krijgen en ethisch worden behandeld.
  • Gebruik indien nodig mechanismen, documentatie en rapportage om te laten zien hoe gefinancierde instellingen hebben gewerkt aan het verminderen van de noodzaak om diverse groepen over ‘veerkracht’ te onderwijzen.
  • Neem het dichten van lacunes in de gegevens van gemeenschappen die geen reguliere toegang hebben tot gezondheidszorgsystemen op als een belangrijk doel of subdoel in het plan.
  • Houd rekening met de kansenkloven in de toegang tot gegevens tussen goed gefinancierde, gevestigde instellingen en instellingen zonder zoveel financiering en toegang tot subsidiebudgetten om financiering toegankelijk te maken voor alle gezondheidsorganisaties. 

Aanvullende fondsen/middelen ter ondersteuning van de implementatie:

  • Initiatieven ter ondersteuning van dubbele benoemingsfuncties en interdisciplinaire functies vergroten. 
  • Ondersteun implementatiewetenschappelijke training, misschien in de vorm van een oproep om implementatiewetenschappelijke kaders aan te passen bij de ontwikkeling van nieuwe softwaretechnologieën.
  • Ondersteun de toegang tot computerbronnen zoals GPU's via financiering voor nieuwe hardware bij diverse instellingen, en bied toegang tot gedeelde cloudbronnen tegen tarieven die betaalbaar zijn gezien de huidige NIH-subsidiebudgetniveaus.
  • Ondersteun puur computationeel onderzoek (tijdens studiesecties en beoordelingscriteria) dat van toepassing is op biologische gegevens in plaats van alleen toegepast biomedisch onderzoek.
  • Ondersteun gestandaardiseerde dataformaten met eisen aan de data-inhoud (vereiste velden, gestandaardiseerde terminologie), zodat de data klaar zijn om in AI-systemen te worden ingevoegd en geanalyseerd.
  • Ondersteun zomeronderzoeksmogelijkheden voor MS-studenten om de pijplijn van toekomstige datawetenschappers te helpen.
  • Bied financiering aan mentoren om niet alleen hun onderzoek te begeleiden, maar ook om hun onderzoek gaande te houden met onderzoeksfinancieringsvoorstellen met lage overheadkosten. Daarnaast is er documentatie nodig van instellingen over hoe onderzoeksbegeleiding van historisch uitgesloten groepen wordt gewaardeerd bij hun promotie en ambtstermijn in dienstverlening, onderwijs en onderzoek.
  • Zorg voor financieringsmechanismen die stagiairs helpen in de opleidingspijplijn te blijven.
  • Ontwikkel tools om gebruikers te helpen gemakkelijk bij te dragen aan, toegang te krijgen tot gegevens binnen, en informatie afgeleid van deze bronnen (zoals de website van de NIH) te interpreteren om de toegang en het gemak van het benutten van gegevens uit te breiden.  

De auteurs stelden ook de volgende partnerschappen voor die NIH zou kunnen aangaan:

  • Lokale non-profitorganisaties/gemeenschapsorganisaties helpen NIH gemeenschappen met onvoldoende middelen te bereiken, financiering te verstrekken waar dit het meest nodig is, en te communiceren met getroffen bevolkingsgroepen. 
  • Federale instellingen die data- en/of systeemonderzoek ondersteunen, waaronder FFRDC's die een grote nadruk leggen op datawetenschap en databeheer (bijvoorbeeld het Software Engineering Institute).
  • Deskundigen op het gebied van de volksgezondheid, omdat het van essentieel belang is om het volksgezondheidsnetwerk te begrijpen en te begrijpen hoe de patiëntenzorg daarin past. Beroepsbeoefenaren in de volksgezondheid beschikken vaak niet over het nieuwste EPD, noch over de financiering die nodig is om te integreren met computertechnologieën.
  • Hoewel het zeer onwaarschijnlijk is dat farmaceutische bedrijven gegevens delen, gebruiken ze veel openbare gegevens en voorzien ze in de behoeften van de volksgezondheid, dus het zou nuttig zijn om met hen samen te werken.
  • NSF (vooral supercomputercentra), waaronder NSF AI-instituten met een focus op biomedische uitdagingen (bijv. AI-CARING), evenals afdelingen binnen het CISE-directoraat die zich richten op systemen, programmeertalen, computationele biologie en algoritmen.
  • Afdeling Energie (DOE)
  • Militaire onderzoekssystemen
  • Veteran Affairs (VA) – De VA-ziekenhuizen en bijbehorende zorgsystemen verzamelen grote hoeveelheden patiëntgegevens die zowel algemene (bijvoorbeeld cardiovasculaire) als unieke (bijvoorbeeld gevechtsgerelateerde PTSD) gezondheidsuitdagingen vertegenwoordigen. Een samenwerking met hen kan unieke databronnen opleveren en heel verschillende perspectieven van patiënten en zorgverleners benadrukken.   

Op een hoog niveau benadrukten de auteurs dat veel biomedische onderzoeksinspanningen vooruitgang vereisen in fundamenteel computerwetenschappelijk onderzoek, ook op gebieden als programmeertalen, algoritmen en systemen. Deze gebieden moeten ook op een ongekende schaal worden ondersteund om de doelstellingen van dit plan te bereiken, vooral ter ondersteuning van de data-interoperabiliteit, reproduceerbare en gedistribueerde verwerking, beschikbaarheid van data met lage latentie, compressie, zoeken en opslag van data.

Lees het volledige antwoord van CCC hier.

spot_img

Laatste intelligentie

spot_img