Zephyrnet-logotyp

CCC svarar på RFI på NIH:s strategiska plan för datavetenskap 2023-2028 » CCC-blogg

Datum:

Idag lämnade CCC in ett svar på en Begäran om information släppt av National Institutes of Health (NIH) om deras strategiska plan för datavetenskap 2023-2028. Svaret skrevs av följande dataexperter: Tony Capra (University of California-San Francisco), David Danks (University of California San Diego, CCC Council Member), Haley Griffin (CCC), Carl Kingsford (Carnegie Mellon University), Rittika Shamsuddin (Oklahoma State), Katie A. Siek (Indiana University, CCC Council Member), Mona Singh (Princeton University, CCC Council Member), Donna Slonim (Tufts University) och Tammy Toscos (Parkview Health, CRA-I Council Member) .

Författarna applåderade NIH för en imponerande lista över ambitioner i den strategiska planen, men väckte oro över utbildning, expertis, data och ytterligare medel som behövs för att genomföra planen. De noterade också att fler av rekommendationerna borde krävas snarare än föreslås.

De gav också följande rekommendationer för att förbättra den strategiska planen:

Ytterligare information som behövs för att möjliggöra implementering: 

  • Fundera på hur du kan fånga kvalitativ och mediarik data som kan användas i framtida datavetenskaplig analys.
  • Uppmuntra definition och underhåll av metadata som fångar sammanhanget och historien för insamlad data.
  • Inkludera IT-ledare från statliga och lokala hälsodepartement när de antar IT-standarder för hälsa.
  • Stöd utformningen av strategiska sätt att tillgodose de sociala behoven hos individer/samhällen för att säkerställa att data som samlas in är representativa, etiskt hämtade och meningsfulla.
  • Definiera strategier för att ta itu med missförstånd och bristande medvetenhet bland allmänheten om hälsodataanvändning för forskning, eftersom transparens inte automatiskt leder till samhällsförståelse.
  • Kräv att lärosätena dokumenterar hur de stödjer tvärvetenskaplig forskning.
  • Definiera tydligt och stödja offentlig-privata partnerskap för att ta hänsyn till det verkliga trycket på hälsosystemen.
  • Tänk på problem och möjligheter med syntetisk data som genereras av AI/ML-system.
  • Inkludera en plan för när felaktig data integreras. AI/ML-verktyg för att identifiera och korrigera fel bör stödjas.
  • Kräv att institutioner har kontroller och balanser för att säkerställa att människor från historiskt utestängda grupper förses med verkliga forskningserfarenheter och behandlas etiskt.
  • Använd mekanismer, dokumentation och rapportering vid behov för att visa hur finansierade institutioner har arbetat för att minska behovet av att lära olika grupper om "resiliens".
  • Inkludera stängning av luckor i data från samhällen som inte har regelbunden tillgång till hälso- och sjukvårdssystem som ett huvudmål eller delmål i planen.
  • Överväg luckor i datatillgång mellan välfinansierade, etablerade institutioner och institutioner utan lika mycket finansiering och tillgång i anslagsbudgetar för att göra finansiering tillgänglig för alla hälsoorganisationer. 

Ytterligare medel/resurser för att stödja implementering:

  • Öka insatser som syftar till att stödja dubbla tillsättningsbefattningar och tvärvetenskapliga befattningar. 
  • Stödja implementeringsvetenskaplig utbildning, kanske i form av en uppmaning att anpassa implementeringsvetenskapliga ramar i utvecklingen av ny mjukvaruteknik.
  • Stöd åtkomst till datorresurser som GPU:er via både finansiering av ny hårdvara vid olika institutioner och ge tillgång till delade molnresurser till priser som är överkomliga med tanke på nuvarande NIH-bidragsbudgetnivåer.
  • Stöd ren beräkningsforskning (under studieavsnitt och granskningskriterier) som har tillämpning på biologiska data snarare än endast tillämpad biomedicinsk forskning.
  • Stöd för standardiserade dataformat som inkluderar krav på datainnehåll (obligatoriska fält, standardiserad terminologi) så att data är redo att infogas i AI-system och analyseras.
  • Stöd sommarforskningsmöjligheter för MS-studenter för att hjälpa framtida forskare inom datavetenskap.
  • Ge finansiering till mentorer för att inte bara mentor, utan även för att hålla igång sin forskning med låga forskningsfinansieringsförslag. Kräv dessutom dokumentation från institutioner om hur forskningsmentorskap för historiskt uteslutna grupper värderas i deras befordran och tjänstgöring i tjänst, undervisning och forskning.
  • Tillhandahåll finansieringsmekanismer som hjälper praktikanter att hålla sig i utbildningspipen.
  • Utveckla verktyg för att hjälpa användare att enkelt bidra till, komma åt data inom och tolka information som härrör från dessa resurser (som NIH:s webbplats) för att utöka åtkomsten och enklare att utnyttja data.  

Författarna föreslog också följande partnerskap som NIH kunde engagera sig i:

  • Lokala ideella organisationer/gemenskapsorganisationer för att hjälpa NIH att nå samhällen med bristande resurser, tillhandahålla finansiering där det behövs som mest och kommunicera med drabbade befolkningar. 
  • Federala institutioner som stödjer data- och/eller systemforskning, inklusive FFRDC som har stor tonvikt på datavetenskap och datahantering (t.ex. Software Engineering Institute).
  • Folkhälsoexperter, eftersom det är viktigt att förstå folkhälsonätverket och hur patientvården passar in. Folkhälsopersonal har ofta inte den senaste EPJ eller finansieringen som krävs för att integrera med datorteknik.
  • Läkemedelsföretag, som även om det är mycket osannolikt att de delar data, använder de mycket offentlig data och tar upp folkhälsobehov, så att arbeta med dem skulle vara fördelaktigt.
  • NSF (särskilt superdatorcenter), inklusive NSF AI-institut med fokus på biomedicinska utmaningar (t.ex. AI-CARING) samt avdelningar inom CISE-direktoratet som fokuserar på system, programmeringsspråk, beräkningsbiologi och algoritmer.
  • Institutionen för energi (DOE)
  • Militära forskningssystem
  • Veteran Affairs (VA) – VA-sjukhusen och tillhörande vårdsystem samlar in stora mängder patientdata som representerar både vanliga (t.ex. kardiovaskulära) och unika (t.ex. stridsrelaterade PTSD) hälsoutmaningar. Att samarbeta med dem kan ge unika dataresurser och lyfta fram mycket olika patient- och leverantörsperspektiv.   

På hög nivå betonade författarna att många biomedicinska forskningsinsatser kräver framsteg inom grundläggande datavetenskaplig forskning, inklusive inom områden som programmeringsspråk, algoritmer och system. Dessa områden behöver också stödjas i en aldrig tidigare skådad skala för att uppfylla målen i denna plan, särskilt för att stödja datakompatibilitet, reproducerbar och distribuerad bearbetning, låg latensdatatillgänglighet, komprimering, sökning och lagring av data.

Läs hela CCC:s svar här..

plats_img

Senaste intelligens

plats_img