제퍼넷 로고

CCC는 2023-2028년 NIH의 데이터 과학 전략 계획에 대한 RFI에 응답합니다. » CCC 블로그

시간

오늘 CCC는 다음과 같은 답변을 제출했습니다. 2023~2028년 데이터 과학 전략 계획에 대해 미국 국립보건원(NIH)에서 발표한 정보 요청. 답변은 다음 컴퓨팅 전문가가 작성했습니다: Tony Capra(캘리포니아 대학교-샌프란시스코), David Danks(캘리포니아 대학교 샌디에이고, CCC 위원회 회원), Haley Griffin(CCC), Carl Kingsford(카네기 멜론 대학교), Rittika Shamsuddin(오클라호마 주), Katie A. Siek(인디애나 대학, CCC 위원회 회원), Mona Singh(프린스턴 대학, CCC 위원회 회원), Donna Slonim(Tufts University) 및 Tammy Toscos(Parkview Health, CRA-I 위원회 회원) .

저자들은 전략 계획의 인상적인 열망 목록에 대해 NIH에 박수를 보냈지만 계획을 구현하는 데 필요한 교육, 전문 지식, 데이터 및 추가 자금에 대한 우려를 제기했습니다. 그들은 또한 제안된 것보다 더 많은 권장 사항이 필요하다고 지적했습니다.

또한 전략 계획 개선을 위해 다음과 같은 권장 사항을 제시했습니다.

구현을 활성화하는 데 필요한 추가 세부 정보: 

  • 향후 데이터 과학 분석에 사용할 수 있는 질적이며 미디어가 풍부한 데이터를 캡처하는 방법을 고려하십시오.
  • 수집된 데이터의 맥락과 기록을 포착하는 메타데이터의 정의와 유지 관리를 장려합니다.
  • 의료 IT 표준을 채택할 때 주 및 지방 보건부의 IT 리더를 포함시키십시오.
  • 수집된 데이터가 대표성 있고 윤리적으로 출처가 있으며 의미 있는 영향을 미칠 수 있도록 개인/커뮤니티의 사회적 요구를 해결하는 전략적 방법 설계를 지원합니다.
  • 투명성이 자동으로 지역사회 이해로 이어지지는 않기 때문에 연구를 위한 건강 데이터 사용에 대한 일반 대중의 잘못된 의사소통과 인식 부족을 해결하기 위한 전략을 정의합니다.
  • 고등 교육 기관이 학제간 연구를 지원하는 방법을 문서화하도록 요구합니다.
  • 의료 시스템에 대한 실제 압력을 설명하기 위해 공공-민간 파트너십을 명확하게 정의하고 지원합니다.
  • AI/ML 시스템에서 생성된 합성 데이터의 문제와 기회를 고려하십시오.
  • 잘못된 데이터가 통합될 경우에 대한 계획을 포함합니다. 오류를 식별하고 수정하기 위한 AI/ML 도구가 지원되어야 합니다.
  • 역사적으로 소외된 집단에 속한 사람들에게 실제 연구 경험을 제공하고 윤리적으로 대우받을 수 있도록 기관에 견제와 균형을 요구합니다.
  • 필요에 따라 메커니즘, 문서 및 보고를 사용하여 자금 지원 기관이 다양한 그룹에게 "복원력"에 대해 가르칠 필요성을 줄이기 위해 어떻게 노력했는지 보여줍니다.
  • 의료 시스템에 정기적으로 접근할 수 없는 지역사회의 데이터 격차를 해소하는 것을 계획의 주요 목표 또는 하위 목표로 포함합니다.
  • 모든 보건 기관이 자금을 이용할 수 있도록 자금이 잘 확보되고 확립된 기관과 보조금 예산에 대한 많은 자금 및 접근이 없는 기관 간의 데이터 접근 기회 격차를 고려하십시오. 

구현을 지원하기 위한 추가 자금/자원:

  • 이중 임명 직책과 학제간 직책을 지원하기 위한 계획을 늘립니다. 
  • 새로운 소프트웨어 기술 개발에 구현 과학 프레임워크를 적용하라는 요청의 형태로 구현 과학 교육을 지원합니다.
  • 다양한 기관의 새로운 하드웨어에 대한 자금 지원을 통해 GPU와 같은 컴퓨팅 리소스에 대한 액세스를 지원하고 현재 NIH 보조금 예산 수준을 고려하여 합리적인 가격으로 공유 클라우드 리소스에 대한 액세스를 제공합니다.
  • 응용 생물의학 연구가 아닌 생물학적 데이터에 적용되는 순수 전산 연구(연구 섹션 및 검토 기준 중)를 지원합니다.
  • 데이터를 AI 시스템에 삽입하고 분석할 수 있도록 데이터 내용(필수 필드, 표준화된 용어)에 대한 요구 사항을 포함하는 표준화된 데이터 형식을 지원합니다.
  • 미래의 데이터 과학 연구원의 파이프라인을 돕기 위해 MS 학생들을 위한 여름 연구 기회를 지원합니다.
  • 멘토에게 자금을 제공하여 멘토링뿐만 아니라 낮은 간접비 연구 자금 지원 제안으로 연구를 계속할 수 있도록 합니다. 또한 역사적으로 배제된 그룹의 연구 멘토링이 서비스, 교육 및 연구 분야의 승진 및 재직에 어떻게 가치가 있는지에 대한 기관의 문서를 요구합니다.
  • 훈련생이 훈련 파이프라인에 머물도록 돕는 자금 조달 메커니즘을 제공합니다.
  • 사용자가 쉽게 기여하고, 내부 데이터에 액세스하고, 이러한 리소스(예: NIH 웹사이트)에서 파생된 정보를 해석하여 데이터 액세스 및 활용 용이성을 확대할 수 있는 도구를 개발합니다.  

저자들은 또한 NIH가 참여할 수 있는 다음과 같은 파트너십을 제안했습니다.

  • NIH가 자원이 부족한 지역사회에 접근하고, 가장 필요한 곳에 자금을 제공하며, 영향을 받는 인구와 소통할 수 있도록 돕는 지역 비영리/지역사회 조직입니다. 
  • 데이터 과학 및 데이터 관리에 중점을 두고 있는 FFRDC를 포함하여 데이터 및/또는 시스템 연구를 지원하는 연방 기관(예: 소프트웨어 엔지니어링 연구소).
  • 공중 보건 전문가. 공중 보건 네트워크와 환자 치료 방식을 이해하는 것이 필수적입니다. 공중 보건 전문가는 종종 최신 EHR을 보유하지도 않고 컴퓨팅 기술과 통합하는 데 필요한 자금도 없습니다.
  • 제약회사는 데이터를 공유할 가능성이 거의 없음에도 불구하고 많은 공공 데이터를 사용하고 공중 보건 요구 사항을 해결하므로 이들과 협력하는 것이 도움이 될 것입니다.
  • NSF(특히 슈퍼컴퓨팅 센터) - 생명의학 과제(예: AI-CARING)에 중점을 둔 NSF AI 연구소와 시스템, 프로그래밍 언어, 컴퓨터 생물학 및 알고리즘에 중점을 두는 CISE 부서 내의 부서를 포함합니다.
  • 에너지 부 (DOE)
  • 군사 연구 시스템
  • 재향군인회(VA) – VA 병원 및 관련 진료 시스템은 일반적인(예: 심혈관) 건강 문제와 고유한(예: 전투 관련 PTSD) 건강 문제를 모두 나타내는 대량의 환자 데이터를 수집합니다. 그들과 협력하면 고유한 데이터 리소스를 제공하고 매우 다른 환자 및 의료 제공자 관점을 강조할 수 있습니다.   

높은 수준에서 저자들은 많은 생물의학 연구 노력에는 프로그래밍 언어, 알고리즘, 시스템과 같은 분야를 포함하여 기본적인 컴퓨터 과학 연구의 발전이 필요하다는 점을 강조했습니다. 또한 이러한 영역은 이 계획의 목표를 달성하기 위해, 특히 데이터 상호 운용성, 재현 가능하고 분산된 처리, 짧은 대기 시간 데이터 가용성, 데이터 압축, 검색 및 저장을 지원하기 위해 전례 없는 규모로 지원되어야 합니다.

CCC의 전체 답변 읽기 여기에서 지금 확인해 보세요..

spot_img

최신 인텔리전스

spot_img