Logo Zephyrnet

CCC phản hồi RFI về Kế hoạch chiến lược khoa học dữ liệu của NIH 2023-2028 » Blog CCC

Ngày:

Hôm nay, CCC đã gửi phản hồi cho một Yêu cầu Thông tin do Viện Y tế Quốc gia (NIH) đưa ra về Kế hoạch Chiến lược Khoa học Dữ liệu 2023-2028 của họ. Câu trả lời được viết bởi các chuyên gia điện toán sau: Tony Capra (Đại học California-San Francisco), David Danks (Đại học California San Diego, Thành viên Hội đồng CCC), Haley Griffin (CCC), Carl Kingsford (Đại học Carnegie Mellon), Rittika Shamsuddin (Bang Oklahoma), Katie A. Siek (Đại học Indiana, Thành viên Hội đồng CCC), Mona Singh (Đại học Princeton, Thành viên Hội đồng CCC), Donna Slonim (Đại học Tufts) và Tammy Toscos (Parkview Health, Thành viên Hội đồng CRA-I) .

Các tác giả hoan nghênh NIH về danh sách nguyện vọng ấn tượng trong Kế hoạch chiến lược, nhưng nêu lên lo ngại về đào tạo, chuyên môn, dữ liệu và kinh phí bổ sung cần thiết để thực hiện kế hoạch. Họ cũng lưu ý rằng nên đưa ra nhiều khuyến nghị hơn là đề xuất.

Họ cũng đưa ra những khuyến nghị sau để cải thiện Kế hoạch chiến lược:

Các chi tiết bổ sung cần thiết để cho phép triển khai: 

  • Xem xét cách thu thập dữ liệu định tính và đa phương tiện có thể được sử dụng trong phân tích khoa học dữ liệu trong tương lai.
  • Khuyến khích định nghĩa và duy trì siêu dữ liệu nắm bắt được bối cảnh và lịch sử của dữ liệu được thu thập.
  • Bao gồm các nhà lãnh đạo CNTT từ các sở y tế tiểu bang và địa phương khi áp dụng các tiêu chuẩn CNTT y tế.
  • Hỗ trợ thiết kế các cách thức chiến lược để giải quyết nhu cầu xã hội của cá nhân/cộng đồng nhằm đảm bảo rằng dữ liệu được thu thập là mang tính đại diện, có nguồn gốc hợp đạo đức và có tác động có ý nghĩa.
  • Xác định các chiến lược để giải quyết thông tin sai lệch và sự thiếu nhận thức của công chúng về việc sử dụng dữ liệu y tế cho nghiên cứu, vì tính minh bạch không tự động dẫn đến sự hiểu biết của cộng đồng.
  • Yêu cầu các tổ chức giáo dục đại học ghi lại cách họ hỗ trợ nghiên cứu liên ngành.
  • Xác định rõ ràng và hỗ trợ quan hệ đối tác công-tư để giải quyết áp lực thực tế đối với các hệ thống y tế.
  • Xem xét các vấn đề và cơ hội của dữ liệu tổng hợp do hệ thống AI/ML tạo ra.
  • Bao gồm kế hoạch khi dữ liệu không chính xác được tích hợp. Cần hỗ trợ các công cụ AI/ML để xác định và sửa lỗi.
  • Yêu cầu các tổ chức phải kiểm tra và cân bằng để đảm bảo những người thuộc các nhóm bị loại trừ trong lịch sử được cung cấp kinh nghiệm nghiên cứu thực tế và được đối xử có đạo đức.
  • Sử dụng các cơ chế, tài liệu và báo cáo khi cần thiết để cho thấy các tổ chức được tài trợ đã hoạt động như thế nào nhằm giảm nhu cầu dạy các nhóm khác nhau về “khả năng phục hồi”.
  • Bao gồm việc thu hẹp các lỗ hổng trong dữ liệu của các cộng đồng không được tiếp cận thường xuyên với hệ thống chăm sóc sức khỏe như một mục tiêu chính hoặc mục tiêu phụ trong kế hoạch.
  • Xem xét các khoảng cách cơ hội trong việc truy cập dữ liệu giữa các tổ chức được tài trợ tốt, có uy tín và các tổ chức không có nhiều kinh phí và khả năng tiếp cận ngân sách tài trợ để giúp tất cả các tổ chức y tế có thể tiếp cận được nguồn tài trợ. 

Kinh phí/nguồn lực bổ sung để hỗ trợ thực hiện:

  • Tăng cường các sáng kiến ​​nhằm hỗ trợ các vị trí bổ nhiệm kép và các vị trí liên ngành. 
  • Hỗ trợ đào tạo khoa học triển khai, có thể dưới hình thức kêu gọi điều chỉnh các khuôn khổ khoa học triển khai trong quá trình phát triển các công nghệ phần mềm mới.
  • Hỗ trợ quyền truy cập vào các tài nguyên điện toán như GPU thông qua cả việc tài trợ cho phần cứng mới tại các tổ chức khác nhau và cung cấp quyền truy cập vào tài nguyên đám mây được chia sẻ ở mức giá phải chăng dựa trên mức ngân sách tài trợ hiện tại của NIH.
  • Hỗ trợ nghiên cứu tính toán thuần túy (trong các phần nghiên cứu và tiêu chí đánh giá) có ứng dụng vào dữ liệu sinh học thay vì chỉ nghiên cứu y sinh ứng dụng.
  • Hỗ trợ các định dạng dữ liệu được tiêu chuẩn hóa bao gồm các yêu cầu về nội dung dữ liệu (các trường bắt buộc, thuật ngữ được tiêu chuẩn hóa) để dữ liệu sẵn sàng được đưa vào hệ thống AI và phân tích.
  • Hỗ trợ các cơ hội nghiên cứu mùa hè cho sinh viên MS để hỗ trợ đội ngũ các nhà nghiên cứu khoa học dữ liệu trong tương lai.
  • Cung cấp kinh phí cho những người cố vấn không chỉ để cố vấn mà còn để duy trì hoạt động nghiên cứu của họ với các đề xuất tài trợ nghiên cứu có chi phí thấp. Ngoài ra, yêu cầu tài liệu từ các tổ chức về cách đánh giá việc cố vấn nghiên cứu cho các nhóm bị loại trừ trong lịch sử trong việc thăng tiến và nắm giữ chức vụ, giảng dạy và nghiên cứu của họ.
  • Cung cấp cơ chế tài trợ để giúp học viên tiếp tục tham gia chương trình đào tạo.
  • Phát triển các công cụ giúp người dùng dễ dàng đóng góp, truy cập dữ liệu bên trong và diễn giải thông tin bắt nguồn từ các tài nguyên này (như trang web của NIH) để mở rộng quyền truy cập và dễ dàng tận dụng dữ liệu.  

Các tác giả cũng đề xuất các mối quan hệ đối tác sau đây mà NIH có thể tham gia:

  • Các tổ chức cộng đồng/phi lợi nhuận tại địa phương giúp NIH tiếp cận các cộng đồng có nguồn lực hạn chế, cung cấp kinh phí ở những nơi cần thiết nhất và liên lạc với những nhóm dân cư bị ảnh hưởng. 
  • Các tổ chức liên bang hỗ trợ nghiên cứu dữ liệu và/hoặc hệ thống, bao gồm FFRDC tập trung chủ yếu vào khoa học dữ liệu và quản lý dữ liệu (ví dụ: Viện Kỹ thuật Phần mềm).
  • Các chuyên gia y tế công cộng, vì điều cần thiết là phải hiểu mạng lưới y tế công cộng và cách thức chăm sóc bệnh nhân phù hợp. Các chuyên gia y tế công cộng thường không có EHR mới nhất cũng như không có kinh phí cần thiết để tích hợp với công nghệ điện toán.
  • Các công ty dược phẩm, mặc dù rất khó chia sẻ dữ liệu nhưng họ sử dụng rất nhiều dữ liệu công cộng và giải quyết các nhu cầu sức khỏe cộng đồng, vì vậy làm việc với họ sẽ có lợi.
  • NSF (đặc biệt là các trung tâm siêu máy tính), bao gồm Viện AI NSF tập trung vào các thách thức y sinh (ví dụ: AI-CARING) cũng như các bộ phận trong ban giám đốc CISE tập trung vào hệ thống, ngôn ngữ lập trình, sinh học tính toán và thuật toán.
  • Sở Năng lượng (DOE)
  • Hệ thống nghiên cứu quân sự
  • Cựu chiến binh (VA) – Các bệnh viện VA và các hệ thống chăm sóc liên quan thu thập lượng lớn dữ liệu bệnh nhân đại diện cho cả những thách thức sức khỏe phổ biến (ví dụ như tim mạch) và riêng biệt (ví dụ: PTSD liên quan đến chiến đấu). Hợp tác với họ có thể cung cấp nguồn dữ liệu độc đáo và nêu bật những quan điểm rất khác nhau của bệnh nhân và nhà cung cấp.   

Ở mức độ cao hơn, các tác giả nhấn mạnh rằng nhiều nỗ lực nghiên cứu y sinh đòi hỏi những tiến bộ trong nghiên cứu khoa học máy tính cơ bản, bao gồm các lĩnh vực như ngôn ngữ lập trình, thuật toán và hệ thống. Các lĩnh vực này cũng cần được hỗ trợ ở quy mô chưa từng có để đáp ứng các mục tiêu của kế hoạch này, đặc biệt là hỗ trợ khả năng tương tác dữ liệu, xử lý có thể tái tạo và phân tán, tính khả dụng của dữ liệu có độ trễ thấp, nén, tìm kiếm và lưu trữ dữ liệu.

Đọc phản hồi đầy đủ của CCC tại đây.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img