Intel, Penn Medicine ra mắt Mô hình học tập liên kết dành cho các khối u não

Đại học Pennsylvania và Intel đã xây dựng một liên đoàn gồm 30 tổ chức sử dụng phương pháp học tập liên kết để đào tạo các mô hình trí tuệ nhân tạo (AI) nhằm xác định ranh giới của các khối u não. (NHỮNG HÌNH ẢNH ĐẸP)

Bởi Allison Proffitt, Giám đốc biên tập, Xu hướng AI

Được lãnh đạo bởi Spyridon Bakas tại Trung tâm Phân tích và Tính toán Hình ảnh Y sinh (CBICA) tại Trường Y khoa Perelman thuộc Đại học Pennsylvania, liên đoàn là bước tiến tiếp theo trong nỗ lực kéo dài nhiều năm nhằm thu thập dữ liệu có thể hỗ trợ AI trong não Phân tích hình ảnh.

“Trong vài năm nghiên cứu gần đây nhất của mình, tôi đã tập trung vào việc tìm hiểu các mô hình dự đoán về phân đoạn khối u não, dự đoán bộ gen, dự đoán khả năng sống sót chung của bệnh nhân từ các lần quét cơ bản…, đánh giá xu hướng trở nên hung hãn hơn của khối u bằng nhiều cách khác nhau, hướng tới việc cải thiện kết quả lâm sàng của bệnh nhân,” Bakas nói Thế giới CNTT sinh học.

Các khối u não có nhiều ngăn nhạy cảm, hiển thị trong các lần quét khác nhau theo những cách khác nhau: các phần hoạt động của khối u thực sự có mạch máu, các phần hoại tử của khối u nơi mô đã chết và các phần của khối u đang xâm nhập vào mô khỏe mạnh.

Bakas nói: “Một sự bất thường trong não khá dễ dàng để ai đó phát hiện ra. Ứng dụng AI vào vấn đề “không phải để phát hiện có khối u hay không; đó là để phát hiện ranh giới của khối u.”

Spyridon Bakas, Trung tâm Phân tích và tính toán hình ảnh y sinh, Trường Y Perelman, Đại học Pennsylvania

Bakas đã dẫn đầu Thử thách phân chia khối u não quốc tế (BraTS) kể từ năm 2017. Các thử thách hàng năm bắt đầu vào năm 2012 nhằm đánh giá các phương pháp tiên tiến để phân chia khối u não trong quá trình quét hình ảnh cộng hưởng từ đa phương thức (MRI). Trong quá trình đó, Bakas giải thích, anh đã trở nên rất quen thuộc với những trở ngại trong việc tập hợp một tập dữ liệu tập trung để làm tập dữ liệu chuẩn cộng đồng cho BraTS. Những người tham gia lo ngại về quyền riêng tư cả từ góc độ thể chế và văn hóa. Các tổ chức chỉ sẵn sàng chia sẻ hình ảnh MRI của vài chục bệnh nhân.

Sau gần mười năm thử thách BraTS, nhóm đã tập hợp được một bộ dữ liệu tích lũy từ 650 bệnh nhân trưởng thành bao gồm bốn hình ảnh của mỗi bệnh nhân.

Nhưng Bakas giải thích rằng mỗi tổ chức thành viên đều có ít nhất lượng dữ liệu này. “Nếu không có lo ngại về quyền riêng tư hoặc quyền sở hữu dữ liệu, thay vào đó chúng tôi nên có 650 x 21 [bệnh nhân]—một bộ dữ liệu đầy đủ từ mỗi tổ chức liên quan đến BraTS.”

Chắc chắn đã có giải pháp.

Bakas, một nhà khoa học tính toán được đào tạo bài bản, đã bắt đầu nghĩ đến các phương pháp học máy. Tại một hội nghị vào đầu năm 2018, anh đã gặp các nhà nghiên cứu từ Intel AI và Intel Labs. “Chúng tôi đã nảy ra ý tưởng này: sử dụng công nghệ học máy liên kết trong y học để tạo ra các hình ảnh y tế.”

Nhập Intel

Học liên kết được Google giới thiệu lần đầu tiên vào năm 2017 và được sử dụng để đào tạo các mô hình tự động sửa lỗi cho việc nhắn tin. Chủ sở hữu dữ liệu đào tạo kiến trúc mô hình cục bộ chỉ sử dụng dữ liệu của riêng họ. Sau đó, mỗi mô hình được chia sẻ với một máy chủ tổng hợp, tạo ra một mô hình đồng thuận về tất cả kiến thức tích lũy được từ chủ sở hữu dữ liệu, mặc dù dữ liệu thô không bao giờ rời khỏi tổ chức của họ.

Jason Martin, kỹ sư chính tại Intel Labs và là nhà nghiên cứu về quyền riêng tư, đã khám phá các cách áp dụng học tập liên kết, đặc biệt là trong các lĩnh vực nhạy cảm về quyền riêng tư.

Jason Martin, kỹ sư chính tại Phòng thí nghiệm Intel (INTEL LABS)

Martin cho biết: “Khi xem xét [học tập liên kết], chúng tôi nhận ra rằng mình có thể đóng góp một số công nghệ bảo mật và quyền riêng tư cũng như kiến thức miền cho nó. “Chúng tôi bắt đầu xem xét những trường hợp sử dụng quan trọng nào sẽ được hưởng lợi từ kiểu học tập liên kết bảo vệ quyền riêng tư này.”

Hình ảnh y tế có ý nghĩa, vì vậy Bakas, Martin và các đồng nghiệp của họ đã bắt đầu với một nghiên cứu khả thi: tạo ra một hệ thống học tập liên kết giả sử dụng dữ liệu BraTS đã có sẵn. Mô hình học tập liên kết có thể huấn luyện một thuật toán có độ chính xác tương tự như dữ liệu gộp không?

Nhóm đã chia đôi dữ liệu BraTS được quyên góp. Dữ liệu từ chín tổ chức đã được sử dụng để xác nhận và đào tạo mô hình gộp; dữ liệu từ 10 tổ chức được tổ chức trong nước phân chia và đào tạo theo cách liên kết—như thể nó chưa bao giờ được chia sẻ.

“Chúng tôi đã đào tạo một mô hình AI dựa trên dữ liệu tập trung đã được chia sẻ. Sau đó, chúng tôi đạt được hiệu suất X,” Bakas giải thích. “Sau đó, chúng tôi lấy dữ liệu, phân phối nó như thể nó không được chia sẻ và áp dụng phương pháp liên kết. Chúng tôi đã đào tạo mô hình này dựa trên dữ liệu của từng tổ chức và chúng tôi tổng hợp nó theo cách để tạo ra một mô hình đồng thuận.”

Nhóm nghiên cứu nhận thấy rằng hai nhóm thực hiện gần như giống hệt nhau. Hiệu suất của các mô hình phân đoạn ngữ nghĩa liên kết khi quét não đa phương thức có Hệ số xúc xắc là 0.852 trong khi các mô hình được đào tạo bằng cách chia sẻ dữ liệu có Hệ số xúc xắc là 0.862. (Hệ số xúc xắc bằng 1 sẽ là sự liên kết hoàn hảo giữa mô hình và thực tế.)

Bakas cho biết: “Mô hình liên kết đã hoạt động đạt 99% hiệu suất của mô hình được đào tạo trên dữ liệu tập trung”.

Nghiên cứu khả thi này được thực hiện vào năm 2018 tại Hội thảo tổn thương não quốc tế MICCAI (DOI: 10.1007/978-3-030-11723-8_9). Bakas và Martin đều là tác giả.

“Chúng tôi là những người đầu tiên chứng minh rằng nếu bạn chia dữ liệu đó thành 10 tổ chức y tế ban đầu đã quyên góp và coi họ như một liên đoàn thay vì một khoản quyên góp trung tâm, thì bạn có thể đạt được hiệu suất phân đoạn gần như tương tự từ máy. mô hình học tập,” Martin nói. “Điều đó thật thú vị!”

Và trên nền tảng đó mà liên đoàn mới sẽ được xây dựng.

Bakas đã nhận được một khoản tài trợ từ chương trình Công nghệ tin học cho nghiên cứu ung thư (ITCR) của Viện Ung thư Quốc gia (NCI) thuộc Viện Y tế Quốc gia (NIH) để khám phá thêm ý tưởng này. Khoản tài trợ trị giá 1.2 triệu đô la trong ba năm này tài trợ cho công việc của Penn Medicine phát triển nền tảng Phân đoạn khối u liên kết (FeTS), bộ công cụ nguồn mở và GUI thân thiện với người dùng. Bakas giải thích rằng Penn Medicine mang đến khả năng chụp ảnh y tế và máy học. Intel Labs là nhà cung cấp công nghệ và cung cấp tất cả kiến thức chuyên môn về bảo mật và quyền riêng tư.

Martin cho biết: “Chúng tôi đang làm việc với Spyros để tạo ra một nền tảng học tập liên kết thực sự—các thành phần cơ sở hạ tầng và phần mềm thực tế cần thiết để nhiều tổ chức cộng tác trên internet công cộng”.

Liên đoàn mới, câu hỏi mới

Mặc dù nghiên cứu khả thi rất hứa hẹn về tính chính xác của việc học tập liên kết nhưng vẫn còn những câu hỏi cần được trả lời. Một liên đoàn như vậy sẽ hành xử như thế nào trong thế giới thực? Những rủi ro về quyền riêng tư là gì? Học tập liên kết sẽ có bao nhiêu công việc dành cho các tổ chức lưu trữ dữ liệu?

Martin nói: “Chúng tôi biết một số câu trả lời cho những câu hỏi đó và thành thật mà nói, tôi hy vọng chúng tôi sẽ tìm hiểu được một số câu trả lời trong số đó”.

Nhóm BraTS ban đầu bao gồm 19 tổ chức; liên đoàn hiện tại có 30 nhóm. Tất cả các thành viên liên đoàn đều là các tổ chức nghiên cứu và đã cam kết nỗ lực nghiên cứu, không chỉ dữ liệu, cho dự án.

Sẽ có nhiều công việc quan trọng dành cho các tổ chức lưu trữ dữ liệu, ít nhất là trong thời gian đầu. Mô hình học liên kết là một mô hình học có giám sát. Dữ liệu phải được chú thích bằng tay. Trong trường hợp này, bác sĩ X quang tại mỗi tổ chức thành viên sẽ dán nhãn các khối u trong ảnh MRI theo quy trình được thiết lập thông qua BraTS. Đó là một bước tốn kém. Trong tương lai—ở quy mô lớn hơn nhiều—mô hình học tập liên kết có thể chuyển sang học tập không giám sát, giảm bớt một số gánh nặng cho các tổ chức tham gia.

Các câu hỏi lớn khác dành cho máy chủ dữ liệu sẽ tập trung vào quyền riêng tư và băng thông. Martin hy vọng các thành viên liên đoàn sớm nhất có thể sẽ chuyển dữ liệu mà họ đã cam kết sử dụng để đào tạo mô hình sang một máy chủ riêng để có được sự riêng tư cao hơn. Tất nhiên, về mặt lý thuyết, những dữ liệu đó sẽ không rời khỏi tổ chức, nhưng kiến trúc mô hình sẽ đến và đi qua internet. Ông nói: “Tôi nghĩ sẽ mất một thời gian để có được sự thoải mái với thứ gì đó có kết nối internet được kết nối với chính hệ thống chăm sóc sức khỏe.

Một số thách thức trong mô hình học tập liên kết chỉ mang tính xã hội và quan hệ: xây dựng niềm tin trong nhóm. Martin lập luận rằng điều rất quan trọng là tất cả những người tham gia đều tin tưởng rằng những người khác cũng đang chơi theo cùng một quy tắc. Phần cứng có thể giúp đỡ.

“Phần lớn trọng tâm của chúng tôi tại Intel là đảm bảo rằng khi [liên đoàn được] triển khai, các bên tham gia có thể tin cậy lẫn nhau để đóng góp một cách công bằng và các quy tắc tham gia—nếu bạn muốn—được thực thi bởi phần cứng. nền tảng và phần mềm mà chúng tôi đang phát triển,” Martin giải thích.

Nhưng toàn bộ mô hình vẫn đòi hỏi sự tin tưởng giữa các cá nhân.

Martin cho biết: “Nền tảng mà chúng tôi đang tạo vẫn yêu cầu bạn đến bàn — hoặc bàn ảo — và bạn quyết định các thử nghiệm hoặc mục tiêu của mình. “Một khi bạn đồng ý với chúng, thì đó là những quy tắc mà chúng tôi muốn thực thi thông qua các cơ chế trong kiến trúc hệ thống. Những gì bạn đồng ý tại bàn đàm phán không thể bị xâm phạm dù cố ý hay vô ý bởi phần mềm độc hại hoặc tác nhân xấu xâm nhập vào hệ thống.”

Mở mô hình

Bản thân Liên đoàn chỉ mới ra mắt. Nhóm của Martin đang giải quyết “điều mà bạn có thể coi là một số bộ phận nhàm chán của liên đoàn,” anh ấy giải thích: “đưa số lượng kết nối hoạt động và những thứ tương tự. Chúng tôi đang tăng cường phần mềm đó đến mức có thể triển khai nó cho phần còn lại của liên đoàn.”

Bakas và phòng thí nghiệm của ông “đang trong quá trình thực sự phục vụ thuật toán cho giai đoạn hai cho các tổ chức bên ngoài”. Ông cho biết phần mềm này sẽ được cung cấp dưới dạng nguồn mở. “Chúng tôi muốn khuôn khổ này được công khai. Chúng tôi không muốn tạo ra một phần mềm độc quyền mà ai đó cần phải trả tiền giấy phép hoặc sử dụng để xây dựng.” Bakas tin rằng khuôn khổ này có thể dễ dàng áp dụng cho các lĩnh vực bệnh tật khác hoặc thậm chí cả các loại dữ liệu.

Martin dự đoán sau khi phần mềm đã sẵn sàng, mỗi “vòng liên kết” —một chu kỳ đào tạo kiến trúc mô hình tại các máy chủ dữ liệu và sau đó gửi nó trở lại bộ tổng hợp — sẽ diễn ra “theo quy mô từ vài ngày đến vài tuần”.

Đây sẽ không phải là một mạch làm một lần. Bakas cho biết, việc trả lại mô hình đồng thuận cho các tổ chức thành viên sẽ mang lại tác động lâm sàng và nó sẽ chỉ cải thiện khi có nhiều dữ liệu đa dạng hơn. Mô hình cũng sẽ được cải thiện. Học tập liên kết cho phép các nhà nghiên cứu khám phá kiến trúc mô hình mới—siêu tham số—và điều chỉnh mô hình. Bakas và nhóm của ông tại Penn Medicine sẽ có thể tinh chỉnh các mô hình học máy bằng dữ liệu bổ sung mà học tập liên kết có sẵn.

Nguồn: https://www.aitrends.com/ai-in-medicine/intel-penn-medicine-launch-federated-learning-model-for-brain-tumors/

Trí thông minh dữ liệu tạo

Intel, Penn Medicine ra mắt mô hình học tập liên kết cho khối u não

OpenAI hạ thấp tin đồn về công cụ tìm kiếm web GPT-5

Dự án cơ hội huy động vốn từ cộng đồng Orchid Craftworks của Indiegogo

Tin tức mới nhất

Dự án cơ hội huy động vốn từ cộng đồng Euklis của Opstart

Holoride mất khả năng thanh toán khi đầu tư giảm sút: 'Tiên phong là đau đớn'

Hàng triệu thiết bị IoT gặp rủi ro từ Modem tích hợp

Cần sa có thể tăng cường ánh sáng phương Bắc không

CISO với tư cách là CTO: Khi nào và tại sao điều đó có ý nghĩa

AWS DeepRacer cho phép người xây dựng ở mọi cấp độ kỹ năng nâng cao kỹ năng và bắt đầu với machine learning | Dịch vụ web của Amazon