चिकित्सा डेटा अत्यधिक प्रासंगिक और भारी रूप से बहु-मोडल है, जिसमें प्रत्येक डेटा साइलो को अलग से व्यवहार किया जाता है। विभिन्न डेटा को ब्रिज करने के लिए, एक नॉलेज ग्राफ-आधारित दृष्टिकोण डोमेन के डेटा को एकीकृत करता है और वैज्ञानिक ज्ञान के जटिल प्रतिनिधित्व को अधिक स्वाभाविक रूप से प्रस्तुत करने में मदद करता है। उदाहरण के लिए, प्रमुख इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड (ईएचआर) के तीन घटक निदान कोड, प्राथमिक नोट और विशिष्ट दवाएं हैं। चूँकि ये अलग-अलग डेटा साइलो में दर्शाए जाते हैं, इसलिए इन दस्तावेजों का द्वितीयक उपयोग एक विशिष्ट अवलोकन विशेषता वाले रोगियों की सही पहचान के लिए एक महत्वपूर्ण चुनौती है। उन विभिन्न स्रोतों को जोड़कर, विषय वस्तु विशेषज्ञों के पास डेटा का एक समृद्ध पूल है यह समझने के लिए कि कैसे विभिन्न अवधारणाएं जैसे रोग और लक्षण एक दूसरे के साथ बातचीत करते हैं और उनके शोध का संचालन करने में मदद करते हैं। यह अंततः स्वास्थ्य देखभाल और जीवन विज्ञान में मदद करता है शोधकर्ताओं और चिकित्सकों ने विभिन्न प्रकार के उपयोग के मामलों के लिए डेटा से बेहतर अंतर्दृष्टि पैदा की है, जैसे कि दवा की खोज और व्यक्तिगत उपचार।
इस पोस्ट में, हम उपयोग करते हैं अमेज़न हेल्थलेक में EHR डेटा निर्यात करने के लिए फास्ट हेल्थकेयर इंटरऑपरेबिलिटी रिसोर्स (FHIR) डेटा प्रारूप। फिर हम मेडिकल डेटा से निकाले गए प्रमुख संस्थानों के आधार पर एक ज्ञान ग्राफ बनाते हैं। Amazon HealthLake मेडिकल नोट्स जैसे असंरक्षित मेडिकल डेटा को भी निकालता है और बदल देता है, इसलिए इसे खोजा और विश्लेषण किया जा सकता है। के साथ साथ अमेज़ॅन केंद्र और अमेज़न नेपच्यून, हम डोमेन विशेषज्ञों को एक प्राकृतिक भाषा का प्रश्न पूछने, परिणामों और प्रासंगिक दस्तावेजों की सतह की अनुमति देते हैं, और जुड़े प्रमुख संस्थाओं को दिखाते हैं जैसे कि उपचार, अनुमानित ICD-10 कोड, दवाएं और रिकॉर्ड और दस्तावेजों के पार। यह एक एकीकृत समाधान में प्रमुख संस्थाओं, सह-रुग्णता विश्लेषण, और रोगी कोहोर्ट विश्लेषण की सह-घटना के आसान विश्लेषण के लिए अनुमति देता है। ग्राफ नेटवर्क के माध्यम से प्रभावी खोज क्षमताओं और डेटा माइनिंग के संयोजन से उपयोगकर्ताओं के लिए प्रासंगिक जानकारी खोजने और ईएचआर के आसपास के ज्ञान सेवाक्षमता में सुधार करने के लिए उपयोगकर्ताओं के लिए समय और लागत कम हो जाती है। इस पोस्ट के लिए कोड आधार पर उपलब्ध है गीथहब रेपो.
समाधान अवलोकन
इस पोस्ट में, हम दो उद्देश्यों के लिए Amazon HealthLake से आउटपुट का उपयोग करते हैं।
सबसे पहले, हम ईएआरएस को रोगी के नोटों से बाहर रैंकिंग के लिए अमेज़ॅन केंद्र में सूचीबद्ध करते हैं, जो रोगी के नोटों की पहचान करने में चिकित्सक की दक्षता में सुधार करने में मदद करते हैं और इसी तरह की विशेषताओं को साझा करने वाले अन्य रोगियों के साथ तुलना करते हैं। यह शाब्दिक खोज के लिए एक शाब्दिक खोज का उपयोग करने से बदलता है जो क्वेरी के आसपास संदर्भ का परिचय देता है, जिसके परिणामस्वरूप बेहतर खोज आउटपुट (निम्न स्क्रीनशॉट देखें)।
दूसरा, हम उपयोगकर्ताओं के लिए मेटाडेटा को अधिक सरल और सामान्यीकृत दृश्य में देखने के लिए उपयोगकर्ताओं के लिए ज्ञान ग्राफ एप्लिकेशन बनाने के लिए नेप्च्यून का उपयोग करते हैं, जो हमें एक दस्तावेज़ से उपजी महत्वपूर्ण विशेषताओं को उजागर करने की अनुमति देता है (निम्न स्क्रीनशॉट देखें)।
निम्नलिखित चित्र हमारी वास्तुकला को दर्शाता है।
समाधान को लागू करने के लिए कदम इस प्रकार हैं:
- Amazon HealthLake डेटा बनाएं और निर्यात करें।
- मरीज के दौरे नोट और मेटाडेटा निकालें।
- लोड रोगी नोटों को अमेज़न केंद्र में डेटा।
- डेटा को नेप्च्यून में लोड करें।
- वेब ऐप चलाने के लिए बैकएंड और फ्रंट एंड को सेट करें।
Amazon HealthLake डेटा बनाएं और निर्यात करें
पहले चरण के रूप में, अमेज़ॅन हेल्थलेक का उपयोग करके डेटा स्टोर बनाएं या तो अमेज़ॅन हेल्थलेक कंसोल या के माध्यम से AWS कमांड लाइन इंटरफ़ेस (AWS CLI)। इस पोस्ट के लिए, हम AWS CLI दृष्टिकोण पर ध्यान केंद्रित करते हैं।
- हम का उपयोग करें AWS क्लाउड 9 निम्नलिखित कोड के साथ एक डेटा स्टोर बनाने के लिए < > एक अद्वितीय नाम के साथ:
पूर्ववर्ती कोड अमेज़न हेल्थकेक आउटपुट का उपयोग करने के तरीके का पता लगाने के लिए, सिंथिया से एक प्रीलोडेड डेटासेट का उपयोग करता है, जो एफएचआईआर संस्करण आर 4 में समर्थित है। कोड चलाना निम्नलिखित कोड के समान प्रतिक्रिया उत्पन्न करता है, और इस चरण को पूरा होने में कुछ मिनट लगते हैं (लेखन के समय लगभग 30 मिनट):
आप Amazon HealthLake कंसोल पर या AWS Cloud9 वातावरण में पूरा होने की स्थिति की जांच कर सकते हैं।
- एडब्ल्यूएस क्लाउड 9 में स्थिति की जांच करने के लिए, स्थिति की जांच करने और जब तक प्रतीक्षा करने के लिए निम्न कोड का उपयोग करें
DatastoreStatus
से बदलता हैCREATING
सेवा मेरेACTIVE
:
- जब स्थिति में परिवर्तन होता है
ACTIVE
, ARN से भूमिका प्राप्त करेंHEALTHLAKE-KNOWLEDGE-ANALYZER-IAMROLE
में ढेर एडब्ल्यूएस CloudFormation, भौतिक आईडी के साथ जुड़ा हुआ हैAmazonHealthLake-Export-us-east-1-HealthDataAccessRole
, और लिंक किए गए पृष्ठ में ARN की प्रतिलिपि बनाएँ। - AWS Cloud9 में, Amazon HealthLake से डेटा निर्यात करने के लिए निम्न कोड का उपयोग करें अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी से उत्पन्न AWS क्लाउड डेवलपमेंट किट (एडब्ल्यूएस सीडीके) और नोट करें
job-id
उत्पादन:
- सत्यापित करें कि निर्यात कार्य निम्नलिखित कोड का उपयोग करके पूरा हुआ है
job-id
आपके द्वारा चलाए गए अंतिम कोड से प्राप्त किया गया। (जब निर्यात पूरा हो जाता है,JobStatus
उत्पादन राज्यों मेंCOMPLETED
):
मरीज के दौरे नोट और मेटाडेटा निकालें
अगले चरण में कच्चे पाठ प्राप्त करने के लिए रोगी के दौरे को डिकोड करना शामिल है। हम Amazon HealthLake एक्सपोर्ट स्टेप से निम्नलिखित डॉक्यूमेंट को जमा करेंगे। अमेज़न SageMaker नोटबुक उदाहरण। सबसे पहले, Github रेपो से प्रदान की गई नोटबुक को SageMaker उदाहरण में सहेजें। फिर, S0 से DocumentReference-3.ndjson फ़ाइलों को स्वचालित रूप से खोजने और आयात करने के लिए नोटबुक चलाएँ।
इस चरण के लिए, शीघ्रता से नोटबुक चलाने के लिए रिसर्जर्ड SageMaker का उपयोग करें। नोटबुक का पहला भाग एक पाठ फ़ाइल बनाता है जिसमें प्रत्येक रोगी की यात्रा के नोट्स शामिल होते हैं और इसे अमेज़ॅन S3 स्थान पर सहेजा जाता है। क्योंकि एकल रोगी के लिए कई दौरे मौजूद हो सकते हैं, एक विशिष्ट पहचान रोगी की विशिष्ट आईडी और विज़िट आईडी को जोड़ती है। इन रोगियों के नोटों का उपयोग अमेज़ॅन केंद्र का उपयोग करने के खिलाफ अर्थ खोज करने के लिए किया जाता है।
नोटबुक में अगले चरण में स्वचालित रूप से निकाले गए मेटाडेटा के आधार पर त्रिभुज बनाना शामिल है। अमेज़ॅन S3 स्थान में मेटाडेटा बनाने और सहेजने से, ए AWS लाम्बा रोगी के दौरे के नोटों के आसपास के त्रिभुजों को उत्पन्न करने के लिए फ़ंक्शन शुरू हो जाता है।
लोड रोगी नोटों को अमेज़न केंद्र में डेटा
S3 बाल्टी के स्रोत पथ में अपलोड की गई पाठ फ़ाइलों को क्रॉल और अनुक्रमित करने की आवश्यकता है। इस पद के लिए, AWS CDK परिनियोजन के दौरान एक डेवलपर संस्करण बनाया जाता है, इसलिए कच्चे रोगी नोटों को जोड़ने के लिए सूचकांक बनाया जाता है।
- HALTHLAKE-KNOWLEDGE-ANALYZER-CORE स्टैक के तहत AWS CloudFormation कंसोल पर, केंद्र पर खोज करें उपयुक्त संसाधन चुनें टैब और इंडेक्स आईडी और डेटा स्रोत आईडी पर ध्यान दें (पाइप (!) से पहले भौतिक आईडी के पहले भाग की प्रतिलिपि बनाएँ)।
- AWS Cloud9 में वापस, अमेज़ॅन K3 में अमेज़न नोटों में रोगी नोटों को सिंक्रनाइज़ करने के लिए निम्न आदेश चलाएँ:
- आप निम्न कमांड को चलाकर सिंक स्थिति पूरी होने पर सत्यापित कर सकते हैं:
क्योंकि अंतर्ग्रहण डेटा बहुत छोटा है, यह तुरंत दिखाना चाहिए कि स्थिति पूर्ववर्ती कमांड को चलाने पर सक्रिय है।
डेटा को नेप्च्यून में लोड करें
इस अगले चरण में, हम पहुंचते हैं अमेज़ॅन इलास्टिक कम्प्यूट क्लाउड (अमेज़ॅन EC2) उदाहरण जो कि निम्नलिखित कोड का उपयोग करके अमेज़ॅन S3 से ट्रिपंट को नेप्च्यून में लोड करता है:
वेब ऐप चलाने के लिए बैकएंड और फ्रंट एंड को सेट करें
पूर्ववर्ती चरण को पूरा होने में कुछ सेकंड लगने चाहिए। इस बीच, वेब ऐप तक पहुंचने के लिए EC2 इंस्टेंस को कॉन्फ़िगर करें। उदाहरण में पायथन और नोड दोनों को स्थापित करना सुनिश्चित करें।
- उदाहरण के टर्मिनल में निम्न कोड चलाएँ:
यह सार्वजनिक पते पर तैनात ऐप को रूट करता है।
- शीर्षक वाले दो फ़ोल्डरों को कॉपी करें
ka-webapp
औरka-server-webapp
और उन्हें नामित फ़ोल्डर में अपलोड करेंdev
EC2 उदाहरण में। - सामने के छोर के लिए, निम्न कमांड चलाकर स्क्रीन बनाएं:
- इस स्क्रीन में, फ़ोल्डर को इसमें बदलें
ka-webapp
और भाग खड़ा हुआnpm
इंस्टॉल। - स्थापना के बाद, फ़ाइल में जाएं
.env.development
और अमेज़न EC2 सार्वजनिक IPv4 पते को रखें और फ़ाइल को सहेजें। - रन
npm
प्रारंभ करें और फिर स्क्रीन को अलग करें। - बैकएंड के लिए, दर्ज करके एक और स्क्रीन बनाएं:
- फ़ोल्डर को इसमें बदलें
ka-server-webapp
और भाग खड़ा हुआpip install -r requirements.txt
. - लाइब्रेरी स्थापित होने पर, निम्न कोड दर्ज करें:
- वर्तमान स्क्रीन से अलग करें, और किसी भी ब्राउज़र का उपयोग करके, वेब ऐप तक पहुंचने के लिए Amazon EC2 Public IPv4 एड्रेस पर जाएं।
एक रोगी निदान के लिए खोज करने का प्रयास करें और उस दस्तावेज़ के ज्ञान ग्राफ की कल्पना करने के लिए एक दस्तावेज़ लिंक चुनें।
अगले चरण
इस पोस्ट में, हम Amazon HealthLake से डेटा आउटपुट को खोज और ग्राफ़ इंजन दोनों में शब्दार्थ रूप से प्रासंगिक जानकारी खोजते हैं और दस्तावेज़ों से जुड़ी महत्वपूर्ण संस्थाओं को उजागर करते हैं। आप इस नॉलेज ग्राफ का और विस्तार कर सकते हैं और इसे अन्य ऑन्कोलॉजी जैसे मीश और मेडड्रा से जोड़ सकते हैं।
इसके अलावा, यह अन्य नैदानिक डेटासेट को एकीकृत करने और डेटा फैब्रिक बनाने के लिए इस नॉलेज ग्राफ का विस्तार करने के लिए एक आधार प्रदान करता है। आप रोगी के परिणाम के साथ रोग सहसंबंधित चयन के लिए संरचित और भाषा-आधारित खोजों के लिए ऐतिहासिक जनसंख्या डेटा का पीछा करते हुए प्रश्न पूछ सकते हैं।
क्लीन अप
अपने संसाधनों को साफ करने के लिए, निम्नलिखित चरणों को पूरा करें:
- बनाए गए स्टैक को हटाने के लिए, सभी संसाधनों को ठीक से निकालने के लिए दिए गए आदेश में निम्नलिखित कमांड दर्ज करें:
- जब पूर्ववर्ती कमांड चल रही हो, तब बनाया गया अमेज़न केंद्र डेटा स्रोत को हटा दें:
- सत्यापित करने के लिए इसे हटा दिया गया है, निम्न कमांड चलाकर स्थिति की जाँच करें:
- यह सुनिश्चित करने के लिए कि संबंधित सभी ढेर शुरू हो रहे हैं, AWS CloudFormation कंसोल की जाँच करें
HEALTHLAKE-KNOWLEDGE-ANALYZER
सभी सफलतापूर्वक हटा दिए गए हैं।
निष्कर्ष
Amazon HealthLake आपको स्वास्थ्य और नैदानिक समाधान बनाने की अनुमति देने के लिए FHIR मानक पर आधारित एक प्रबंधित सेवा प्रदान करता है। अमेज़ॅन हेल्थकेक के उत्पादन को अमेज़ॅन केंद्र और नेपच्यून से कनेक्ट करना आपको अपने बुद्धिमान अनुप्रयोग को शक्ति देने के लिए एक संज्ञानात्मक खोज और एक स्वास्थ्य ज्ञान ग्राफ बनाने की क्षमता देता है।
इस दृष्टिकोण के शीर्ष पर बिल्डिंग शोधकर्ताओं और फ्रंट-लाइन चिकित्सकों को आसानी से नैदानिक नोटों और शोध लेखों में आसानी से खोज करने के लिए सक्षम कर सकते हैं, ताकि वे अपने प्रश्न को एक वेब ब्राउज़र में लिख सकें। हर नैदानिक साक्ष्य को टैगिंग, अनुक्रमित और संरचित किया जाता है और ट्रांसमिशन, जोखिम कारक, चिकित्सीय और ऊष्मायन जैसी चीजों पर साक्ष्य-आधारित विषय प्रदान करने के लिए मशीन लर्निंग का उपयोग किया जाता है। यह विशेष रूप से कार्यक्षमता चिकित्सकों या वैज्ञानिकों के लिए काफी मूल्यवान है क्योंकि यह उन्हें अपने नैदानिक निर्णय समर्थन या अनुसंधान को मान्य और अग्रिम करने के लिए जल्दी से एक सवाल पूछने की अनुमति देता है।
अपने दम पर यह कोशिश करो! उदाहरण पर तैनाती करके अपने AWS खाते में Amazon HealthLake का उपयोग करके इस समाधान को तैनात करें GitHub.
लेखक के बारे में
पृथ्वीराज जोतिकुमार, पीएचडी, एडब्ल्यूएस प्रोफेशनल सर्विसेज के साथ डेटा साइंटिस्ट है, जहां वह ग्राहकों को मशीन लर्निंग का उपयोग करके समाधान बनाने में मदद करता है। उन्हें फिल्में और खेल देखने और ध्यान लगाने के लिए समय बिताना अच्छा लगता है।
फी नगुयेन AWS में एक सॉल्यूशन आर्किटेक्ट है जो डेटा लेक, एनालिटिक्स, सिमेंटिक्स टेक्नोलॉजी और मशीन लर्निंग पर विशेष ध्यान देने के साथ अपने क्लाउड यात्रा के साथ ग्राहकों की मदद करता है। अपने खाली समय में, आप उसे काम करने के लिए बाइक चला सकते हैं, अपने बेटे की फुटबॉल टीम की कोचिंग कर सकते हैं या उसके अकाल के साथ प्रकृति का आनंद ले सकते हैं
परमिंदर भाटिया AWS हेल्थ एआई में एक विज्ञान नेता है, जो वर्तमान में बड़े पैमाने पर नैदानिक डोमेन के लिए गहन शिक्षण एल्गोरिदम का निर्माण कर रहा है। उनकी विशेषज्ञता कम संसाधन सेटिंग्स में मशीन लर्निंग और बड़े पैमाने पर पाठ विश्लेषण तकनीकों में है, खासकर बायोमेडिकल, लाइफ साइंसेज और हेल्थकेयर प्रौद्योगिकियों में। वह अपने परिवार के साथ फुटबॉल, पानी के खेल और यात्रा का आनंद लेते हैं।
गेरिन केसलर अमेज़ॅन वेब सर्विसेज में एक वरिष्ठ डेटा साइंस मैनेजर है, जहां वह डेटा वैज्ञानिकों और एप्लिकेशन आर्किटेक्ट्स की टीमों का नेतृत्व करता है, जो ग्राहकों के लिए bespoke मशीन लर्निंग एप्लीकेशन वितरित करता है। AWS के बाहर, वह जॉर्जटाउन में मशीन लर्निंग और तंत्रिका भाषा मॉडल पर व्याख्यान देता है। जब काम नहीं होता है, तो वह दोस्तों और परिवार के साथ संदिग्ध गुणवत्ता के संगीत को सुनने (और बनाने) का आनंद लेता है।
डॉ। ताहा कस-हाउट अमेज़ॅन वेब सर्विसेज में मशीन लर्निंग और मुख्य चिकित्सा अधिकारी के निदेशक हैं, और अमेज़ॅन कॉम्प्रिहेंस मेडिकल और अमेज़ॅन हेल्थकेक सहित हमारी स्वास्थ्य एआई रणनीति और प्रयासों का नेतृत्व करते हैं। ताहा सीओवीआईडी -19 लैब परीक्षण के लिए विज्ञान, प्रौद्योगिकी और पैमाने विकसित करने के लिए जिम्मेदार अमेज़ॅन की टीमों के साथ भी काम कर रहा है। एक चिकित्सक और बायोइनफॉरमैटिशियन, ताहा ने राष्ट्रपति ओबामा के तहत दो कार्यकाल दिए, जिनमें एफडीए में पहले मुख्य स्वास्थ्य सूचना अधिकारी भी शामिल थे। इस दौरान एक लोक सेवक के रूप में, उन्होंने उभरती प्रौद्योगिकियों और क्लाउड (सीडीसी के इलेक्ट्रॉनिक रोग निगरानी) के उपयोग का बीड़ा उठाया, और व्यापक रूप से सुलभ वैश्विक डेटा साझाकरण प्लेटफ़ॉर्म, ओपनफ़डीए की स्थापना की, जो शोधकर्ताओं और जनता को प्रतिकूल घटना डेटा की खोज और विश्लेषण करने में सक्षम बनाता है, और प्रिसिजन एफडीए (प्रेसिडेंशियल प्रिसिजन मेडिसिन पहल का हिस्सा)।
Coinsmart। यूरोपा में बेस्टे बिटकॉइन-बोरसे
स्रोत: https://aws.amazon.com/blogs/machine-learning/build-a-cognitive-search-and-a-health-knowledge-graph-use-amazon-healthlake-amazon-kendra-and-amazon- नेपच्यून /