أنشئ بحثًا معرفيًا ورسم بيانيًا للمعرفة الصحية باستخدام AWS AI Services

البيانات الطبية سياقية للغاية ومتعددة الوسائط بشكل كبير ، حيث يتم التعامل مع كل صومعة بيانات بشكل منفصل. لربط البيانات المختلفة ، يدمج النهج القائم على الرسم البياني المعرفي البيانات عبر المجالات ويساعد في تمثيل التمثيل المعقد للمعرفة العلمية بشكل أكثر طبيعية. على سبيل المثال ، ثلاثة مكونات من السجلات الصحية الإلكترونية الرئيسية (EHR) هي أكواد التشخيص والملاحظات الأولية والأدوية المحددة. نظرًا لتمثيلها في مستودعات بيانات مختلفة ، فإن الاستخدام الثانوي لهذه المستندات لتحديد المرضى بدقة مع سمة محددة يمكن ملاحظتها يمثل تحديًا حاسمًا. من خلال ربط هذه المصادر المختلفة ، يكون لدى خبراء الموضوع مجموعة أكثر ثراءً من البيانات لفهم كيفية تفاعل المفاهيم المختلفة مثل الأمراض والأعراض مع بعضها البعض والمساعدة في إجراء أبحاثهم. يساعد هذا في النهاية الباحثين والممارسين في مجال الرعاية الصحية وعلوم الحياة على تكوين رؤى أفضل من البيانات لمجموعة متنوعة من حالات الاستخدام ، مثل اكتشاف الأدوية والعلاجات الشخصية.

في هذا المنشور ، نستخدم أمازون هيلث ليك لتصدير بيانات السجلات الصحية الإلكترونية بتنسيق موارد التشغيل البيني للرعاية الصحية السريعة (FHIR) تنسيق البيانات. ثم نبني رسمًا بيانيًا للمعرفة بناءً على الكيانات الرئيسية المستخرجة والمنسقة من البيانات الطبية. تقوم Amazon HealthLake أيضًا باستخراج وتحويل البيانات الطبية غير المهيكلة ، مثل الملاحظات الطبية ، بحيث يمكن البحث عنها وتحليلها. معا مع أمازون كندرا و أمازون نبتون، نسمح لخبراء المجال بطرح سؤال لغة طبيعية ، وإبراز النتائج والمستندات ذات الصلة ، وإظهار الكيانات الرئيسية المتصلة مثل العلاجات ، ورموز ICD-10 المستنبطة ، والأدوية ، والمزيد عبر السجلات والمستندات. وهذا يسمح بتحليل سهل للتواجد المشترك للكيانات الرئيسية ، وتحليل الاعتلالات المشتركة ، وتحليل مجموعة المرضى في حل متكامل. يؤدي الجمع بين إمكانات البحث الفعالة واستخراج البيانات من خلال شبكات الرسوم البيانية إلى تقليل الوقت والتكلفة للمستخدمين للعثور على المعلومات ذات الصلة حول المرضى وتحسين إمكانية خدمة المعرفة المحيطة بالسجلات الصحية الإلكترونية. قاعدة التعليمات البرمجية لهذا المنشور متاحة على جيثب ريبو.

حل نظرة عامة

في هذا المنشور ، نستخدم ناتج Amazon HealthLake لغرضين.

أولاً ، نقوم بفهرسة السجلات الصحية الإلكترونية في Amazon Kendra للحصول على تصنيف دلالي ودقيق للمستندات من ملاحظات المريض ، مما يساعد على تحسين كفاءة الطبيب في تحديد ملاحظات المريض ومقارنتها مع المرضى الآخرين الذين يتشاركون خصائص مماثلة. ينتقل هذا من استخدام البحث المعجمي إلى البحث الدلالي الذي يقدم سياقًا حول الاستعلام ، مما يؤدي إلى إخراج بحث أفضل (انظر لقطة الشاشة التالية).

ثانيًا ، نستخدم Neptune لإنشاء تطبيقات الرسم البياني المعرفي للمستخدمين لعرض البيانات الوصفية المرتبطة بملاحظات المريض بطريقة عرض أكثر بساطة وتوحيدًا ، مما يسمح لنا بتسليط الضوء على الخصائص المهمة الناشئة عن المستند (انظر لقطة الشاشة التالية).

الرسم البياني التالي يوضح هندستنا.

خطوات تنفيذ الحل هي كما يلي:

قم بإنشاء بيانات Amazon HealthLake وتصديرها.
استخراج ملاحظات زيارة المريض والبيانات الوصفية.
تحميل بيانات ملاحظات المريض إلى Amazon Kendra.
قم بتحميل البيانات في نبتون.
قم بإعداد الواجهة الخلفية والواجهة الأمامية لتشغيل تطبيق الويب.

قم بإنشاء بيانات Amazon HealthLake وتصديرها

كخطوة أولى ، قم بإنشاء مخزن بيانات باستخدام Amazon HealthLake إما عبر وحدة تحكم Amazon HealthLake أو واجهة سطر الأوامر AWS (AWS CLI). بالنسبة لهذا المنشور ، نركز على نهج AWS CLI.

نستخدم سحابة AWS 9 لإنشاء مخزن بيانات بالرمز التالي ، مع استبدال < > باسم فريد:

aws healthlake create-fhir-datastore --region us-east-1 --datastore-type-version R4 --preload-data-config PreloadDataType="SYNTHEA" --datastore-name "<<your_data_store_name>>"

يستخدم الكود السابق مجموعة بيانات مسبقة التحميل من Synthea ، وهي مدعومة في إصدار FHIR R4 ، لاستكشاف كيفية استخدام إخراج Amazon HealthLake. ينتج عن تشغيل الكود استجابة مشابهة للكود التالي ، وتستغرق هذه الخطوة بضع دقائق لإكمالها (حوالي 30 دقيقة وقت كتابة هذا التقرير):

{ "DatastoreEndpoint": "https://healthlake.us-east-1.amazonaws.com/datastore/<<your_data_store_id>>/r4/", "DatastoreArn": "arn:aws:healthlake:us-east-1:<<your_AWS_account_number>>:datastore/fhir/<<your_data_store_id>>", "DatastoreStatus": "CREATING", "DatastoreId": "<<your_data_store_id>>"
}

يمكنك التحقق من حالة الإكمال إما على وحدة تحكم Amazon HealthLake أو في بيئة AWS Cloud9.

للتحقق من الحالة في AWS Cloud9 ، استخدم الكود التالي للتحقق من الحالة وانتظر حتى DatastoreStatus التغييرات من CREATING إلى ACTIVE:

aws healthlake describe-fhir-datastore --datastore-id "<<your_data_store_id>>" --region us-east-1

عندما تتغير الحالة إلى ACTIVE، احصل على دور ARN من HEALTHLAKE-KNOWLEDGE-ANALYZER-IAMROLE كومة في تكوين سحابة AWS، المرتبطة بالهوية الفعلية AmazonHealthLake-Export-us-east-1-HealthDataAccessRole، وانسخ ARN في الصفحة المرتبطة.
في AWS Cloud9 ، استخدم الكود التالي لتصدير البيانات من Amazon HealthLake إلى ملف خدمة تخزين أمازون البسيطة (Amazon S3) تم إنشاؤه من مجموعة تطوير سحابة AWS (AWS CDK) ولاحظ ملف job-id انتاج:

aws healthlake start-fhir-export-job --output-data-config S3Uri="s3://hl-synthea-export-<<your_AWS_account_number>>/export-$(date +"%d-%m-%y")" --datastore-id <<your_data_store_id>> --data-access-role-arn arn:aws:iam::<<your_AWS_account_number>>:role/AmazonHealthLake-Export-us-east-1-HealthKnoMaDataAccessRole

تحقق من اكتمال مهمة التصدير باستخدام الكود التالي بامتداد job-id تم الحصول عليها من آخر رمز قمت بتشغيله. (عند اكتمال التصدير ، JobStatus في حالات الإخراج COMPLETED):

aws healthlake describe-fhir-export-job --datastore-id <<your_data_store_id>> --job-id <<your_job_id>>

استخراج ملاحظات زيارة المريض والبيانات الوصفية

تتضمن الخطوة التالية فك رموز زيارات المريض للحصول على النصوص الأولية. سنقوم باستيراد الملف التالي DocumentReference-0.ndjson (الموضح في الصورة التالية من S3) من خطوة تصدير Amazon HealthLake التي أكملناها مسبقًا في CDK المنشور الأمازون SageMaker مثيل دفتر الملاحظات. أولاً ، احفظ دفتر الملاحظات المقدم من Github repo في مثيل SageMaker. بعد ذلك ، قم بتشغيل الكمبيوتر الدفتري لتحديد موقع ملفات DocumentReference-0.ndjson واستيرادها تلقائيًا من S3.

لهذه الخطوة ، استخدم SageMaker ذي الموارد لتشغيل الكمبيوتر الدفتري بسرعة. يُنشئ الجزء الأول من دفتر الملاحظات ملفًا نصيًا يحتوي على ملاحظات من زيارة كل مريض ويتم حفظه في موقع Amazon S3. نظرًا لإمكانية وجود زيارات متعددة لمريض واحد ، فإن تعريفًا فريدًا يجمع بين المعرف الفريد للمريض ومعرف الزيارة. تُستخدم ملاحظات هؤلاء المرضى لإجراء بحث دلالي مقابل استخدام Amazon Kendra.

تتضمن الخطوة التالية في دفتر الملاحظات إنشاء ثلاثيات بناءً على البيانات الوصفية المستخرجة تلقائيًا. من خلال إنشاء وحفظ البيانات الوصفية في موقع Amazon S3 ، يتم إنشاء ملف AWS لامدا يتم تشغيل الوظيفة لتوليد المضاعفات الثلاثية المحيطة بملاحظات زيارة المريض.

تحميل بيانات ملاحظات المريض إلى Amazon Kendra

يجب الزحف إلى الملفات النصية التي تم تحميلها في المسار المصدر لحاوية S3 وفهرستها. بالنسبة لهذا المنشور ، يتم إنشاء إصدار مطور أثناء نشر AWS CDK ، لذلك يتم إنشاء الفهرس لربط ملاحظات المريض الأولية.

في وحدة تحكم AWS CloudFormation ضمن حزمة HEALTHLAKE-KNOWLEDGE-ANALYZER-CORE ، ابحث عن kendra على الموارد علامة التبويب ولاحظ معرف الفهرس ومعرف مصدر البيانات (انسخ الجزء الأول من المعرف الفعلي قبل الأنبوب (|)).

مرة أخرى في AWS Cloud9 ، قم بتشغيل الأمر التالي لمزامنة ملاحظات المريض في Amazon S3 مع Amazon Kendra:

aws kendra start-data-source-sync-job --id <<data_source_id_2nd_circle>> --index-id <<index_id_1st_ circle>>

يمكنك التحقق من اكتمال حالة المزامنة عن طريق تشغيل الأمر التالي:

aws kendra describe-data-source --id <<data_source_id_2nd_circle>> --index-id <<index_id_1st_circle>>

نظرًا لأن البيانات التي تم إدخالها صغيرة جدًا ، يجب أن تظهر على الفور أن الحالة نشطة عند تشغيل الأمر السابق.

قم بتحميل البيانات في نبتون

في هذه الخطوة التالية ، نصل إلى الأمازون الحوسبة المرنة السحابية (Amazon EC2) الذي تم تدويره وتحميل الثلاثيات من Amazon S3 إلى Neptune باستخدام الكود التالي:

curl -X POST -H 'Content-Type: application/json' https://healthlake-knowledge-analyzer-vpc-and-neptune-neptunedbcluster.cluster-<<your_unique_id>>.us-east-1.neptune.amazonaws.com:8182/loader -d '
{ "source": "s3://<<your_Amazon_S3_bucket>>/stdized-data/neptune_triples/nquads/", "format": "nquads", "iamRoleArn": "arn:aws:iam::<<your_AWS_account_number>>:role/KNOWLEDGE-ANALYZER-IAMROLE-ServiceRole", "region": "us-east-1", "failOnError": "TRUE"
}'

قم بإعداد الواجهة الخلفية والواجهة الأمامية لتشغيل تطبيق الويب

يجب أن تستغرق الخطوة السابقة بضع ثوانٍ حتى تكتمل. في غضون ذلك ، قم بتكوين مثيل EC2 للوصول إلى تطبيق الويب. تأكد من تثبيت كل من Python و Node في المثيل.

قم بتشغيل الكود التالي في المحطة الطرفية للمثيل:

sudo iptables -t nat -I PREROUTING -p tcp --dport 80 -j REDIRECT --to-ports 3000

هذا يوجه العنوان العام إلى التطبيق المنشور.

انسخ المجلدين بعنوان ka-webapp و ka-server-webapp وتحميلها إلى مجلد باسم dev في مثيل EC2.
للواجهة الأمامية ، قم بإنشاء شاشة عن طريق تشغيل الأمر التالي:

screen -S back

في هذه الشاشة ، قم بتغيير المجلد إلى ka-webapp و اهرب npm تثبيت.
بعد التثبيت ، انتقل إلى الملف .env.development وقم بوضع عنوان IPv2 العام الخاص بـ Amazon EC4 وحفظ الملف.
يجري npm ابدأ ثم افصل الشاشة.
بالنسبة للواجهة الخلفية ، قم بإنشاء شاشة أخرى عن طريق إدخال:

screen -S back

قم بتغيير المجلد إلى ka-server-webapp و اهرب pip install -r requirements.txt.
عند تثبيت المكتبات ، أدخل الرمز التالي:

افصل من الشاشة الحالية ، وباستخدام أي متصفح ، انتقل إلى عنوان Amazon EC2 Public IPv4 للوصول إلى تطبيق الويب.

حاول البحث عن تشخيص المريض واختر رابط المستند لتصور الرسم البياني المعرفي لهذا المستند.

الخطوات التالية

في هذا المنشور ، ندمج مخرجات البيانات من Amazon HealthLake في كل من محرك البحث والرسم البياني للبحث المعنوي عن المعلومات ذات الصلة وتسليط الضوء على الكيانات المهمة المرتبطة بالمستندات. يمكنك توسيع هذا الرسم البياني المعرفي وربطه بأنطولوجيات أخرى مثل MeSH و MedDRA.

علاوة على ذلك ، يوفر هذا أساسًا لزيادة تكامل مجموعات البيانات السريرية الأخرى وتوسيع الرسم البياني المعرفي هذا لبناء نسيج بيانات. يمكنك إجراء استعلامات حول البيانات السكانية التاريخية ، وتسلسل عمليات البحث المنظمة والقائمة على اللغة لاختيار الفوج لربط المرض بنتائج المريض.

تنظيف

لتنظيف مواردك ، أكمل الخطوات التالية:

لحذف الحزم التي تم إنشاؤها ، أدخل الأوامر التالية بالترتيب المعطى لإزالة جميع الموارد بشكل صحيح:

$ cdk destroy HEALTHLAKE-KNOWLEDGE-ANALYZER-UPDATE-CORE
$ cdk destroy HEALTHLAKE-KNOWLEDGE-ANALYZER-WEBAPP
$ cdk destroy HEALTHLAKE-KNOWLEDGE-ANALYZER-CORE

أثناء تنفيذ الأوامر السابقة ، احذف مصدر بيانات Amazon Kendra الذي تم إنشاؤه:

$ cdk destroy HEALTHLAKE-KNOWLEDGE-ANALYZER-VPC-AND-NEPTUNE
$ cdk destroy HEALTHLAKE-KNOWLEDGE-ANALYZER-IAMROLE
$ aws healthlake delete-fhir-datastore --datastore-id <<your_data_store_id>>

للتحقق من حذفه ، تحقق من الحالة عن طريق تشغيل الأمر التالي:

$ aws healthlake describe-fhir-datastore --datastore-id "<<your_data_store_id>>" --region us-east-1

تحقق من وحدة تحكم AWS CloudFormation للتأكد من أن جميع الحزم المرتبطة تبدأ بـ HEALTHLAKE-KNOWLEDGE-ANALYZER تم حذفها كلها بنجاح.

وفي الختام

توفر Amazon HealthLake خدمة مُدارة بناءً على معيار FHIR للسماح لك ببناء حلول صحية وسريرية. يمنحك توصيل ناتج Amazon HealthLake بـ Amazon Kendra و Neptune القدرة على إنشاء بحث معرفي ورسم بياني للمعرفة الصحية لتشغيل تطبيقك الذكي.

يمكن للبناء على رأس هذا النهج تمكين الباحثين وأطباء الخط الأمامي من البحث بسهولة عبر الملاحظات السريرية والمقالات البحثية عن طريق كتابة سؤالهم في متصفح الويب. يتم تمييز كل دليل سريري وفهرسته وتنظيمه باستخدام التعلم الآلي لتقديم موضوعات قائمة على الأدلة حول أشياء مثل الانتقال وعوامل الخطر والعلاجات والحضانة. تعتبر هذه الوظيفة الخاصة ذات قيمة هائلة للأطباء أو العلماء لأنها تسمح لهم بطرح سؤال بسرعة للتحقق من صحة دعمهم للقرار السريري أو بحثهم وتعزيزه.

جرب هذا بنفسك! انشر هذا الحل باستخدام Amazon HealthLake في حساب AWS الخاص بك عن طريق نشر المثال على GitHub جيثب:.

حول المؤلف

بريثفيراج جوثيكومار، دكتوراه ، عالم بيانات مع خدمات AWS الاحترافية ، حيث يساعد العملاء على بناء الحلول باستخدام التعلم الآلي. يستمتع بمشاهدة الأفلام والرياضة وقضاء الوقت في التأمل.

فاي نجوين هو مهندس حلول في AWS يساعد العملاء في رحلتهم السحابية مع التركيز بشكل خاص على بحيرة البيانات والتحليلات وتقنيات الدلالات والتعلم الآلي. في أوقات فراغه ، يمكنك أن تجده يركب الدراجة للذهاب إلى العمل ، أو يقوم بتدريب فريق كرة القدم الخاص بنجله ، أو يستمتع بالمشي مع أسرته

بارميندر بهاتيا هي شركة رائدة في مجال العلوم في AWS Health AI ، وتقوم حاليًا ببناء خوارزميات التعلم العميق للمجال السريري على نطاق واسع. خبرته في التعلم الآلي وتقنيات تحليل النص على نطاق واسع في إعدادات الموارد المنخفضة ، خاصة في الطب الحيوي وعلوم الحياة وتقنيات الرعاية الصحية. يستمتع بلعب كرة القدم والرياضات المائية والسفر مع أسرته.

غارين كيسلر هو مدير أول لعلوم البيانات في Amazon Web Services ، حيث يقود فرقًا من علماء البيانات ومهندسي التطبيقات لتقديم تطبيقات مخصصة للتعلم الآلي للعملاء. خارج AWS ، يلقي محاضرات حول التعلم الآلي ونماذج اللغة العصبية في جورج تاون. عندما لا يعمل ، فإنه يستمتع بالاستماع (وصنع) الموسيقى ذات الجودة المشكوك فيها مع الأصدقاء والعائلة.

د. طه قس حوت هو مدير التعلم الآلي والمسؤول الطبي الأول في Amazon Web Services ، ويقود إستراتيجية وجهود الذكاء الاصطناعي للصحة ، بما في ذلك Amazon Comprehend Medical و Amazon HealthLake. يعمل طه أيضًا مع فرق في أمازون مسؤولة عن تطوير العلوم والتكنولوجيا والنطاق لاختبارات COVID-19 المعملية. طبيب وخبير المعلومات الحيوية ، خدم طه فترتين في عهد الرئيس أوباما ، بما في ذلك أول مسؤول معلوماتية صحية في إدارة الغذاء والدواء. خلال هذا الوقت كموظف عام ، كان رائدًا في استخدام التقنيات الناشئة والسحابة (مراقبة الأمراض الإلكترونية من مركز السيطرة على الأمراض) ، وأنشأ منصات مشاركة بيانات عالمية يمكن الوصول إليها على نطاق واسع ، وهي openFDA ، والتي مكنت الباحثين والجمهور من البحث عن بيانات الأحداث السلبية وتحليلها ، والدقة FDA (جزء من مبادرة الطب الدقيق الرئاسي).

كوينسمارت. Beste Bitcoin-Börse في أوروبا
المصدر: https://aws.amazon.com/blogs/machine-learning/build-a-cognitive-search-and-a-health-knowledge-graph-using-amazon-healthlake-amazon-kendra-and-amazon- نبتون /

ذكاء البيانات التوليدية

أنشئ بحثًا معرفيًا ورسمًا بيانيًا للمعرفة الصحية باستخدام خدمات AWS AI

حل نظرة عامة

قم بإنشاء بيانات Amazon HealthLake وتصديرها

استخراج ملاحظات زيارة المريض والبيانات الوصفية

تحميل بيانات ملاحظات المريض إلى Amazon Kendra

قم بتحميل البيانات في نبتون

قم بإعداد الواجهة الخلفية والواجهة الأمامية لتشغيل تطبيق الويب

الخطوات التالية

تنظيف

وفي الختام

حول المؤلف

تقترب Ethereum وSolana وAltcoins من "منطقة الموز"، وفقًا لخبير الماكرو راؤول بال - وهذه هي توقعاته - The Daily Hodl

تواجه Bitcoin خطر خسارة 7.2 مليار دولار إذا وصل سعر BTC إلى هذا المستوى

أحدث المعلومات الاستخباراتية

من المقرر أن تبدأ صناديق الاستثمار المتداولة للعملات المشفرة الفورية التداول في هونج كونج الأسبوع المقبل: تقرير - The Daily Hodl

أزمة كاردانو أم العودة؟ المقياس الرئيسي لـ ADA يصل إلى مستوى منخفض، ماذا يعني هذا بالنسبة للمستثمرين

أفضل العملات الميمية المختارة للاحتفاظ طويل الأجل: Dogecoin (DOGE)، وShiba Inu (SHIB)، وFurrever Token (FURR)

العملات المشفرة تحصل على فرصة ثانية: يعود Stripe إلى القطاع بالعملات المستقرة

يستعرض Rabbit R1 مساعد الذكاء الاصطناعي "المتميز" لـ Herald بعد إطلاق الدبوس الإنساني الكارثي - فك التشفير

تواجه مؤسسة Grayscale Bitcoin Trust (GBTC) فورة التدفق الخارجي المستمرة

الدردشة معنا