شعار زيفيرنت

أنشئ حلًا للتحقق من التطعيم باستخدام ميزة الاستعلامات في Amazon Textract | خدمات الويب الأمازون

التاريخ:

أمازون تيكستراك هي خدمة للتعلم الآلي (ML) تتيح الاستخراج التلقائي للنص والكتابة اليدوية والبيانات من المستندات الممسوحة ضوئيًا، متجاوزة التعرف البصري على الأحرف (OCR). يمكنه تحديد البيانات وفهمها واستخراجها من الجداول والنماذج بدقة ملحوظة. في الوقت الحاضر، تعتمد العديد من الشركات على طرق الاستخراج اليدوية أو برامج التعرف الضوئي على الحروف الأساسية، وهي عملية مملة وتستغرق وقتًا طويلاً، وتتطلب تكوينًا يدويًا يحتاج إلى التحديث عندما يتغير النموذج. تساعد Amazon Textract على حل هذه التحديات من خلال استخدام التعلم الآلي لمعالجة أنواع المستندات المختلفة تلقائيًا واستخراج المعلومات بدقة بأقل قدر من التدخل اليدوي. يمكّنك ذلك من أتمتة معالجة المستندات واستخدام البيانات المستخرجة لأغراض مختلفة، مثل أتمتة معالجة القروض أو جمع المعلومات من الفواتير والإيصالات.

مع استئناف السفر بعد الوباء، قد يكون التحقق من حالة تطعيم المسافر مطلوبًا في كثير من الحالات. غالبًا ما تحتاج الفنادق ووكالات السفر إلى مراجعة بطاقات التطعيم لجمع تفاصيل مهمة مثل ما إذا كان المسافر قد تم تطعيمه بالكامل وتواريخ التطعيم واسم المسافر. تقوم بعض الوكالات بذلك من خلال التحقق اليدوي من البطاقات، الأمر الذي قد يستغرق وقتًا طويلاً للموظفين ويترك مجالًا للخطأ البشري. وقد قام آخرون ببناء حلول مخصصة، ولكنها قد تكون مكلفة وصعبة التوسع، وتستغرق وقتًا طويلاً للتنفيذ. للمضي قدمًا، قد تكون هناك فرص لتبسيط عملية التحقق من حالة التطعيم بطريقة فعالة للشركات مع احترام خصوصية المسافرين وراحتهم.

استعلامات نص الأمازون يساعد على معالجة هذه التحديات. تتيح لك Amazon Textract Queries تحديد واستخراج المعلومات التي تحتاجها فقط من المستند. فهو يوفر لك معلومات دقيقة ودقيقة من الوثيقة.

في هذا المنشور، نوجهك عبر دليل التنفيذ خطوة بخطوة لإنشاء حل للتحقق من حالة التطعيم باستخدام Amazon Textract Queries. يعرض الحل كيفية معالجة بطاقات التطعيم باستخدام استعلام Amazon Textract، والتحقق من حالة التطعيم، وتخزين المعلومات لاستخدامها في المستقبل.

حل نظرة عامة

يوضح الرسم البياني التالي بنية الحل.

يتضمن سير العمل الخطوات التالية:

  1. يقوم المستخدم بالتقاط صورة لبطاقة التطعيم.
  2. تم رفع الصورة إلى خدمة تخزين أمازون البسيطة دلو (أمازون S3).
  3. عندما يتم حفظ الصورة في حاوية S3، فإنها تستدعي ملف وظائف خطوة AWS سير العمل:
  4. الاستفسارات-مقرر AWS لامدا تقوم الوظيفة بفحص المستند الذي تم تمريره وإضافة معلومات حول نوع التمثيل الصامت وعدد الصفحات وعدد الاستعلامات إلى سير عمل Step Functions (على سبيل المثال، لدينا أربعة استعلامات).
  5. NumberQueriesAndPagesChoice هي حالة اختيار تضيف منطقًا شرطيًا إلى سير العمل. إذا كان هناك ما بين 15 إلى 31 استعلامًا وكان عدد الصفحات بين 2 إلى 3,001، فإن المعالجة غير المتزامنة في Amazon Textract هي الخيار الوحيد، لأن واجهات برمجة التطبيقات المتزامنة تدعم فقط ما يصل إلى 15 استعلامًا ومستندات من صفحة واحدة. بالنسبة لجميع الحالات الأخرى، نقوم بالتوجيه إلى الاختيار العشوائي للمعالجة المتزامنة أو غير المتزامنة.
  6. TextractSync ترسل وظيفة Lambda طلبًا إلى Amazon Textract لتحليل المستند بناءً على استعلامات Amazon Textract التالية:
    1. ما هي حالة التطعيم؟
    2. ما هو اسمك؟
    3. ما هو تاريخ الميلاد؟
    4. ما هو رقم الوثيقة؟
  7. يقوم Amazon Textract بتحليل الصورة وإرسال إجابات هذه الاستعلامات مرة أخرى إلى وظيفة Lambda.
  8. تتحقق وظيفة Lambda من حالة التطعيم الخاصة بالعميل وتخزن النتيجة النهائية بتنسيق CSV في نفس حاوية S3 (demoqueries-textractxxx) في csv-output المجلد.

المتطلبات الأساسية المسبقة

لإكمال هذا الحل ، يجب أن يكون لديك حساب AWS والأذونات المناسبة لإنشاء الموارد المطلوبة كجزء من الحل.

قم بتنزيل رمز النشر ونموذج بطاقة التطعيم من GitHub جيثب:.

استخدم ميزة الاستعلامات في وحدة تحكم Amazon Texttract

قبل إنشاء حل التحقق من التطعيم، دعنا نستكشف كيف يمكنك استخدام استعلامات Amazon Textract لاستخراج حالة التطعيم عبر وحدة تحكم Amazon Textract. يمكنك استخدام عينة بطاقة التطعيم التي قمت بتنزيلها من GitHub repo.

  1. في وحدة تحكم Amazon Texttract، اختر تحليل الوثيقة في جزء التنقل.
  2. تحت تحميل الوثيقة، اختر اختر الوثيقة لتحميل بطاقة التطعيم من محرك الأقراص المحلي الخاص بك.
  3. بعد تحميل المستند، حدد الاستعلامات في ال تكوين المستند والقسم الخاص به.
  4. يمكنك بعد ذلك إضافة استعلامات في شكل أسئلة باللغة الطبيعية. دعنا نضيف ما يلي:
    • ما هي حالة التطعيم؟
    • ما هو اسمك؟
    • ما هو تاريخ الميلاد؟
    • ما هو رقم الوثيقة؟
  5. بعد إضافة جميع استفساراتك، اختر تطبيق التكوين.
  6. التحقق من الاستعلامات علامة التبويب لرؤية الإجابات على الأسئلة.

يمكنك أن ترى أن Amazon Texttract يستخرج الإجابة على استعلامك من المستند.

نشر حل التحقق من التطعيم

في هذه التدوينة نستخدم سحابة AWS 9 مثيل وتثبيت التبعيات اللازمة على المثيل مع مجموعة تطوير سحابة AWS (AWS CDK) ودوكر. AWS Cloud9 عبارة عن بيئة تطوير متكاملة قائمة على السحابة (IDE) تتيح لك كتابة التعليمات البرمجية وتشغيلها وتصحيح أخطاءها باستخدام متصفح فقط.

  1. في المحطة، اختر تحميل الملفات المحلية على قم بتقديم القائمة.
  2. اختار حدد المجلد واختيار vaccination_verification_solution المجلد الذي قمت بتنزيله من GitHub.
  3. في الوحدة الطرفية، قم بإعداد تطبيقك بدون خادم للخطوات اللاحقة في سير عمل التطوير الخاص بك نموذج تطبيق AWS Serverless (AWS SAM) باستخدام الأمر التالي:
    $ cd vaccination_verification_solution/
    $ pip install -r requirements.txt
    

  4. نشر التطبيق باستخدام cdk deploy أمر:
    cdk deploy DemoQueries --outputs-file demo_queries.json --require-approval never

    انتظر حتى يقوم AWS CDK بنشر النموذج وإنشاء الموارد المذكورة في القالب.

  5. عند اكتمال النشر، يمكنك التحقق من الموارد المنشورة على تكوين سحابة AWS وحدة التحكم على الموارد علامة تبويب صفحة تفاصيل المكدس.

اختبر المحلول

والآن حان الوقت لاختبار الحل. لتحريك سير العمل، استخدم aws s3 cp لتحميل ملف vac_card.jpg ملف ل DemoQueries.DocumentUploadLocation داخل مجلد المستندات:

aws s3 cp docs/vac_card.JPG $(aws cloudformation list-exports --query 'Exports[?Name==`DemoQueries-DocumentUploadLocation`].Value' --output text)


يتم تحميل ملف شهادة التطعيم تلقائيًا إلى حاوية S3 demoqueries-textractxxx في مجلد التحميلات.

يتم تشغيل سير عمل Step Functions عبر وظيفة Lambda بمجرد تحميل ملف شهادة التطعيم إلى حاوية S3.

تقوم وظيفة Queries-Decider Lambda بفحص المستند وإضافة معلومات حول نوع mime وعدد الصفحات وعدد الاستعلامات إلى سير عمل Step Functions (على سبيل المثال، نستخدم أربعة استعلامات — رقم المستند واسم العميل وتاريخ حالة الميلاد والتطعيم).

TextractSync ترسل الوظيفة استعلامات الإدخال إلى Amazon Textract وتقوم بإرجاع النتيجة الكاملة بشكل متزامن كجزء من الاستجابة. وهو يدعم المستندات المكونة من صفحة واحدة (TIFF وPDF وJPG وPNG) وما يصل إلى 1 استعلامًا. ال GenerateCsvTask تأخذ الوظيفة مخرجات JSON من Amazon Textract وتحولها إلى ملف CSV.

يتم تخزين الإخراج النهائي في نفس حاوية S3 في مجلد إخراج csv كملف CSV.

يمكنك تنزيل الملف على جهازك المحلي باستخدام الأمر التالي:

aws s3 cp <paste the S3 URL from TextractOutputCSVPath>

تنسيق النتيجة هو timestamp, classification, filename, page number, key name, key_confidence, value, value_confidence, key_bb_top, key_bb_height, key_bb.width, key_bb_left, value_bb_top, value_bb_height, value_bb_width, value_bb_left.

يمكنك توسيع نطاق الحل ليشمل مئات من مستندات شهادات التطعيم لعدة عملاء عن طريق تحميل شهادات التطعيم الخاصة بهم إلى DemoQueries.DocumentUploadLocation. يؤدي هذا تلقائيًا إلى تشغيل عدة عمليات تشغيل لجهاز حالة Step Functions، ويتم تخزين النتيجة النهائية في نفس حاوية S3 في مجلد إخراج csv.

لتغيير المجموعة الأولية من الاستعلامات التي يتم تغذيتها في Amazon Textract، يمكنك الانتقال إلى مثيل AWS Cloud9 الخاص بك وفتح ملف start_execution.py. في عرض الملف في الجزء الأيمن، انتقل إلى lambda، start_queries, app, start_execution.py. يتم استدعاء وظيفة Lambda هذه عند تحميل ملف إلى DemoQueries.DocumentUploadLocation. يتم تعريف الاستعلامات المرسلة إلى سير العمل في start_execution.py; يمكنك تغييرها عن طريق تحديث الكود كما هو موضح في لقطة الشاشة التالية.

تنظيف

لتجنب تكبد رسوم مستمرة، احذف الموارد التي تم إنشاؤها في هذا المنشور باستخدام الأمر التالي:

cdk destroy DemoQueries

اجب على السؤال Are you sure you want to delete: DemoQueries (y/n)? مع ذ.

وفي الختام

في هذا المنشور، أوضحنا لك كيفية استخدام Amazon Textract Queries لإنشاء حل للتحقق من التطعيم في مجال السفر. يمكنك استخدام Amazon Textract Queries لبناء حلول في صناعات أخرى مثل التمويل والرعاية الصحية، واسترداد المعلومات من مستندات مثل قسائم الدفع ومذكرات الرهن العقاري وبطاقات التأمين بناءً على أسئلة اللغة الطبيعية.

لمزيد من المعلومات، راجع تحليل الوثائقأو قم بالاطلاع على وحدة تحكم Amazon Texttract وجرب هذه الميزة.


حول المؤلف

ديراج ثكور هو مهندس حلول مع Amazon Web Services. إنه يعمل مع عملاء وشركاء AWS لتقديم إرشادات حول اعتماد سحابة المؤسسة وترحيلها واستراتيجيتها. إنه متحمس للتكنولوجيا ويستمتع بالبناء والتجريب في مجال التحليلات و AI / ML.

ريشابه ياداف هو مهندس حلول الشركاء في AWS ويتمتع بخلفية واسعة في DevOps وعروض الأمان في AWS. وهو يعمل مع شركاء ASEAN لتقديم التوجيه بشأن اعتماد السحابة المؤسسية ومراجعات البنية جنبًا إلى جنب مع بناء ممارسات AWS من خلال تنفيذ إطار العمل المصمم جيدًا. خارج العمل، يحب قضاء وقته في المجال الرياضي وألعاب FPS.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة