Zephyrnet Logosu

Amazon Textract'taki Sorgular özelliğini kullanarak bir aşı doğrulama çözümü oluşturun | Amazon Web Hizmetleri

Tarih:

Amazon Metin Yazısı taranan belgelerden metin, el yazısı ve verilerin otomatik olarak çıkarılmasını sağlayan ve geleneksel optik karakter tanımayı (OCR) geride bırakan bir makine öğrenimi (ML) hizmetidir. Tablolardan ve formlardan verileri olağanüstü bir doğrulukla tanımlayabilir, anlayabilir ve çıkarabilir. Şu anda birçok şirket, sıkıcı ve zaman alıcı olan ve form değiştiğinde güncellenmesi gereken manuel yapılandırma gerektiren manuel çıkarma yöntemlerine veya temel OCR yazılımına güveniyor. Amazon Textract, farklı belge türlerini otomatik olarak işlemek ve minimum manuel müdahaleyle bilgileri doğru bir şekilde çıkarmak için ML'yi kullanarak bu zorlukların çözülmesine yardımcı olur. Bu, belge işlemeyi otomatikleştirmenize ve çıkarılan verileri, kredi işlemeyi otomatikleştirmek veya faturalardan ve makbuzlardan bilgi toplamak gibi farklı amaçlarla kullanmanıza olanak tanır.

Pandemi sonrası seyahat devam ederken, çoğu durumda yolcunun aşı durumunun doğrulanması gerekebilir. Oteller ve seyahat acentelerinin, seyahat eden kişinin aşılarının tam olup olmadığı, aşı tarihleri ​​ve seyahat eden kişinin adı gibi önemli ayrıntıları toplamak için sıklıkla aşı kartlarını incelemesi gerekir. Bazı kurumlar bunu kartların manuel olarak doğrulanması yoluyla yapıyor; bu da personel için zaman alıcı olabiliyor ve insan hatasına yer bırakıyor. Diğerleri özel çözümler geliştirmiştir, ancak bunların ölçeklendirilmesi maliyetli ve zor olabilir ve uygulanması önemli ölçüde zaman alabilir. İleriye dönük olarak, aşı durumu doğrulama sürecini, gezginlerin mahremiyetine ve rahatlığına saygı göstererek işletmeler için verimli olacak şekilde kolaylaştırma fırsatları ortaya çıkabilir.

Amazon Metin Sorguları bu zorlukların üstesinden gelmeye yardımcı olur. Amazon Textract Sorguları, belgeden yalnızca ihtiyacınız olan bilgi parçasını belirtmenize ve çıkarmanıza olanak tanır. Belgeden size kesin ve doğru bilgi verir.

Bu yazıda, Amazon Textract Sorgularını kullanarak bir aşı durumu doğrulama çözümü oluşturmaya yönelik adım adım uygulama kılavuzunu size anlatacağız. Çözüm, Amazon Textract sorgusu kullanılarak aşı kartlarının nasıl işleneceğini, aşı durumunun nasıl doğrulanacağını ve bilgilerin gelecekte kullanılmak üzere nasıl saklanacağını gösteriyor.

Çözüme genel bakış

Aşağıdaki şemada çözüm mimarisi gösterilmektedir.

İş akışı aşağıdaki adımları içerir:

  1. Kullanıcı aşı kartının fotoğrafını çeker.
  2. Resim bir siteye yüklendi Amazon Basit Depolama Hizmeti (Amazon S3) kovası.
  3. Görüntü S3 klasörüne kaydedildiğinde, bir çağrı AWS Basamak İşlevleri iş akışı:
  4. Sorgular-Karar Veren AWS Lambda işlevi iletilen belgeyi inceler ve mime türü, sayfa sayısı ve Step Functions iş akışına sorgu sayısı hakkında bilgi ekler (örneğin, dört sorgumuz var).
  5. NumberQueriesAndPagesChoice iş akışına koşullu mantık ekleyen bir Seçim durumudur. 15-31 arasında sorgu varsa ve sayfa sayısı 2-3,001 arasındaysa Amazon Textract eşzamansız işleme tek seçenektir çünkü eşzamanlı API'ler yalnızca 15'e kadar sorguyu ve tek sayfalık belgeleri destekler. Diğer tüm durumlarda, eşzamanlı veya eşzamansız işlemenin rastgele seçimine yönlendiriliriz.
  6. The TextractSync Lambda işlevi, belgeyi aşağıdaki Amazon Textract sorgularına göre analiz etmesi için Amazon Textract'a bir istek gönderir:
    1. Aşı Durumu Nedir?
    2. Adı ne?
    3. Doğum Tarihi Nedir?
    4. Belge Numarası Nedir?
  7. Amazon Textract görüntüyü analiz eder ve bu sorguların yanıtlarını Lambda işlevine geri gönderir.
  8. Lambda işlevi müşterinin aşı durumunu doğrular ve nihai sonucu CSV formatında aynı S3 klasöründe saklar (demoqueries-textractxxxOlarak) csv-output klasör.

Önkoşullar

Bu çözümü tamamlamak için bir AWS hesabınız ve çözümün parçası olarak gerekli kaynakları oluşturmak için uygun izinleriniz olmalıdır.

Dağıtım kodunu ve örnek aşı kartını şu adresten indirin: GitHub.

Amazon Textract konsolundaki Sorgular özelliğini kullanın

Aşı doğrulama çözümünü oluşturmadan önce, Amazon Textract konsolu aracılığıyla aşılama durumunu çıkarmak için Amazon Textract Sorgularını nasıl kullanabileceğinizi keşfedelim. GitHub deposundan indirdiğiniz aşı kartı örneğini kullanabilirsiniz.

  1. Amazon Textract konsolunda şunu seçin: Belgeyi Analiz Et Gezinti bölmesinde.
  2. Altında Belge yükle, seçmek Belge seç aşı kartını yerel sürücünüzden yüklemek için.
  3. Belgeyi yükledikten sonra Sorguları içinde Belgeyi Yapılandır Bölüm.
  4. Daha sonra doğal dil soruları biçiminde sorgular ekleyebilirsiniz. Şunu ekleyelim:
    • Aşı Durumu Nedir?
    • Adı ne?
    • Doğum Tarihi Nedir?
    • Belge Numarası Nedir?
  5. Tüm sorgularınızı ekledikten sonra Yapılandırmayı uygula.
  6. Sorguları Kontrol Edin Soruların yanıtlarını görmek için sekmeyi tıklayın.

Amazon Textract'in sorgunuzun yanıtını belgeden çıkardığını görebilirsiniz.

Aşı doğrulama çözümünü dağıtın

Bu gönderide, bir AWS Bulut9 örneğini kullanın ve örneğe gerekli bağımlılıkları yükleyin. AWS Bulut Geliştirme Kiti (AWS CDK) ve Docker. AWS Cloud9, kodunuzu yalnızca bir tarayıcıyla yazmanıza, çalıştırmanıza ve hata ayıklamanıza olanak tanıyan bulut tabanlı bir entegre geliştirme ortamıdır (IDE).

  1. Terminalde şunu seçin: Yerel Dosyaları Yükle üzerinde fileto menüsü.
  2. Klinik Klasör Seç ve seçiniz vaccination_verification_solution GitHub'dan indirdiğiniz klasör.
  3. Terminalde, sunucusuz uygulamanızı geliştirme iş akışınızdaki sonraki adımlar için hazırlayın. AWS Sunucusuz Uygulama Modeli (AWS SAM) aşağıdaki komutu kullanarak:
    $ cd vaccination_verification_solution/
    $ pip install -r requirements.txt
    

  4. Uygulamayı kullanarak dağıtın cdk deploy komut:
    cdk deploy DemoQueries --outputs-file demo_queries.json --require-approval never

    AWS CDK'nın modeli dağıtmasını ve şablonda belirtilen kaynakları oluşturmasını bekleyin.

  5. Dağıtım tamamlandığında, dağıtılan kaynakları kontrol edebilirsiniz. AWS CloudFormation konsol üzerinde Kaynaklar yığın ayrıntıları sayfasının sekmesi.

Çözümü test edin

Şimdi çözümü test etme zamanı. İş akışını tetiklemek için şunu kullanın: aws s3 cp yüklemek için vac_card.jpg dosyasını DemoQueries.DocumentUploadLocation dokümanlar klasörünün içinde:

aws s3 cp docs/vac_card.JPG $(aws cloudformation list-exports --query 'Exports[?Name==`DemoQueries-DocumentUploadLocation`].Value' --output text)


Aşı sertifikası dosyası otomatik olarak S3 klasörüne yüklenir demoqueries-textractxxx yüklemeler klasöründe.

Aşı sertifikası dosyası S3 klasörüne yüklenir yüklenmez Step Functions iş akışı bir Lambda işlevi aracılığıyla tetiklenir.

Sorgular-Karar Verici Lambda işlevi belgeyi inceler ve mime türü, sayfa sayısı ve Step Functions iş akışına sorgu sayısı hakkında bilgi ekler (bu örnek için dört sorgu kullanıyoruz: belge numarası, müşteri adı, tarih) doğum ve aşı durumu).

The TextractSync işlevi, giriş sorgularını Amazon Textract'a gönderir ve yanıtın bir parçası olarak tam sonucu eşzamanlı olarak döndürür. 1 sayfalık belgeleri (TIFF, PDF, JPG, PNG) ve 15'e kadar sorguyu destekler. GenerateCsvTask işlevi, JSON çıktısını Amazon Textract'tan alır ve onu bir CSV dosyasına dönüştürür.

Nihai çıktı, CSV dosyası olarak csv-output klasöründeki aynı S3 klasöründe saklanır.

Aşağıdaki komutu kullanarak dosyayı yerel makinenize indirebilirsiniz:

aws s3 cp <paste the S3 URL from TextractOutputCSVPath>

Sonucun formatı şu şekildedir: timestamp, classification, filename, page number, key name, key_confidence, value, value_confidence, key_bb_top, key_bb_height, key_bb.width, key_bb_left, value_bb_top, value_bb_height, value_bb_width, value_bb_left.

Çözümü, birden fazla müşterinin aşı sertifikalarını şuraya yükleyerek yüzlerce aşı sertifikası belgesine ölçeklendirebilirsiniz: DemoQueries.DocumentUploadLocation. Bu, Step Functions durum makinesinin birden fazla çalışmasını otomatik olarak tetikler ve nihai sonuç, csv-output klasöründeki aynı S3 klasöründe saklanır.

Amazon Textract'a beslenen ilk sorgu kümesini değiştirmek için AWS Cloud9 bulut sunucunuza gidip start_execution.py dosyasını açabilirsiniz. Sol bölmedeki dosya görünümünde lambda'ya gidin, start_queries, app, start_execution.py. Bu Lambda işlevi, bir dosya yüklendiğinde çağrılır. DemoQueries.DocumentUploadLocation. İş akışına gönderilen sorgular şurada tanımlanır: start_execution.py; aşağıdaki ekran görüntüsünde gösterildiği gibi kodu güncelleyerek bunları değiştirebilirsiniz.

Temizlemek

Devam eden masraflardan kaçınmak için aşağıdaki komutu kullanarak bu gönderide oluşturulan kaynakları silin:

cdk destroy DemoQueries

Soruyu cevapla Are you sure you want to delete: DemoQueries (y/n)? y ile.

Sonuç

Bu yazıda, seyahat sektörüne yönelik bir aşı doğrulama çözümü oluşturmak için Amazon Textract Sorgularını nasıl kullanacağınızı gösterdik. Finans ve sağlık hizmetleri gibi diğer sektörlerde çözümler oluşturmak ve doğal dil sorularına dayalı olarak maaş makbuzları, ipotek senetleri ve sigorta kartları gibi belgelerden bilgi almak için Amazon Textract Sorgularını kullanabilirsiniz.

Daha fazla bilgi için bkz: Belgeleri Analiz Etmeveya Amazon Textract konsoluna göz atın ve bu özelliği deneyin.


Yazarlar Hakkında

Dhiraj Thakur Amazon Web Services ile bir Çözüm Mimarıdır. Kurumsal bulut benimseme, geçiş ve strateji konusunda rehberlik sağlamak için AWS müşterileri ve ortaklarıyla birlikte çalışır. Teknolojiye tutkuyla bağlı ve analitik ve yapay zeka / makine öğrenimi alanında oluşturmayı ve deney yapmayı seviyor.

Rişabh Yadav AWS'de DevOps ve Güvenlik teklifleri konusunda geniş bir deneyime sahip bir İş Ortağı Çözümleri mimarıdır. Well-Architected Framework'ün uygulanması yoluyla AWS uygulamaları oluşturmanın yanı sıra kurumsal bulutun benimsenmesi ve mimari incelemeleri konusunda rehberlik sağlamak için ASEAN iş ortaklarıyla birlikte çalışıyor. İş dışında zamanını spor sahalarında ve FPS oyunlarında geçirmeyi seviyor.

spot_img

En Son İstihbarat

spot_img