Zephyrnet Logosu

Nanonets ve ChatGPT ile Fatura İşleme Doğruluğunu İyileştirin

Tarih:

Ortalama bir insan haftada en az 10 fatura gönderir/alır desem abartmış olmayız. Büyüyen dijitalleşmeyle birlikte, işletmeler her gün çok büyük hacimli faturalarla uğraşıyor. Geleneksel olarak, fatura işleme, önemli kaynaklar gerektiren ve hatalara açık, manuel ve zaman alıcı bir süreç olmuştur.

Yapay Zeka ve Doğal Dil İşleme'nin gelişiyle, fatura işleme artık otomatikleştirilebilir ve kolaylaştırılabilir, bu da verimliliği ve doğruluğu artırır. GPT, "Üretken Önceden Eğitimli Transformatör" anlamına gelir ve tarafından geliştirilen güçlü bir dil işleme modelleri ailesini ifade eder. OpenAI. GPT modelleri, büyük miktarda metin verisi üzerinde önceden eğitilmiştir ve ardından fatura işleme dahil olmak üzere belirli görevler için ince ayar yapılabilir.

Bir kitapçının siparişleri için fatura işleme durumunu ele alalım, aşağıdaki resimde örnek bir fatura gösterilmektedir. Bu faturada Sevkiyat, Fatura, ürünler ve fiyatlar hakkında bilgiler bulunur. Binlerce faturadan manuel olarak veri toplamanız gerektiğini hayal edin! Neyse ki, süreci hızlandıran AI araçlarımız var.

Bu blogda, faturanızı GPT-4 ve Nanonets kullanarak işleme koymanız için size adım adım yol göstereceğim. Bir fincan kahve alın ve hazırlanın!

1. Adım: Bir Nanonets Hesabı Oluşturun ve Resmi Yükleyin

İlk adım, metin verilerini faturamızın görüntüsünden çıkarmaktır. OCR (Optik Karakter Tanıma) teknikleri, görüntüleri veya taranan belgeleri tanımlamak ve karakterleri metne dönüştürmek için model tanıma algoritmalarını kullanır. Bulut tabanlı yapay zeka (AI) platformu Nanonets, Fatura OCR'si de dahil olmak üzere belirli görevler için seçilmiş OCR araçları sunar. sadece kayıt olabilirsiniz okuyun ve Fatura OCR araçlarına ücretsiz olarak erişin.

Oturum açıp Fatura OCR'ye tıkladığınızda, "Dosyaları yükle" seçeneğini bulabilirsiniz. Nanonets çok kullanıcı dostudur ve 6'dan fazla uygulamadan dosya yüklemenize izin verir.

Agatha Kitapçı'dan aldığım örnek faturayı buraya yükledim. Çıkarma birkaç dakika içinde tamamlanır ve hurdaya çıkarılan sonuçları gösterildiği gibi alırsınız. Burada, varlıkları ve değerlerini çıkarmak için önceden eğitilmiş bir derin öğrenme modeli kullanılır.

Nanonet'ler tarafından tanımlanan tüm metin alanları ayrı kutularla sınırlandırılmıştır. Bu alanlar için çıkarılan değerler sağdaki 'NİHAİ SONUÇLAR' sekmesinde görülebilir. Nanonets tarafından yapılan bu varlık çıkarma, GPT-4 kullanılarak geliştirilebilir. Nanonets ayrıca, müşteriler için özelleştirme ve kullanıcı deneyimini geliştiren alan adlarını ekleme veya değiştirme seçenekleri sunar.


Manuel AP İşlemlerinizi otomatikleştirmek mi istiyorsunuz? Nanonet'lerin ekibinizin uçtan uca uygulamalarına nasıl yardımcı olabileceğini görmek için 30 dakikalık bir canlı demo rezervasyonu yapın AP otomasyonu.

2. Adım: OCR metin Verilerini İndirin

Ayıklanan OCR metin verileri birden çok biçimde indirilebilir. Fatura verilerinin bir Excel veya CSV dosyasına indirilmesiyle ilgili gösterimi görmek için aşağıdaki GIF'e bakın. CSV dosyasında, tüm varlık/veri alanı adları sütunlar halinde saklanır ve değerleri karşılık gelen satırlardadır.

Verileri indirilen CSV'den kopyalayıp yapıştırıyoruz ve OCR tarafından oluşturulan metni elde ediyoruz. İşte Nanonets'teki örnek faturamızdan indirdiğim metin.

OCR tarafından oluşturulan metin, sonraki adımlarla Chat GPT3 kullanılarak geliştirilebilir.

Nanonets işlenmiş metnin üstünde GPT4 modelleri kullanırsak, varlık ayıklama farklı sorguları desteklemek için yükseltilebilir. Open AI hesabı için şu adresten kaydolabilirsiniz: okuyun ve Büyük dil modellerine erişim elde edin. Hesabınızı kurduktan sonra benzersiz bir API anahtarı alacaksınız. OpenAI sunucularına yapılan isteklerin kimliğini doğrulamak ve yetkilendirmek için güvenlik önlemleri içindir. OpenAI paketini içe aktarın ve API anahtarı değerini ayarlayın.

Açık ve yapılandırılmış bir istem tasarlamak, büyük dil modellerinin gücünü açığa çıkarmanın sırrıdır. Veri alanı veya varlıkları ve bunların değerlerini çıkarmak için aşağıdaki istemi kullanabiliriz.

#isteminizi tanımlayın

prompt_text= Bu, kitapçı siparişleri için OCR tarafından oluşturulan fatura metnidir” +ocr_generated_text” + “Varlıkları ve değerlerini, sağlanan OCR metninden bir anahtar/değer çifti olarak çıkarın ve anahtar: değer biçiminde çıktı alın”

Bir isteminiz olduğunda, onu önceden eğitilmiş herhangi bir OpenAI modeline iletebilir ve " openai.Completion.create()” işlevi. En iyi çıktıyı elde etmek için seçebileceğiniz birkaç parametre vardır.

GPT'nin parametreleri:

  • motor: Bu parametre, metni oluşturmak için kullanmak üzere önceden eğitilmiş belirli bir büyük dil modeli (LLM) seçmenize olanak tanır. Önceden eğitilmiş bir modele veya özel olarak ince ayarlanmış bir modele ayarlanabilir. Text Davinci, güçlü ve verimli bir seçimdir.
  • istemi:  Metni oluşturmaya başlamak için modele verilecek ilk metin istemidir. Bizim durumumuzda, daha önce tanımladığımız “prompt_text” değişkeni.
  • Maksimum_tokenler:  Modelin belirli bir bilgi istemi için üretebileceği maksimum belirteç sayısını belirtir. Oluşturulan metnin uzunluğunu bununla kontrol edebilirsiniz.
  • Sıcaklık: Oluşturulan metindeki rastgelelik veya yaratıcılık derecesini kontrol etmek için kullanın. Düşük sıcaklık değeri daha ölçülü ve öngörülebilir bir çıktı üretirken, yüksek sıcaklık değeri daha yaratıcı ve çeşitli çıktılara yol açar. Sıcaklık değeri 0 ile 1 arasında değişir ve 1 en yaratıcı değerdir.

Artık GPT parametrelerine aşina olduğunuza göre, komut istemini diğer parametrelerle birlikte ileterek çıktı oluşturmak için kodu yazalım.

Çıktıyı şu şekilde aldık:

Varlıklar ve değerleri sadece birkaç adımda hızlı bir şekilde çıkarıldı!

4. Adım: Veri Düzeltmelerini İyileştirme

Herhangi bir işletmede dolaşan binlerce fatura arasında müşteri verilerinde tutarsızlıklar ve küçük hatalar olması kaçınılmazdır. Örneğin, bazı müşteriler geçersiz bir e-posta biçimi veya iletişim numaraları vermiş olabilir veya tarih farklı biçimlerde olabilir. Nanonets ve GPT-4 ile bu sorunları kolayca tespit edebilir ve veri düzeltmeleri yapabilirsiniz. Doğruluğu ve formatı doğrulamak ve ayrıca tutarsızlıkları kontrol etmek için kural tabanlı doğrulamalar uygulayabiliriz.

GPT'ye tarihin doğrulanmasını ve bizim için e-posta göndermesini istiyorum.

prompt_text= "Yukarıda çıkarılan varlık verilerinde, tarih biçiminin (GG/AA/YYYY) ve e-postanın doğru olup olmadığını doğrulayın?"

LLM, aşağıdaki resimde gösterildiği gibi formatı kontrol etmek için düzenli ifadeler kullanan bir Python kodu sağlar. Düzenli bir ifadede, belirli bir kalıbı arar ve onunla eşleştiririz. Ayıklanan varlıklar bir sözlükte saklanır ve faturanın e-postasını ve tarihlerini doğrulamak için işlevler ayrı ayrı tanımlanır.

Tanımladıktan sonra, sonucu almak için ('Fatura tarihi'), satıcı veya alıcı e-posta kimliği gibi herhangi bir tarih bu işlevlere iletilebilir.

GPT ayrıca verilerde hızlı ve rahat bir şekilde düzeltmeler ve değişiklikler yapmanıza yardımcı olur. Faturamızdaki tarihin '02/05/2023' olduğunu unutmayın. Tarihi “AA/GG/YY” formatına dönüştürmek için aşağıdaki istemi veriyorum.

Prompt=" ayıklanan varlıklardaki verilerin biçimini 'AA/GG/YY' olarak değiştirin. Yılın yalnızca son 2 hanesini saklayın”

Çıktıda veriler istenildiği gibi düzeltilmiştir. Kişi numarasının 10 haneli olup olmadığını, adresin istenilen formatta olup olmadığını kontrol etmek ve ayrıca eksik veri değerlerini kontrol etmek için benzer istemler verebiliriz.


Temassız AP iş akışlarını ayarlayın ve Borç Hesapları sürecini kolaylaştırmak saniyeler içinde. Şimdi 30 dakikalık bir canlı demo rezervasyonu yapın.

5. Adım: Veri Sorunlarını Kontrol Edin

Verilerdeki tutarsızlıklar GPT-4 ile kolaylıkla tespit edilebilir. Örneğimizde, vadesi gelen toplam tutarın tek tek ürün fiyatlarının toplamıyla uyuşup uyuşmadığını kontrol edebilirsiniz. Bunun için bir bilgi istemi sağlayalım.

prompt=”Faturadaki toplam bakiyenin faturadaki miktar ve kalem fiyatlarıyla tutarlı olup olmadığını kontrol edin”

GPT-4, Python'da, miktarı ve tek tek ürün fiyatını çarparak tüm siparişlerin fiyatlarının toplamını hesaplayan bir işlev çıkarır. Toplam bakiyenin faturada yazan tutarla tutarsız olması durumunda ilgili fatura işaretlenir ve incelenir. Bu, işletmelerin hatalardan, tutarsızlıklardan kaçınmasına ve finansal verilerini doğrulamasına yardımcı olabilir.

Büyük bir fatura veri kümeniz varsa, birden çok faturada tutarlılık olup olmadığını da kontrol edebilirsiniz. Örneğin, tutarsızlıkları veya anormallikleri belirlemek için satıcı ve alıcı bilgilerini birden çok faturada karşılaştırabilirsiniz.

6. Adım: GPT ile Sorgulama

Varlıkları çıkardıktan sonra GPT, tüm bilgilerden belirli sorgulara yanıt almak için kullanılabilir. Örneğin, belirli bir fatura no'nun nakliye detayları hakkında bilgi edinmek isterseniz ne olur?

Bunun için bir komut istemi yapalım:

#isteminizi tanımlayın

prompt_text= "Gönderim ile ilgili ayrıntıları Varlık anahtar/değer çiftlerinden çıkarın"

Bu bilgi istemi için oluşturulan tamamlama şuydu:

>> Elbette! Sağlanan OCR verilerine dayanarak, nakliye bilgilerini ve fatura bilgilerini aşağıdaki gibi iki grup halinde çıkarabiliriz:

Nakliye Bilgisi:

“fatura_numarası”: “3522”

ship_to_name: Gayathri Natarajan

ship_to_address: 600053 No.22B , Chetpet , Chennai , Tamil Nadu , Hindistan: Tanaya Pakahale

Satıcı bilgilerini almak için de benzer bir sorgulama yapılabilir. Sağlanan verilerden satıcılar hakkında çıkarılan bilgiler:

  • satıcı_adı: AGATHA KİTAP EVİ
  • seller_address: No.13 , 2nd avenue , Indiranagar, Bangalore , Karnataka , Hindistan , 721302
  • satıcı_telefon: 6783456723

Birden çok belgeyle çalışırken, toplu siparişleri analiz etmek için toplam bakiyesi 5000 Rs'den fazla olan faturaları da arayabilir ve filtreleyebiliriz. GPT, geçmiş istemleri bellekte tutma yeteneğine sahip olduğundan, en iyi kullanım kolaylığını sağlar.


Manuel AP İşlemlerinizi otomatikleştirmek mi istiyorsunuz? Nanonet'lerin ekibinizin uçtan uca uygulamalarına nasıl yardımcı olabileceğini görmek için 30 dakikalık bir canlı demo rezervasyonu yapın AP otomasyonu.

Fatura İşleme için Neden Nanonets + Chat GPT'yi Seçmelisiniz?

  • GPT, faturalardaki metni analiz edebilir ve farklı biçimlerde yazılmış olsalar veya yazım veya ifade farklılıkları olsa bile ilgili varlıkları doğru bir şekilde tanımlayabilir ve ayıklayabilir. Bu, hataları azaltmaya ve doğruluğu artırmaya yardımcı olabilir
  • Otomatikleştirmek ve işletmeler için veri hattını ölçeklendirin
  • Büyük hacimli faturaları işlemek için en verimli yöntem. Veri girişi ve işleme için gereken süreyi önemli ölçüde azaltır.
  • Araçlar esneklik ve uyarlanabilirlik sunar. Bu araçlar olabilir kolayca entegre mevcut sistemlere entegre edilebilir ve belirli iş ihtiyaçlarına uyacak şekilde özelleştirilebilir
  • Nanonets'in fatura OCR çözümünün avantajlarından biri, hatalarından ders al. Sistem, doğruluğunu zaman içinde iyileştirmek ve işlenen her yeni faturada daha kesin hale getirmek için makine öğrenimini kullanır. Platform aynı zamanda kullanıcıların herhangi bir hatayı manuel olarak gözden geçirmesine ve düzeltmesine izin vererek, çıkarılan verilerin doğru ve güvenilir olmasını sağlar.

Pek çok avantajı olsa da, bu yöntemin sınırlamalarını da anlamamız gerekiyor. Görüntü/PDF kalitesinin düşük olduğu durumlarda doğruluk zayıftır. Yapay zeka tabanlı araçlar, eğitim verilerinin doğasında bulunan önyargılara veya hatalara da tabidir.

Genel olarak, fatura işlemede varlık ayıklama için GPT'den yararlanmak, işletmelerin operasyonlarını kolaylaştırmasına, manuel işi azaltmasına ve doğruluğu artırmasına yardımcı olarak daha iyi finansal yönetim ve karar almaya yol açabilir.


Temassız AP iş akışlarını ayarlayın ve Borç Hesapları sürecini kolaylaştırmak saniyeler içinde. Şimdi 30 dakikalık bir canlı demo rezervasyonu yapın.

spot_img

En Son İstihbarat

spot_img