Zephyrnet-logotyp

Förbättra fakturahanteringsnoggrannheten med Nanonets och ChatGPT

Datum:

Jag skulle inte överdriva om jag sa att en genomsnittlig person skickar/tar emot minst 10 fakturor per vecka. Med den växande digitaliseringen hanterar företag enorma mängder fakturor varje dag. Traditionellt har fakturahantering varit en manuell och tidskrävande process, som kräver betydande resurser och är benägen att göra fel.

Med tillkomsten av AI och Natural Language Processing kan fakturahantering nu automatiseras och strömlinjeformas, vilket leder till förbättrad effektivitet och precision. GPT står för "Generative Pre-trained Transformer" och syftar på en familj av kraftfulla språkbehandlingsmodeller utvecklade av OpenAI. GPT-modellerna är förtränade på stora mängder textdata och kan sedan finjusteras för specifika uppgifter, inklusive fakturahantering.

Låt oss ta fallet med fakturahantering för beställningar från en bokhandel, en provfaktura visas i bilden nedan. Denna faktura har information om frakt, fakturering, artiklar och priser. Tänk dig att manuellt behöva samla in data från tusentals fakturor! Som tur är har vi AI-verktyg som påskyndar processen.

I den här bloggen går jag igenom stegen för att behandla din faktura med GPT-4 och Nanonets. Ta en kopp kaffe och förbered dig!

Steg 1: Skapa ett Nanonets-konto och ladda upp bilden

Det första steget är att extrahera textdata från bilden på vår faktura. OCR-tekniker (Optical Character Recognition) använder algoritmer för mönsterigenkänning för att identifiera och konvertera tecken till text på bilder eller skannade dokument. Den molnbaserade plattformen för artificiell intelligens (AI) Nanonets erbjuder kurerade OCR-verktyg för specifika uppgifter, inklusive Invoice OCR. Du kan helt enkelt registrera dig här. och få tillgång till deras Invoice OCR-verktyg gratis.

När du väl loggar in och klickar på Faktura OCR kan du hitta alternativet "Ladda upp filer". Nanonets är mycket användarvänlig och låter dig ladda upp filer från över 6 appar.

Jag laddade upp provfakturan från Agatha Book Store här. Extraheringen skulle slutföras på några minuter, och du skulle få de skrotade resultaten som visas. Här används en förtränad modell för djupinlärning för att extrahera enheterna och deras värderingar.

Alla textfält som identifieras av Nanonets är avgränsade av separata rutor. De extraherade värdena för dessa fält kan ses på fliken 'SLUTLIGA RESULTAT' till höger. Denna enhetsextraktion utförd av Nanonets, kan förbättras genom att använda GPT-4. Nanonets erbjuder också alternativ för att lägga till eller ändra fältnamnen, vilket förbättrar anpassningen och användarupplevelsen för kunderna.


Vill du automatisera dina manuella AP-processer? Boka en 30-minuters livedemo för att se hur Nanonets kan hjälpa ditt team att implementera från början till slut AP-automatisering.

Steg 2: Ladda ner OCR-textdata

Den extraherade OCR-textdatan kan laddas ner i flera former. Kontrollera nedanstående GIF för att se demonstrationen av att ladda ner fakturadata till en Excel- eller CSV-fil. I CSV-filen lagras alla entitets-/datafältnamn som kolumner och deras värden finns i motsvarande rader.

Vi kopierar och klistrar in data från den nedladdade CSV-filen och hämtar den OCR-genererade texten. Här är texten jag laddade ner från vår provfaktura i Nanonets.

Den OCR-genererade texten kan förbättras med Chat GPT3 med nästa steg.

Entitetsextraktionen kan uppskalas för att stödja olika frågor om vi använder GPT4-modeller ovanpå den Nanonets-bearbetade texten. Du kan registrera dig för ett Open AI-konto från här. och få tillgång till de stora språkmodellerna. När du har skapat ditt konto får du en unik API-nyckel. Det är för säkerhetsåtgärder, för att autentisera och auktorisera förfrågningar som görs till OpenAI:s servrar. Importera OpenAI-paketet och ställ in API-nyckelvärdet.

Att designa en uppmaning på ett tydligt, strukturerat sätt är hemligheten till att låsa upp kraften hos stora språkmodeller. För att extrahera datafält eller entiteter och deras värden kan vi använda prompten nedan.

#definiera din prompt

prompt_text= Detta är den OCR-genererade texten för fakturor för bokhandelsbeställningar” +ocr_generated_text” + “Extrahera enheter och deras värden som ett nyckel-värdepar från den tillhandahållna OCR-texten och utdata i formatet nyckel: värde”

När du har fått en uppmaning kan du skicka den till valfri förtränad modell av OpenAI och få ett svar genom " openai.Completion.create()”-funktionen. Det finns några parametrar du kan välja för att få bästa resultat.

Parametrar för GPT:

  • motor: Denna parameter låter dig välja en specifik förtränad storspråksmodell (LLM) att använda för att generera texten. Den kan ställas in på en förtränad modell eller en anpassad finjusterad modell. Text Davinci är ett kraftfullt och effektivt val.
  • frågar:  Det är den första textuppmaningen att ge modellen för att börja generera texten. I vårt fall, variabeln "prompt_text" vi definierade tidigare.
  • Max_tokens:  Anger det maximala antalet tokens som modellen kan generera för en given prompt. Du kan styra längden på den genererade texten genom detta.
  • Temperatur: Använd den för att kontrollera graden av slumpmässighet eller kreativitet i den genererade texten. Ett lågtemperaturvärde ger en mer konservativ och förutsägbar effekt, medan ett högtemperaturvärde leder till mer kreativ och varierad produktion. Temperaturvärdet varierar från 0 till 1, där 1 är det mest kreativa.

Nu när du är bekant med GPT-parametrar, låt oss skriva koden för att generera utdata genom att skicka prompttexten tillsammans med andra parametrar.

Vi fick utdata som:

Entiteterna och deras värden har snabbt extraherats på bara några få steg!

Steg 4: Förbättra datakorrigeringar

Bland de tusentals fakturor som cirkuleras i alla företag är inkonsekvenser och mindre fel i kunddata oundvikliga. Till exempel kan vissa kunder ha angett ett ogiltigt e-postformat eller kontaktnummer eller så kan datumet vara i olika format. Med Nanonets och GPT-4 kan du enkelt identifiera dessa problem och utföra datakorrigeringar. Vi kan implementera regelbaserade valideringar, för att verifiera korrektheten och formatet och även kontrollera inkonsekvenser.

Jag ger en uppmaning till GPT att utföra validering av datum och e-post åt oss.

prompt_text= "Verifiera i ovan extraherade entitetsdata om formatet för datum (DD/MM/ÅÅÅÅ) och e-post är korrekta?"

LLM tillhandahåller en Python-kod som använder reguljära uttryck för att kontrollera formatet, som visas i bilden nedan. I ett reguljärt uttryck söker vi efter ett visst mönster och matchar det. De extraherade enheterna lagras i en ordbok och funktioner definieras separat för att validera e-post och datum för fakturan.

Efter att ha definierat kan man skicka vilket datum som helst som ('Fakturadatum'), säljarens eller köparens e-post-ID till dessa funktioner för att få resultatet.

GPT hjälper dig också att göra korrigeringar och ändringar av data på ett snabbt och bekvämt sätt. Observera att i vår faktura är datumet "02/05/2023". Jag ger nedanstående uppmaning att konvertera datumet till formatet "MM/DD/ÅÅ".

prompt=” ändra formatet för data i extraherade enheter till 'MM/DD/YY'. Behåll bara de två sista siffrorna i året"

I utgången har data korrigerats enligt önskemål. Vi kan ge liknande uppmaningar för att kontrollera om kontaktnumret har 10 siffror, om adressen är i önskat format och även kontrollera om datavärden saknas.


Ställ in beröringsfria AP-arbetsflöden och effektivisera leverantörsreskontraprocessen inom sekunder. Boka en 30-minuters livedemo nu.

Steg 5: Kontrollera om det finns dataproblem

Eventuell inkoherens i data kan lätt identifieras med GPT-4. I vårt exempel kan du kontrollera om det totala förfallna beloppet som inte överensstämmer med summan av enskilda artikelpriser. Låt oss ge en uppmaning till det.

prompt=" Kontrollera om det totala saldot på fakturan överensstämmer med kvantiteten och artikelpriserna på fakturan"

GPT-4 matar ut en funktion i Python som beräknar summan av priser för alla beställningar, genom att multiplicera kvantiteten och individuella artikelpris. Om det totala saldot inte stämmer överens med beloppet som står på fakturan, flaggas den aktuella fakturan och undersöks. Detta kan hjälpa företag att undvika eventuella fel, avvikelser och validera sina finansiella data.

Om du har en stor datauppsättning av fakturor kan du också kontrollera att flera fakturor är konsekventa. Du kan till exempel jämföra säljarens och köparens information över flera fakturor för att identifiera eventuella avvikelser eller avvikelser.

Steg 6: Fråga med GPT

När du har extraherat enheterna kan GPT användas för att få svar på specifika frågor också från hela informationen. Till exempel, vad händer om du vill veta informationen om leveransdetaljerna för ett visst fakturanr.

Låt oss göra en uppmaning till det:

#definiera din prompt

prompt_text= "Extrahera informationen om frakt från enhetsnyckel-värdeparen"

Slutförandet som genererades för denna prompt var:

>> Visst! Baserat på OCR-data som tillhandahålls kan vi extrahera fraktinformationen och faktureringsinformationen i två grupper enligt följande:

Fraktinformation:

"fakturanummer": "3522"

ship_to_name: Gayathri Natarajan

ship_to_address: 600053 No.22B , Chetpet , Chennai , Tamil Nadu , Indien: Tanaya Pakahale

En liknande fråga kan också utföras för att få säljarinformation. Här är den extraherade informationen om säljare från den angivna informationen:

  • säljarnamn: AGATHA BOKHUS
  • säljarens adress: No.13, 2nd avenue, Indiranagar, Bangalore, Karnataka, Indien, 721302
  • säljartelefon: 6783456723

När vi arbetar med flera dokument kan vi också söka och filtrera fakturorna med ett totalt förfallobelopp på mer än Rs.5000 för att analysera bulkorder. Eftersom GPT har förmågan att behålla tidigare uppmaningar i minnet, ger det den bästa användarvänligheten.


Vill du automatisera dina manuella AP-processer? Boka en 30-minuters livedemo för att se hur Nanonets kan hjälpa ditt team att implementera från början till slut AP-automatisering.

Varför välja Nanonets + Chat GPT för fakturahantering?

  • GPT kan analysera texten på fakturor och exakt identifiera och extrahera relevanta enheter, även när de är skrivna i olika format eller har variationer i stavning eller formulering. Detta kan hjälpa till att minska fel och öka noggrannheten
  • Automatisera och skala upp datapipeline för företag
  • Den mest effektiva metoden för att hantera stora volymer fakturor. Minskar den tid som behövs för datainmatning och bearbetning avsevärt.
  • Verktygen erbjuder flexibilitet och anpassningsförmåga. Dessa verktyg kan vara lätt integrerad in i befintliga system och kan anpassas för att passa specifika affärsbehov
  • En av fördelarna med Nanonets faktura OCR-lösning är dess förmåga att lära av sina misstag. Systemet använder maskininlärning för att förbättra dess noggrannhet över tid, vilket gör det mer exakt med varje ny faktura som behandlas. Plattformen tillåter också användare att granska och korrigera eventuella fel manuellt, vilket säkerställer att den extraherade informationen är korrekt och tillförlitlig.

Även om det finns många fördelar, måste vi också förstå begränsningarna med denna metod. Noggrannheten är dålig i situationer där bild/PDF-kvaliteten är låg. Al-baserade verktyg är också föremål för fördomar eller fel som är inneboende i träningsdata.

Sammantaget kan utnyttjande av GPT för enhetsextraktion i fakturahantering hjälpa företag att effektivisera sin verksamhet, minska manuellt arbete och förbättra noggrannheten, vilket leder till bättre ekonomisk hantering och beslutsfattande.


Ställ in beröringsfria AP-arbetsflöden och effektivisera leverantörsreskontraprocessen inom sekunder. Boka en 30-minuters livedemo nu.

plats_img

Senaste intelligens

plats_img