شعار زيفيرنت

تحسين دقة معالجة الفواتير باستخدام شبكات النانو و ChatGPT

التاريخ:

لن أبالغ إذا قلت أن الشخص العادي يرسل / يتلقى 10 فواتير على الأقل في الأسبوع. مع تزايد الرقمنة ، تتعامل الشركات مع كميات هائلة من الفواتير كل يوم. تقليديًا ، كانت معالجة الفواتير عملية يدوية وتستغرق وقتًا طويلاً ، وتحتاج إلى موارد كبيرة وعرضة للأخطاء.

مع ظهور الذكاء الاصطناعي ومعالجة اللغات الطبيعية ، أصبح من الممكن الآن أتمتة معالجة الفواتير وتبسيطها ، مما يؤدي إلى تحسين الكفاءة والدقة. يرمز GPT إلى "Generative Pre-المدرب Transformer" ويشير إلى عائلة من نماذج معالجة اللغة القوية التي طورتها OpenAI. يتم تدريب نماذج GPT مسبقًا على كميات كبيرة من البيانات النصية ويمكن بعد ذلك ضبطها لمهام محددة ، بما في ذلك معالجة الفواتير.

لنأخذ حالة معالجة الفاتورة لأوامر متجر الكتب ، يتم عرض نموذج فاتورة في الصورة أدناه. تحتوي هذه الفاتورة على معلومات حول الشحن والفواتير والأصناف والأسعار. تخيل أنك تضطر إلى جمع البيانات يدويًا من آلاف الفواتير! لحسن الحظ ، لدينا أدوات الذكاء الاصطناعي التي تسرع العملية.

في هذه المدونة ، سوف أطلعك على خطوات معالجة فاتورتك باستخدام GPT-4 و Nanonets. احصل على فنجان من القهوة واستعد!

الخطوة 1: قم بإنشاء حساب Nanonets وقم بتحميل الصورة

الخطوة الأولى هي استخراج البيانات النصية من صورة فاتورتنا. تستخدم تقنيات التعرف الضوئي على الحروف (OCR) خوارزميات التعرف على الأنماط لتحديد الأحرف وتحويلها إلى نص على الصور أو المستندات الممسوحة ضوئيًا. توفر منصة Nanonets للذكاء الاصطناعي المستندة إلى مجموعة النظراء أدوات التعرف الضوئي على الحروف المنسقة لمهام محددة ، بما في ذلك Invoice OCR. يمكنك ببساطة التسجيل هنا والوصول إلى أداة Invoice OCR الخاصة بهم مجانًا.

بمجرد تسجيل الدخول والنقر على الفاتورة OCR ، يمكنك العثور على خيار "تحميل الملفات". Nanonets سهل الاستخدام للغاية ويسمح لك بتحميل الملفات عبر أكثر من 6 تطبيقات.

لقد قمت بتحميل نموذج الفاتورة من Agatha Book Store هنا. سيتم الانتهاء من الاستخراج في غضون بضع دقائق ، وستحصل على النتائج الملغاة كما هو موضح. هنا ، يتم استخدام نموذج التعلم العميق المدرب مسبقًا لاستخراج الكيانات وقيمها.

يتم تقييد جميع حقول النص التي تم تحديدها بواسطة شبكات النانو بمربعات منفصلة. يمكن رؤية القيم المستخرجة لهذه الحقول في علامة التبويب "النتائج النهائية" على اليمين. يمكن تحسين استخراج الكيان الذي تم بواسطة Nanonets باستخدام GPT-4. توفر شبكات النانو أيضًا خيارات لإضافة أو تعديل أسماء الحقول ، مما يعزز التخصيص وتجربة المستخدم للعملاء.


هل تبحث عن أتمتة عمليات AP اليدوية الخاصة بك؟ احجز عرضًا توضيحيًا مباشرًا مدته 30 دقيقة لترى كيف يمكن أن تساعد شبكات النانو فريقك في التنفيذ الشامل أتمتة AP.

الخطوة 2: تنزيل بيانات نص OCR

يمكن تنزيل بيانات النص OCR المستخرجة بأشكال متعددة. تحقق من ملف GIF أدناه لمشاهدة العرض التوضيحي لتنزيل بيانات الفاتورة في ملف Excel أو CSV. في ملف CSV ، يتم تخزين جميع أسماء الكيانات / حقول البيانات كأعمدة ، وتكون قيمها في الصفوف المقابلة.

نقوم بنسخ ولصق البيانات من ملف CSV الذي تم تنزيله والحصول على النص الذي تم إنشاؤه بواسطة OCR. هذا هو النص الذي قمت بتنزيله من نموذج الفاتورة في Nanonets.

يمكن تحسين النص الذي تم إنشاؤه بواسطة OCR باستخدام Chat GPT3 مع الخطوات التالية.

يمكن رفع مستوى استخراج الكيان لدعم الاستعلامات المختلفة إذا استخدمنا نماذج GPT4 أعلى النص المعالج لـ Nanonets. يمكنك التسجيل للحصول على حساب Open AI من هنا والوصول إلى نماذج اللغات الكبيرة. بمجرد إعداد حسابك ، ستتلقى مفتاح API فريدًا. إنها للتدابير الأمنية ، لمصادقة وتفويض الطلبات المقدمة إلى خوادم OpenAI. قم باستيراد حزمة OpenAI وقم بتعيين قيمة مفتاح API.

إن تصميم موجه بطريقة واضحة ومنظمة هو سر إطلاق العنان لقوة النماذج اللغوية الكبيرة. لاستخراج حقل البيانات أو الكيانات وقيمها ، يمكننا استخدام الموجه أدناه.

# حدد موجهك

موجه / نص = هذا هو نص الفواتير الذي تم إنشاؤه بواسطة التعرف الضوئي على الحروف (OCR) لطلبات متجر الكتب "+ ocr_generated_text" + "استخراج الكيانات وقيمها كزوج من قيمة المفتاح من نص OCR المقدم والإخراج بتنسيق key: value"

بمجرد حصولك على مطالبة ، يمكنك تمريرها إلى أي نموذج تم تدريبه مسبقًا من OpenAI والحصول على رد من خلال " openai.Completion.create () ”وظيفة. هناك عدد قليل من المعلمات التي يمكنك اختيارها للحصول على أفضل ناتج.

معلمات GPT:

  • محرك: تتيح لك هذه المعلمة اختيار نموذج لغة كبير محدد مسبقًا (LLM) لاستخدامه في إنشاء النص. يمكن ضبطه على نموذج مدرب مسبقًا أو نموذج مخصص دقيق. نص دافينشي هو خيار قوي وفعال.
  • موجه:  إنه موجه النص الأولي لإعطاء النموذج لبدء إنشاء النص. في حالتنا ، المتغير "التالي" الذي حددناه سابقًا.
  • الحد الأقصى للرموز:  تشير إلى الحد الأقصى لعدد الرموز التي يمكن أن ينشئها النموذج لموجه معين. يمكنك التحكم في طول النص الذي تم إنشاؤه من خلال هذا.
  • درجة الحرارة: استخدمه للتحكم في درجة العشوائية أو الإبداع في النص الذي تم إنشاؤه. تنتج قيمة درجة الحرارة المنخفضة ناتجًا أكثر تحفظًا ويمكن التنبؤ به ، بينما تؤدي قيمة درجة الحرارة المرتفعة إلى إنتاج أكثر إبداعًا وتنوعًا. تتراوح قيمة درجة الحرارة من 0 إلى 1 ، مع كون الرقم 1 هو الأكثر إبداعًا.

الآن بعد أن أصبحت معتادًا على معلمات GPT ، دعنا نكتب الكود لإنشاء مخرجات بتمرير النص الفوري مع معلمات أخرى.

حصلنا على الناتج على النحو التالي:

تم استخراج الكيانات وقيمها بسرعة في خطوات قليلة!

الخطوة 4: تحسين تصحيحات البيانات

من بين آلاف الفواتير التي يتم تداولها في أي عمل ، لا يمكن تجنب التناقضات والأخطاء الطفيفة في بيانات العملاء. على سبيل المثال ، ربما قدم بعض العملاء تنسيق بريد إلكتروني أو أرقام اتصال غير صالحة أو قد يكون التاريخ بتنسيقات مختلفة. باستخدام Nanonets و GPT-4 ، يمكنك بسهولة تحديد هذه المشكلات وإجراء تصحيحات للبيانات. يمكننا تنفيذ عمليات التحقق المستندة إلى القواعد ، للتحقق من الصحة والشكل وأيضًا التحقق من التناقضات.

أطالب GPT بإجراء التحقق من صحة التاريخ وإرسال البريد الإلكتروني لنا.

موجه / نص = "في بيانات الكيانات المستخرجة أعلاه ، تحقق مما إذا كان تنسيق التاريخ (اليوم / الشهر / السنة) والبريد الإلكتروني صحيحين؟"

يوفر LLM كود Python باستخدام التعبيرات العادية للتحقق من التنسيق ، كما هو موضح في الصورة أدناه. في التعبير العادي ، نبحث عن نمط معين ونطابقه. يتم تخزين الكيانات المستخرجة في قاموس ، ويتم تعريف الوظائف بشكل منفصل للتحقق من صحة البريد الإلكتروني وتواريخ الفاتورة.

بعد التحديد ، يمكن للمرء تمرير أي تاريخ مثل ("تاريخ الفاتورة") أو معرف البريد الإلكتروني للبائع أو المشتري لهذه الوظائف للحصول على النتيجة.

تساعدك GPT أيضًا على إجراء تصحيحات وتغييرات على البيانات بطريقة سريعة ومريحة. لاحظ أن التاريخ في فاتورتنا هو "02/05/2023". أقدم الموجه أدناه لتحويل التاريخ إلى تنسيق "MM / DD / YY".

موجه = "قم بتغيير تنسيق البيانات في الكيانات المستخرجة إلى" MM / DD / YY ". احتفظ فقط بآخر رقمين في العام "

في الإخراج ، تم تصحيح البيانات حسب الرغبة. يمكننا تقديم مطالبات مماثلة للتحقق مما إذا كان رقم جهة الاتصال يحتوي على 10 أرقام ، وما إذا كان العنوان بالتنسيق المطلوب وكذلك التحقق من قيم البيانات المفقودة.


قم بإعداد تدفقات عمل AP بدون لمس و تبسيط عملية الحسابات الدائنة في ثوان. احجز عرضًا تجريبيًا مباشرًا لمدة 30 دقيقة الآن.

الخطوة 5: التحقق من مشاكل البيانات

يمكن تحديد أي تضارب في البيانات باستخدام GPT-4 بسهولة. في مثالنا ، يمكنك التحقق مما إذا كان إجمالي المبلغ المستحق لا يتطابق مع مجموع أسعار العناصر الفردية. دعونا نقدم موجهًا لذلك.

موجه = "تحقق مما إذا كان إجمالي الرصيد المستحق في الفاتورة متوافقًا مع الكمية وأسعار العناصر في الفاتورة"

ينتج GPT-4 دالة في Python تحسب تجميع أسعار جميع الطلبات ، عن طريق ضرب الكمية وسعر العنصر الفردي. في حالة عدم توافق الرصيد الإجمالي مع المبلغ المدون في الفاتورة ، يتم تمييز الفاتورة المحددة والتحقيق فيها. يمكن أن يساعد هذا الشركات على تجنب أي أخطاء وتناقضات والتحقق من صحة بياناتها المالية.

إذا كانت لديك مجموعة بيانات كبيرة من الفواتير ، فيمكنك أيضًا التحقق من التناسق عبر فواتير متعددة. على سبيل المثال ، يمكنك مقارنة معلومات البائع والمشتري عبر فواتير متعددة لتحديد أي تناقضات أو شذوذ.

الخطوة 6: الاستعلام باستخدام GPT

بمجرد استخراج الكيانات ، يمكن استخدام GPT للحصول على إجابات لاستفسارات محددة أيضًا من المعلومات بأكملها. على سبيل المثال ، ماذا لو كنت تريد معرفة المعلومات حول تفاصيل الشحن لفاتورة معينة لا.

دعنا نوجهها:

# حدد موجهك

موجه / نص = "استخرج تفاصيل الشحن من أزواج المفتاح والقيمة للكيان"

الإكمال الذي تم إنشاؤه لهذه المطالبة كان:

>> بالتأكيد! بناءً على بيانات التعرف الضوئي على الحروف المقدمة ، يمكننا استخراج معلومات الشحن ومعلومات الفوترة كمجموعتين على النحو التالي:

معلومات الشحن:

"رقم الفاتورة": "3522"

ship_to_name: غياثري ناتاراجان

ship_to_address: 600053 رقم 22 ب ، شيتبيت ، تشيناي ، تاميل نادو ، الهند: تانايا باكاهالي

يمكن إجراء استعلام مماثل للحصول على تفاصيل البائع أيضًا. فيما يلي المعلومات المستخرجة عن البائعين من البيانات المقدمة:

  • seller_name: أجاثا بوك هاوس
  • seller_address: رقم 13 ، الجادة الثانية ، Indiranagar ، بنغالور ، كارناتاكا ، الهند ، 2
  • رقم_هاتف_البائع: 6783456723

عند العمل مع مستندات متعددة ، يمكننا أيضًا البحث في الفواتير وتصفيتها برصيد إجمالي مستحق يزيد عن 5000 روبية لتحليل الطلبات المجمعة. نظرًا لأن GPT لديها القدرة على الاحتفاظ بالمطالبات السابقة في الذاكرة ، فإنها توفر أفضل سهولة في الاستخدام.


هل تبحث عن أتمتة عمليات AP اليدوية الخاصة بك؟ احجز عرضًا توضيحيًا مباشرًا مدته 30 دقيقة لترى كيف يمكن أن تساعد شبكات النانو فريقك في التنفيذ الشامل أتمتة AP.

لماذا تختار Nanonets + Chat GPT لمعالجة الفواتير؟

  • يمكن لـ GPT تحليل النص الموجود في الفواتير وتحديد الكيانات ذات الصلة بدقة واستخراجها ، حتى عندما تكون مكتوبة بتنسيقات مختلفة أو بها اختلافات في التهجئة أو الصياغة. يمكن أن يساعد هذا في تقليل الأخطاء وزيادة الدقة
  • إنسان آلي وتوسيع خط أنابيب البيانات للشركات
  • الطريقة الأكثر فعالية لمعالجة كميات كبيرة من الفواتير. يقلل الوقت اللازم لإدخال البيانات ومعالجتها بشكل كبير.
  • توفر الأدوات المرونة والقدرة على التكيف. يمكن أن تكون هذه الأدوات سهل الاندماج في الأنظمة الحالية ويمكن تخصيصها لتناسب احتياجات العمل المحددة
  • تتمثل إحدى مزايا حل التعرف الضوئي على الحروف على فاتورة Nanonets في قدرته على ذلك تعلم من أخطائها. يستخدم النظام التعلم الآلي لتحسين دقته بمرور الوقت ، مما يجعله أكثر دقة مع معالجة كل فاتورة جديدة. كما تتيح المنصة للمستخدمين مراجعة أي أخطاء يدويًا وتصحيحها ، مما يضمن دقة وموثوقية البيانات المستخرجة.

في حين أن هناك الكثير من المزايا ، نحتاج أيضًا إلى فهم قيود هذه الطريقة. تكون الدقة ضعيفة في المواقف التي تكون فيها جودة الصورة / PDF منخفضة. الأدوات المستندة أيضًا عرضة للتحيزات أو الأخطاء المتأصلة في بيانات التدريب.

بشكل عام ، يمكن أن تساعد الاستفادة من GPT لاستخراج الكيانات في معالجة الفواتير الشركات على تبسيط عملياتها وتقليل العمل اليدوي وتحسين الدقة ، مما يؤدي إلى تحسين الإدارة المالية واتخاذ القرار.


قم بإعداد تدفقات عمل AP بدون لمس و تبسيط عملية الحسابات الدائنة في ثوان. احجز عرضًا تجريبيًا مباشرًا لمدة 30 دقيقة الآن.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة