यूबीआईएआई का परिचय: एनएलपी अनुप्रयोगों के लिए उपयोग में आसान टेक्स्ट एनोटेशन

चाहे वह इकाई मान्यता हो, chatbot प्रशिक्षण, इकाई भावना विश्लेषण या पाठ वर्गीकरण इत्यादि, अपने स्वयं के उपयोग के लिए एक मॉडल को प्रशिक्षित करने और बेहतर बनाने के लिए पाठ की व्याख्या करना महत्वपूर्ण है। इसलिए, कम यूआई घर्षण और अधिकतम स्वचालन के साथ सही एनोटेशन टूल चुनना अत्यंत महत्वपूर्ण है।

आज, हम एक नया टेक्स्ट एनोटेशन टूल पेश कर रहे हैं यूबीआईएआई जो उपयोग में आसान यूआई, बहुभाषी समर्थन (अरबी और चीनी सहित) और ऑटो-एनोटेशन कार्यक्षमता के साथ पूरक प्रदान करता है। उपकरण वर्तमान में है मुक्त में बीटा संस्करण.

यूबीआईएआई परिचय

यूबीआईएआई प्रत्येक भाषा के लिए विशिष्ट टोकननाइजेशन के साथ एकाधिक भाषा एनोटेशन का समर्थन करता है, उदाहरण के लिए अरबी टोकननाइजेशन चीनी से अलग है जो अंग्रेजी से अलग है।

एनोटेटेड अंग्रेजी दस्तावेज़

एनोटेटेड अरबी दस्तावेज़

चीनी दस्तावेज़

कोई नया प्रोजेक्ट बनाते समय, बस भाषा निर्दिष्ट करें और अपने दस्तावेज़ अपलोड करें। फिर आपके दस्तावेज़ चुनी गई भाषा के आधार पर स्वचालित रूप से टोकनयुक्त हो जाएंगे।

केवल बहुत कम एनोटेशन टूल विभिन्न प्रारूपों में दस्तावेज़ अपलोड करने की सुविधा प्रदान करते हैं। UBIAI कई अपलोड प्रारूप प्रदान करता है:

TXT,पीडीएफ, HTML और DOCX
JSON: आप मौजूदा इकाइयों के साथ JSON फ़ाइल अपलोड कर सकते हैं। यह उपयोगी है यदि आपके पास पूर्व-एनोटेटेड JSON फ़ाइल है जिसे आप एनोटेशन जारी रखने के लिए आयात करना चाहते हैं
सीएसवी: आप प्रति पंक्ति एक दस्तावेज़ वाली सीएसवी फ़ाइल अपलोड कर सकते हैं। यह दस्तावेज़ों को बड़ी संख्या में अपलोड करने के लिए उपयोगी है
ज़िप: आप TXT, PDF या HTML वाली ज़िप फ़ाइल अपलोड कर सकते हैं। यह दस्तावेज़ों को बड़ी संख्या में अपलोड करने के लिए उपयोगी है

एकाधिक अपलोड प्रारूप

एनोटेशन इंटरफ़ेस किसी भी एनोटेशन टूल का मूल है क्योंकि यह वह जगह है जहां एनोटेटर अपना अधिकांश समय व्यतीत करता है। एक निर्बाध, उपयोग में आसान, कम घर्षण वाला इंटरफ़ेस होना आवश्यक है।

UBIAI एनोटेशन इंटरफ़ेस

यूबीआईएआई एनोटेशन के दौरान वास्तविक समय की ऑटो-बचत के साथ एक चिकना इंटरफ़ेस प्रदान करता है। इसके अलावा, ऑटो-डिटेक्शन सक्षम होने पर, जैसे ही आप किसी विशिष्ट शब्द को हाइलाइट करेंगे, टूल समान शब्दों को खोजेगा और एनोटेट करेगा।

1. विपणन के लिए चैटबॉट का उपयोग करने के 8 सिद्ध तरीके (वास्तविक उदाहरणों के साथ)

2. अपने एनएलपी प्रोजेक्ट के लिए टेक्स्ट-आधारित डेटासेट तैयार करने के लिए टेक्सथेरो का उपयोग कैसे करें

3. मानव केंद्रित Chatbot डिजाइन के लिए 5 शीर्ष युक्तियाँ

4. चैटबॉट सम्मेलन ऑनलाइन

शब्दकोश
प्रत्येक इकाई प्रकार के लिए आप उक्त शब्दकोश में निहित शब्दों को स्वचालित रूप से पहचानने और एनोटेट करने के लिए एक या अधिक शब्दकोश को संबद्ध कर सकते हैं। आप या तो शब्दकोश तत्व को मैन्युअल रूप से इनपुट कर सकते हैं या एक सीएसवी सूची अपलोड कर सकते हैं जिसमें सभी संबंधित शब्द उनके संबंधित इकाई प्रकार के साथ हों (नीचे उदाहरण देखें):

सीएसवी शब्दकोश

नियम आधारित मिलान:

नियम आधारित मिलान के साथ आप कई टैग जैसे कि पार्ट ऑफ स्पीच (पीओएस), नियमित अभिव्यक्ति, पैटर्न (ईमेल, नंबर, फोन नंबर, आदि ...) के संयोजन का उपयोग करके तुरंत अपने दस्तावेज़ों को पूर्व-एनोटेट करने में सक्षम होंगे। सभी संभावित विशेषताओं की सूची उनके विवरण के साथ यहां पाई जा सकती है दस्तावेज़ीकरण.

मशीन लर्निंग ऑटो-एनोटेशन:

एनोटेशन प्रक्रिया को तेज़ करने के लिए, यूबीएआई स्पासी मॉडल का उपयोग करके आपके दस्तावेज़ों को ऑटो-एनोटेट करने की क्षमता प्रदान करता है। तुमको बस यह करना है:

उस प्रोजेक्ट का चयन करें जिसमें से प्रशिक्षण कोष का उपयोग किया जाएगा
एक पूर्व-प्रशिक्षित मॉडल का चयन करें, आपके पास रिक्त या पूर्व-प्रशिक्षित अंग्रेजी मॉडल en_core_web_sm से शुरू करने का विकल्प है।
मॉडल को प्रशिक्षित/मूल्यांकन करने के लिए एनोटेटेड डेटा से प्रशिक्षण/मूल्यांकन विभाजन का चयन करें।
पुनरावृत्तियों की संख्या (डिफ़ॉल्ट 10 है), ड्रॉपआउट और बैच आकार निर्दिष्ट करके प्रशिक्षण को कॉन्फ़िगर करें।
मॉडल द्वारा प्रशिक्षण समाप्त करने के बाद आपके पास "ट्रेन समाप्त होने के बाद अपने दस्तावेज़ों को एनोटेट करें" बटन को चेक करके अपने दस्तावेज़ को स्वचालित रूप से एनोटेट करने का विकल्प होता है। नोट: कुशल मॉडल प्रशिक्षण के लिए, आपके कुल दस्तावेज़ों में से कम से कम 10% को एनोटेट करने की अनुशंसा की जाती है।

प्रशिक्षण के बाद, यूबीआईएआई सीधे ट्रेन/सत्यापन विभाजन के आधार पर मॉडल का मूल्यांकन करेगा। प्रत्येक इकाई के लिए सटीकता, रिकॉल और एफ स्कोर प्रदर्शित किया जाएगा:

समय के साथ मॉडल के प्रदर्शन को ट्रैक करने के लिए, मॉडल नाम के नीचे "लॉग देखें" बटन दबाएं।

एकाधिक निर्यात प्रारूप:

मौजूदा एनोटेशन टूल की मुख्य सीमा एनोटेशन निर्यात की सीमित मात्रा है। यूबीआईएआई के साथ, आपके पास अपने एनोटेशन को निम्नलिखित प्रारूपों में निर्यात करने का विकल्प है:

अमेज़ॅन कॉम्प्रिहेंड प्रारूप (ट्यूटोरियल देखें)। यहाँ उत्पन्न करें)
JSON प्रारूप
स्पासी प्रारूप
स्टैनफोर्ड कोरएनएलपी प्रारूप
आईओबी प्रारूप जिसमें आईओबी पार्ट ऑफ स्पीच (पीओएस) और आईओबी शामिल है chatbot
स्टैनफोर्ड कोरएनएलपी प्रारूप

एनोटेशन के दौरान उपयोग किए गए दस्तावेज़ों के साथ एनोटेशन वाली एक ज़िप फ़ाइल डाउनलोड की जाएगी; किसी मॉडल को प्रशिक्षित करने के लिए एनोटेशन का उपयोग करने से पहले आपको फ़ाइल को अनज़िप करना होगा। नीचे IOB POS का उपयोग करके एनोटेशन निर्यात का एक उदाहरण दिया गया है:

आईओबी पीओएस निर्यात

वास्तविक समय विश्लेषण:

वास्तविक समय विश्लेषण के साथ, आप उपकरण को छोड़े बिना मौके पर ही अपने प्रशिक्षित मॉडल का परीक्षण करने में सक्षम होंगे। यह वास्तविक उत्पादन पाठ पर मॉडल के प्रदर्शन को तुरंत जांचने के लिए उपयोगी है।

वास्तविक समय विश्लेषण इकाई निष्कर्षण

दल का सहयोग:

यह कहने की आवश्यकता नहीं है कि टीम सहयोग न केवल एनोटेशन प्रक्रिया को तेज करने के लिए आवश्यक है, बल्कि यह अंतर्निहित सत्य का अनुमान लगाने के लिए समूह एनोटेशन का लाभ उठाकर एनोटेटर पूर्वाग्रह को भी कम करता है।

यूबीआईएआई आपकी परियोजनाओं के लिए सहयोग बनाकर टीम के सदस्यों के साथ आसानी से सहयोग करने का विकल्प प्रदान करता है।

सहयोग मंच

अंतिम ध्यान दें

यूबीआईएआई में हमारा मिशन उपयोग में आसान बनाना है प्राकृतिक भाषा संसाधन (एनएलपी) उपकरण डेवलपर्स और कंपनियों को मशीन सीखने के विचारों को जल्दी से आज़माने और कोडिंग में समय बर्बाद किए बिना उन्हें वास्तविक दुनिया की समस्याओं पर लागू करने में मदद करते हैं। हमारा मानना है कि सुलभ और कम लागत वाले उपकरण प्रदान करने से दुनिया भर में एनएलपी का लोकतंत्रीकरण होगा और बेहतर और बुद्धिमान निर्णय लेने की अनुमति मिलेगी। इस आशय के लिए, हम प्रतिबद्ध हैं शोधकर्ताओं और शिक्षा जगत से जुड़े लोगों को संपूर्ण सुविधाओं के साथ यह टूल निःशुल्क प्रदान करना.

हम टूल में लगातार सुधार कर रहे हैं और हमें बीटा परीक्षकों की आवश्यकता है। कृपया इसे आज़माएं https://ubiai.tools और हमें अपना दो प्रतिक्रिया!

Source: https://chatbotslife.com/introducing-ubiai-easy-to-use-text-annotation-for-nlp-applications-74a2401fa725?source=rss—-a49517e4c30b—4

जनरेटिव डेटा इंटेलिजेंस

यूबीआईएआई का परिचय: एनएलपी अनुप्रयोगों के लिए उपयोग में आसान पाठ एनोटेशन

इन 5 सामान्य गलतियों से बचें जो एआई में हर नौसिखिया करता है - केडीनगेट्स

यूरोपीय हवाई अड्डों ने विमानन लाभों पर प्रकाश डालते हुए यूरोपीय संघ के विस्तार की 20वीं वर्षगांठ मनाई

नवीनतम खुफिया

यूरोपीय आयोग और उपभोक्ता अधिकारी 20 एयरलाइनों के भ्रामक हरित दावों का मुकाबला करते हैं - A4E प्रतिक्रिया देता है

हंटर एक्स हंटर: नेन एक्स इम्पैक्ट ने गेंथ्रू का खुलासा किया

डिज़्नी ड्रीमलाइट वैली "थ्रिल्स एंड फ्रिल्स" का अपडेट इस सप्ताह, पैच नोट्स और ट्रेलर

डेटा लैंडस्केप को डिकोड करना: डेटा साइंस और इनोवेशन पर डॉ. किरण आर

797 पायलट प्रशिक्षण - एयरप्लेन गीक्स पॉडकास्ट