चाहे वह इकाई मान्यता हो, chatbot प्रशिक्षण, इकाई भावना विश्लेषण या पाठ वर्गीकरण इत्यादि, अपने स्वयं के उपयोग के लिए एक मॉडल को प्रशिक्षित करने और बेहतर बनाने के लिए पाठ की व्याख्या करना महत्वपूर्ण है। इसलिए, कम यूआई घर्षण और अधिकतम स्वचालन के साथ सही एनोटेशन टूल चुनना अत्यंत महत्वपूर्ण है।
आज, हम एक नया टेक्स्ट एनोटेशन टूल पेश कर रहे हैं यूबीआईएआई जो उपयोग में आसान यूआई, बहुभाषी समर्थन (अरबी और चीनी सहित) और ऑटो-एनोटेशन कार्यक्षमता के साथ पूरक प्रदान करता है। उपकरण वर्तमान में है मुक्त में बीटा संस्करण.
यूबीआईएआई प्रत्येक भाषा के लिए विशिष्ट टोकननाइजेशन के साथ एकाधिक भाषा एनोटेशन का समर्थन करता है, उदाहरण के लिए अरबी टोकननाइजेशन चीनी से अलग है जो अंग्रेजी से अलग है।
कोई नया प्रोजेक्ट बनाते समय, बस भाषा निर्दिष्ट करें और अपने दस्तावेज़ अपलोड करें। फिर आपके दस्तावेज़ चुनी गई भाषा के आधार पर स्वचालित रूप से टोकनयुक्त हो जाएंगे।
केवल बहुत कम एनोटेशन टूल विभिन्न प्रारूपों में दस्तावेज़ अपलोड करने की सुविधा प्रदान करते हैं। UBIAI कई अपलोड प्रारूप प्रदान करता है:
- TXT,पीडीएफ, HTML और DOCX
- JSON: आप मौजूदा इकाइयों के साथ JSON फ़ाइल अपलोड कर सकते हैं। यह उपयोगी है यदि आपके पास पूर्व-एनोटेटेड JSON फ़ाइल है जिसे आप एनोटेशन जारी रखने के लिए आयात करना चाहते हैं
- सीएसवी: आप प्रति पंक्ति एक दस्तावेज़ वाली सीएसवी फ़ाइल अपलोड कर सकते हैं। यह दस्तावेज़ों को बड़ी संख्या में अपलोड करने के लिए उपयोगी है
- ज़िप: आप TXT, PDF या HTML वाली ज़िप फ़ाइल अपलोड कर सकते हैं। यह दस्तावेज़ों को बड़ी संख्या में अपलोड करने के लिए उपयोगी है
एनोटेशन इंटरफ़ेस किसी भी एनोटेशन टूल का मूल है क्योंकि यह वह जगह है जहां एनोटेटर अपना अधिकांश समय व्यतीत करता है। एक निर्बाध, उपयोग में आसान, कम घर्षण वाला इंटरफ़ेस होना आवश्यक है।
यूबीआईएआई एनोटेशन के दौरान वास्तविक समय की ऑटो-बचत के साथ एक चिकना इंटरफ़ेस प्रदान करता है। इसके अलावा, ऑटो-डिटेक्शन सक्षम होने पर, जैसे ही आप किसी विशिष्ट शब्द को हाइलाइट करेंगे, टूल समान शब्दों को खोजेगा और एनोटेट करेगा।
1. विपणन के लिए चैटबॉट का उपयोग करने के 8 सिद्ध तरीके (वास्तविक उदाहरणों के साथ)
शब्दकोश
प्रत्येक इकाई प्रकार के लिए आप उक्त शब्दकोश में निहित शब्दों को स्वचालित रूप से पहचानने और एनोटेट करने के लिए एक या अधिक शब्दकोश को संबद्ध कर सकते हैं। आप या तो शब्दकोश तत्व को मैन्युअल रूप से इनपुट कर सकते हैं या एक सीएसवी सूची अपलोड कर सकते हैं जिसमें सभी संबंधित शब्द उनके संबंधित इकाई प्रकार के साथ हों (नीचे उदाहरण देखें):
नियम आधारित मिलान:
नियम आधारित मिलान के साथ आप कई टैग जैसे कि पार्ट ऑफ स्पीच (पीओएस), नियमित अभिव्यक्ति, पैटर्न (ईमेल, नंबर, फोन नंबर, आदि ...) के संयोजन का उपयोग करके तुरंत अपने दस्तावेज़ों को पूर्व-एनोटेट करने में सक्षम होंगे। सभी संभावित विशेषताओं की सूची उनके विवरण के साथ यहां पाई जा सकती है दस्तावेज़ीकरण.
मशीन लर्निंग ऑटो-एनोटेशन:
एनोटेशन प्रक्रिया को तेज़ करने के लिए, यूबीएआई स्पासी मॉडल का उपयोग करके आपके दस्तावेज़ों को ऑटो-एनोटेट करने की क्षमता प्रदान करता है। तुमको बस यह करना है:
- उस प्रोजेक्ट का चयन करें जिसमें से प्रशिक्षण कोष का उपयोग किया जाएगा
- एक पूर्व-प्रशिक्षित मॉडल का चयन करें, आपके पास रिक्त या पूर्व-प्रशिक्षित अंग्रेजी मॉडल en_core_web_sm से शुरू करने का विकल्प है।
- मॉडल को प्रशिक्षित/मूल्यांकन करने के लिए एनोटेटेड डेटा से प्रशिक्षण/मूल्यांकन विभाजन का चयन करें।
- पुनरावृत्तियों की संख्या (डिफ़ॉल्ट 10 है), ड्रॉपआउट और बैच आकार निर्दिष्ट करके प्रशिक्षण को कॉन्फ़िगर करें।
- मॉडल द्वारा प्रशिक्षण समाप्त करने के बाद आपके पास "ट्रेन समाप्त होने के बाद अपने दस्तावेज़ों को एनोटेट करें" बटन को चेक करके अपने दस्तावेज़ को स्वचालित रूप से एनोटेट करने का विकल्प होता है। नोट: कुशल मॉडल प्रशिक्षण के लिए, आपके कुल दस्तावेज़ों में से कम से कम 10% को एनोटेट करने की अनुशंसा की जाती है।
प्रशिक्षण के बाद, यूबीआईएआई सीधे ट्रेन/सत्यापन विभाजन के आधार पर मॉडल का मूल्यांकन करेगा। प्रत्येक इकाई के लिए सटीकता, रिकॉल और एफ स्कोर प्रदर्शित किया जाएगा:
समय के साथ मॉडल के प्रदर्शन को ट्रैक करने के लिए, मॉडल नाम के नीचे "लॉग देखें" बटन दबाएं।
एकाधिक निर्यात प्रारूप:
मौजूदा एनोटेशन टूल की मुख्य सीमा एनोटेशन निर्यात की सीमित मात्रा है। यूबीआईएआई के साथ, आपके पास अपने एनोटेशन को निम्नलिखित प्रारूपों में निर्यात करने का विकल्प है:
- अमेज़ॅन कॉम्प्रिहेंड प्रारूप (ट्यूटोरियल देखें)। यहाँ उत्पन्न करें)
- JSON प्रारूप
- स्पासी प्रारूप
- स्टैनफोर्ड कोरएनएलपी प्रारूप
- आईओबी प्रारूप जिसमें आईओबी पार्ट ऑफ स्पीच (पीओएस) और आईओबी शामिल है chatbot
- स्टैनफोर्ड कोरएनएलपी प्रारूप
एनोटेशन के दौरान उपयोग किए गए दस्तावेज़ों के साथ एनोटेशन वाली एक ज़िप फ़ाइल डाउनलोड की जाएगी; किसी मॉडल को प्रशिक्षित करने के लिए एनोटेशन का उपयोग करने से पहले आपको फ़ाइल को अनज़िप करना होगा। नीचे IOB POS का उपयोग करके एनोटेशन निर्यात का एक उदाहरण दिया गया है:
वास्तविक समय विश्लेषण:
वास्तविक समय विश्लेषण के साथ, आप उपकरण को छोड़े बिना मौके पर ही अपने प्रशिक्षित मॉडल का परीक्षण करने में सक्षम होंगे। यह वास्तविक उत्पादन पाठ पर मॉडल के प्रदर्शन को तुरंत जांचने के लिए उपयोगी है।
दल का सहयोग:
यह कहने की आवश्यकता नहीं है कि टीम सहयोग न केवल एनोटेशन प्रक्रिया को तेज करने के लिए आवश्यक है, बल्कि यह अंतर्निहित सत्य का अनुमान लगाने के लिए समूह एनोटेशन का लाभ उठाकर एनोटेटर पूर्वाग्रह को भी कम करता है।
यूबीआईएआई आपकी परियोजनाओं के लिए सहयोग बनाकर टीम के सदस्यों के साथ आसानी से सहयोग करने का विकल्प प्रदान करता है।
अंतिम ध्यान दें
यूबीआईएआई में हमारा मिशन उपयोग में आसान बनाना है प्राकृतिक भाषा संसाधन (एनएलपी) उपकरण डेवलपर्स और कंपनियों को मशीन सीखने के विचारों को जल्दी से आज़माने और कोडिंग में समय बर्बाद किए बिना उन्हें वास्तविक दुनिया की समस्याओं पर लागू करने में मदद करते हैं। हमारा मानना है कि सुलभ और कम लागत वाले उपकरण प्रदान करने से दुनिया भर में एनएलपी का लोकतंत्रीकरण होगा और बेहतर और बुद्धिमान निर्णय लेने की अनुमति मिलेगी। इस आशय के लिए, हम प्रतिबद्ध हैं शोधकर्ताओं और शिक्षा जगत से जुड़े लोगों को संपूर्ण सुविधाओं के साथ यह टूल निःशुल्क प्रदान करना.
हम टूल में लगातार सुधार कर रहे हैं और हमें बीटा परीक्षकों की आवश्यकता है। कृपया इसे आज़माएं https://ubiai.tools और हमें अपना दो प्रतिक्रिया!