जेफिरनेट लोगो

बड़े भाषा मॉडल SauLM-7B का लक्ष्य कानूनी अनुप्रयोग है

दिनांक:

मशीन-लर्निंग शोधकर्ताओं और कानूनी विशेषज्ञों ने SauLM-7B जारी किया है, जिसके बारे में उनका दावा है कि यह पहला टेक्स्ट-जनरेटिंग ओपन सोर्स बड़ा भाषा मॉडल है जो विशेष रूप से कानूनी कार्य और अनुप्रयोगों पर केंद्रित है।

हाल की हाई-प्रोफ़ाइल भूलों के प्रकाश में, जिसमें जेनरेटिव एआई ने प्रस्तुत अदालती दाखिलों में गैर-मौजूद मामलों का हवाला दिया - माता बनाम एवियंका और पार्क बनाम किम - यह गलत सलाह दी जा सकती है। एआई मॉडल की मतिभ्रम की प्रवृत्ति और उनके अनिश्चित डेटा उद्गम ऐसे उद्योग में डील ब्रेकर प्रतीत होंगे जहां दांव महत्वपूर्ण हैं।

लेकिन SaulLM-7B के निर्माता, स्टार्टअप से संबद्ध हैं Equall.ai, फ्रांस में यूनिवर्सिटी पेरिस-सैकले और सोरबोन यूनिवर्सिटी, और पुर्तगाल में यूनिवर्सिडेड डी लिस्बोआ और नोवा स्कूल ऑफ लॉ का तर्क है कि कानून में कृत्रिम बुद्धिमत्ता सहायता के लिए एक जगह है।

Equall.ai के एक प्रवक्ता ने एक ईमेल में कहा, "एलएलएम और अधिक व्यापक रूप से एआई सिस्टम का कानून के अभ्यास पर एक परिवर्तनकारी प्रभाव पड़ेगा जिसमें सीमांत उत्पादकता शामिल है लेकिन उससे भी आगे है।" रजिस्टर. “हमारा ध्यान वकीलों द्वारा निर्देशित और नियंत्रित एंड-टू-एंड कानूनी एआई सिस्टम बनाने पर है।

हमारा मानना ​​है कि कानूनी क्षेत्र के लिए विशेषीकृत प्रणालियाँ सामान्यवादी प्रणालियों की तुलना में बेहतर प्रदर्शन करेंगी

“हमारा विश्वास - डेटा और अनुभव के आधार पर - यह है कि कानूनी क्षेत्र के लिए विशेषीकृत प्रणालियाँ सामान्यवादी प्रणालियों की तुलना में बेहतर प्रदर्शन करेंगी। इसमें वकीलों को उस चीज़ पर ध्यान केंद्रित करने में मदद करने के लिए अधिक सटीकता और अधिक उपयोगी उपकरण शामिल हैं जो उन्हें सबसे अधिक पसंद है और जो सबसे अच्छा है, वह है कानूनी निर्णय लेना और सलाह के साथ अपने ग्राहकों की मदद करना।

अन्य संगठन भी एआई सहायता की उपयोगिता के बारे में इसी तरह आशावादी हैं। गोल्डमैन सैक्स पिछले साल अनुमानित [पीडीएफ] कि "वर्तमान कार्य कार्यों का एक-चौथाई अमेरिका में एआई द्वारा स्वचालित किया जा सकता है, विशेष रूप से प्रशासनिक (46 प्रतिशत) और कानूनी (44 प्रतिशत) व्यवसायों में उच्च जोखिम के साथ..." और स्टार्टअप जैसे बेंच आईक्यू, हार्वे.एआई, तथा सुरक्षित साइन टेक्नोलॉजीज उस प्रकार की भविष्यवाणी में बाज़ार का अवसर देखें।

व्हाइट एंड केस एलएलपी के पूर्व पार्टनर जॉर्ज मैटामोरोस द्वारा स्थापित इक्वल.एआई का तर्क है कि लगभग सभी कानूनी कार्य - अनुसंधान, दस्तावेज़ समीक्षा और विश्लेषण, संक्षेपण, और दस्तावेजों में प्रमुख अंशों की पहचान - एआई से लाभ उठा सकते हैं।

Equall.ai के प्रवक्ता ने आगे कहा, "हमारा मानना ​​है कि एलएलएम कई और रास्ते खोलता है, कुछ को हम आज देखते हैं, कई को अभी भी खोजना बाकी है।" उदाहरण के लिए, हमारा मानना ​​है कि एलएलएम डेटा प्रोसेसिंग पाइपलाइन और डेटा जेनरेशन दोनों के दृष्टिकोण में हमारे दृष्टिकोण को काफी हद तक बदल देगा, जो कानूनी अनुप्रयोगों के लिए महत्वपूर्ण होगा जहां उच्च गुणवत्ता वाला डेटा प्राप्त करना महंगा और मुश्किल है।

Equall.ai का विचार यह है कि AI मॉडल की अशुद्धियों को कम किया जा सकता है।

"एलएलएम संभाव्य मॉडल बने हुए हैं," बिज़ ने हमें बताया। “मतिभ्रम आम तौर पर एलएलएम के वितरण से बाहर होने का लक्षण है। दूसरे शब्दों में, जब उन विषयों और डेटा पर पाठ उत्पन्न करने के लिए कहा जाता है जो उस डेटा के समान होते हैं जिस पर एलएलएम को प्रशिक्षित किया गया था, तो एलएलएम उन चीजों के बारे में पूछे जाने की तुलना में काफी कम मतिभ्रम करते हैं जिनके बारे में उन्होंने बहुत कम सीखा है।

उदाहरण के लिए, वास्तविक वकीलों के साथ शाऊल के हमारे मूल्यांकन के दौरान, हम यह पुष्टि करने में सक्षम थे कि विशिष्ट कानूनी अवधारणाओं पर चर्चा करते समय मतिभ्रम की संभावना कम थी। संक्षेप में, हम उम्मीद करते हैं कि एलएलएम जो विशेष रूप से कानूनी डेटा पर प्रशिक्षित हैं, वे अपने सामान्य समकक्षों की तुलना में कानूनी विषयों पर बहुत कम मतिभ्रम करेंगे।

जैसा कि कहा गया है, अपस्टार्ट ने चेतावनी दी है कि एआई मॉडल पर इस तरह भरोसा नहीं किया जाना चाहिए जैसे कि वे एक कानूनी डेटाबेस हों, और एलएलएम के आउटपुट की दोबारा जांच करने की सलाह दी जाती है। हम कहेंगे: जाँच अनिवार्य है।

सॉलएम-7बी के पीछे के बोफिन्स - पियरे कोलंबो, टेल्मो पेसोआ पाइर्स, मलिक बौडियाफ़, डोमिनिक कल्वर, रुई मेलो, कैओ कोरो, आंद्रे एफटी मार्टिंस, फैब्रीज़ियो एस्पोसिटो, वेरा लूसिया रापोसो, सोफिया मोर्गाडो और माइकल डेसा - अपने काम का वर्णन करते हैं। एक पेपर शीर्षक "SaulLM-7B: कानून के लिए एक अग्रणी बड़ा भाषा मॉडल।"

एआई मॉडल सामुदायिक साइट हगिंगफेस पर उपलब्ध है, सॉलएम-7बी ओपन सोर्स मिस्ट्रल 7बी मॉडल पर आधारित है, दोनों में 7 बिलियन पैरामीटर हैं। यह जैसे मॉडलों की तुलना में काफी कम है लामा 2, जो 70 बिलियन मापदंडों तक पर आधारित हो सकता है। लेकिन SauLM-7B के रचनाकारों का कहना है कि यह केवल पहला मील का पत्थर है और विभिन्न मॉडल आकारों के साथ काम किया जा रहा है।

जैसा कि आप एलएलएम से उम्मीद करते हैं, सॉएलएम-7बी प्राकृतिक भाषा में प्रश्न पूछे जाने या संकेत दिए जाने पर काम करता है, और यह उनका उत्तर देने या प्रतिक्रिया देने का प्रयास करता है; इस मामले में, यह कानून और कानूनी मुद्दों पर केंद्रित है।

यूके स्थित कानूनी एआई स्टार्टअप सेफ साइन टेक्नोलॉजीज के सह-संस्थापक और मुख्य वैज्ञानिक जोनाथन श्वार्ज़ ने बताया रजिस्टर सॉलएम-7बी के निर्माताओं ने सामान्य एलएलएम में विशेषज्ञता के लिए एक समझदार दृष्टिकोण अपनाया है।

उन्होंने कहा, "अधिक मालिकाना तकनीकों के ओपन सोर्स विकल्प के रूप में यह एक अच्छी पेशकश है।" "हालांकि, ऐसा काम है जिसे करने की ज़रूरत है।"

अधिक मालिकाना तकनीकों के लिए एक ओपन सोर्स विकल्प के रूप में यह एक अच्छी पेशकश है

श्वार्ज़ ने रेड-टीमिंग मॉडल की आवश्यकता की ओर इशारा किया, उन्होंने कहा कि उनकी कंपनी आंतरिक रूप से ऐसा कर रही है।

हमें बताया गया है कि सेफ साइन टेक्नोलॉजीज ने एक कानूनी एलएलएम का प्रोटोटाइप तैयार किया है और इसका लक्ष्य इस साल के अंत में या उसके बाद भागीदारों के माध्यम से तैनाती के लिए दूसरा संस्करण तैयार करना है।

श्वार्ज़ ने कहा कि कंपनी अभी इस पर टिप्पणी करने के लिए तैयार नहीं है कि उसकी पेशकश किस हद तक खुला स्रोत या मालिकाना होगी। लेकिन उन्होंने दावा किया कि जबकि SaulLM-7B-इंस्ट्रक्ट - सामान्य और कानूनी निर्देशों पर आधारित एक संस्करण - लीगलबेंच-इंस्ट्रक्ट बेंचमार्क पर औसतन 0.61 स्कोर करने में कामयाब रहा, "हम 0.77 के करीब पहुंच रहे हैं।" वह सटीकता प्रतिशत GPT-4 के समान है, हालाँकि हम आपसे मशीन-लर्निंग बेंचमार्क के साथ कुछ नमक लेने का आग्रह करते हैं।

सेफ साइन टेक्नोलॉजीज के सह-संस्थापक और सीईओ अलेक्जेंडर (सामी) कार्डोस-न्यहेम ने एक साक्षात्कार में कहा, "यहां हमारी महत्वाकांक्षा एक एआई समाधान बनाने की थी जो हर व्यक्ति को बहुत अच्छी गुणवत्ता वाली कानूनी सलाह तुरंत दे।" रजिस्टर. “चैटजीपीटी या ऐसी किसी भी चीज़ से अविश्वसनीय कानूनी सलाह नहीं। लेकिन गंभीर कानूनी सलाह का आप वास्तव में एआई के माध्यम से उपयोग और भरोसा कर सकते हैं।"

आप इस सभी विषाक्त व्यवहार को सीखने की उस समस्या से बचते हैं जिसे आप बाद में ठीक करने का प्रयास कर रहे हैं

"बहुत, बहुत मोटे तौर पर, जिस तरह से इन तकनीकों, या इन तरीकों को आमतौर पर प्रशिक्षित किया जाता है, वह यह है कि आपके पास एक विशाल डेटा सेट है जिसे वेब पर प्रशिक्षित किया गया है और प्रत्येक प्रत्यक्ष प्रशिक्षण चरण का आप नमूना लेते हैं या आप बस उसका एक यादृच्छिक उपसमूह चुनते हैं," श्वार्ज़ ने समझाया। “तब आप बस उस सबसेट पर प्रशिक्षण लेते हैं और आप ऐसा खरबों बार करते हैं।

“बस एक यादृच्छिक उपसमुच्चय चुनने के बजाय, हमारे पास नए तरीके हैं जो प्रशिक्षण के प्रत्येक बिंदु पर यह निर्धारित करने का प्रयास करते हैं कि इस समय प्रशिक्षण के लिए डेटा का इष्टतम उपसमूह क्या है, ताकि मॉडल का सुधार अधिकतम हो। वह पहला कदम है. इस तरह आप इस विषाक्त व्यवहार को सीखने की उस समस्या से बच सकते हैं जिसे आप बाद में ठीक करने का प्रयास कर रहे हैं।

श्वार्ज़ ने सुझाव दिया कि सेफ साइन का दृष्टिकोण, अधिक सुरक्षित है। "ऐसे मामले में जहां एक विशिष्ट कानूनी प्रश्न है, मॉडल को यह नहीं पता कि कैसे उत्तर दिया जाए, आत्मविश्वास से गलत उत्तर देने के बजाय हम बस यह कह सकते हैं कि हम उस पर रोक लगा रहे हैं।"

उन्होंने ओपनएआई और गूगल द्वारा उठाए गए महासागर को उबालने के दृष्टिकोण के बारे में संदेह व्यक्त किया, जिसमें नस्लीय और लिंग पूर्वाग्रह जैसे व्यापक नुकसान पर ध्यान केंद्रित करना और अपने मॉडलों की प्रतिक्रियाओं को रैंक करने के लिए सस्ते ठेकेदारों को भुगतान करना शामिल है ताकि वे तंत्रिका नेटवर्क को फिर से प्रशिक्षित कर सकें। कम हानिकारक प्रतिक्रियाएँ दें।

श्वार्ज़ ने कहा, "यदि आप वह सब कुछ करने में सक्षम होना चाहते हैं जो एक इंसान कर सकता है, तो आपको उन सभी चीज़ों के विरुद्ध परीक्षण करना होगा जो एक इंसान कर सकता है।" "मुझे लगता है कि यदि आप सभी संभावित विषयों पर ऐसा करने का प्रयास कर रहे हैं तो यह एक तरह से हारने की रणनीति है।"

"न केवल कानूनी एआई में, बल्कि आम तौर पर, एआई में, हम सुरक्षा और मजबूती पर ध्यान केंद्रित नहीं कर रहे हैं जो चिकित्सा या कानूनी संदर्भ में गंभीर, विश्वसनीय प्रणालियों की अनुमति देता है," कार्डोस-न्यहेम ने कहा। ®

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी