شعار زيفيرنت

4 خطوات لتصبح مطورًا إبداعيًا للذكاء الاصطناعي - KDnuggets

التاريخ:

4 خطوات لتصبح مطورًا إبداعيًا للذكاء الاصطناعي
يقدم سام ألتمان، الرئيس التنفيذي لشركة OpenAI، أرقام استخدام المنتج في يوم مطور OpenAI في أكتوبر 2023. وتأخذ OpenAI في الاعتبار ثلاث شرائح من العملاء: المطورين والشركات والمستخدمين العامين. الرابط: https://www.youtube.com/watch?v=U9mJuUkhUzk&t=120s
 

في يوم مطوري OpenAI في أكتوبر 2023، سام ألتمان، الرئيس التنفيذي لشركة OpenAI، أظهرت شريحة على استخدام المنتج عبر ثلاث شرائح مختلفة من العملاء: المطورين والشركات والمستخدمين العامين.

في هذه المقالة، سنركز على قطاع المطورين. سنغطي ما يفعله مطور الذكاء الاصطناعي الإبداعي، وما هي الأدوات التي تحتاجها لإتقان هذه الوظيفة، وكيفية البدء.

في حين أن عددًا قليلاً من الشركات مكرسة لصنع منتجات الذكاء الاصطناعي التوليدية، فإن معظم مطوري الذكاء الاصطناعي التوليدي يعملون في شركات أخرى حيث لم يكن هذا هو التركيز التقليدي. 

والسبب في ذلك هو أن الذكاء الاصطناعي التوليدي له استخدامات تنطبق على مجموعة واسعة من الشركات. تنطبق أربعة استخدامات شائعة للذكاء الاصطناعي التوليدي على معظم الشركات. 

Chatbots

4 خطوات لتصبح مطورًا إبداعيًا للذكاء الاصطناعي
الصورة تم إنشاؤها بواسطة DALL·E 3
 

في حين أن برامج الدردشة الآلية كانت سائدة لأكثر من عقد من الزمن، إلا أن غالبيتها كانت فظيعة. عادة، التفاعل الأول الأكثر شيوعًا مع برنامج الدردشة الآلي هو سؤاله عما إذا كان بإمكانك التحدث إلى إنسان.

إن التقدم في الذكاء الاصطناعي التوليدي، وخاصة نماذج اللغات الكبيرة وقواعد البيانات المتجهة، يعني أن هذا لم يعد صحيحا. الآن بعد أن أصبح استخدام روبوتات الدردشة أمرًا ممتعًا للعملاء، أصبحت كل شركة مشغولة (أو على الأقل ينبغي أن تكون مشغولة) تسعى إلى ترقيتها.

المقالة تأثير الذكاء الاصطناعي التوليدي على روبوتات الدردشة يقدم موقع MIT Technology Review نظرة عامة جيدة حول كيفية تغير عالم روبوتات الدردشة.

البحث الدلالي

يتم استخدام البحث في مجموعة واسعة من الأماكن، بدءًا من المستندات وحتى مواقع التسوق وحتى الإنترنت نفسه. تقليديًا، تستخدم محركات البحث الكلمات الرئيسية بكثرة، مما يخلق مشكلة أن محرك البحث يحتاج إلى البرمجة ليكون على دراية بالمرادفات.

على سبيل المثال، خذ بعين الاعتبار حالة محاولة البحث من خلال تقرير تسويقي للعثور على الجزء المتعلق بتجزئة العملاء. اضغط على CMD+F، واكتب "تقسيم"، وقم بالتنقل بين النتائج حتى تجد شيئًا ما. لسوء الحظ، فاتتك الحالات التي كتب فيها مؤلف المستند "التصنيف" بدلاً من "التجزئة".

البحث الدلالي (البحث في معنى) يحل مشكلة المرادفات هذه من خلال البحث تلقائيًا عن نص يحمل معاني مماثلة. تتمثل الفكرة في استخدام نموذج التضمين — نموذج التعلم العميق الذي يحول النص إلى متجه رقمي وفقًا لمعناه — ومن ثم فإن العثور على النص ذي الصلة هو مجرد جبر خطي بسيط. والأفضل من ذلك، أن العديد من نماذج التضمين تسمح بأنواع بيانات أخرى مثل الصور والصوت والفيديو كمدخلات، مما يتيح لك توفير أنواع مختلفة من بيانات الإدخال أو أنواع بيانات الإخراج لبحثك.

كما هو الحال مع برامج الدردشة الآلية، تحاول العديد من الشركات تحسين قدرات البحث في مواقع الويب الخاصة بها من خلال الاستفادة من البحث الدلالي.

هذا البرنامج التعليمي على البحث الدلالي توفر شركة Zillus، الشركة المصنعة لقاعدة بيانات Milvus Vector، وصفًا جيدًا لحالات الاستخدام.

محتوى شخصي

4 خطوات لتصبح مطورًا إبداعيًا للذكاء الاصطناعي
الصورة تم إنشاؤها بواسطة DALL·E 3
 

الذكاء الاصطناعي التوليدي يجعل إنشاء المحتوى أرخص. وهذا يجعل من الممكن إنشاء محتوى مخصص لمجموعات مختلفة من المستخدمين. بعض الأمثلة الشائعة هي تغيير النسخة التسويقية أو أوصاف المنتج اعتمادًا على ما تعرفه عن المستخدم. يمكنك أيضًا توفير الترجمات لجعل المحتوى أكثر ملاءمة لمختلف البلدان أو التركيبة السكانية.

هذه المادة على كيفية تحقيق التخصيص الفائق باستخدام منصات الذكاء الاصطناعي التوليدية من رئيس المبشرين الرقميين في Salesforce، فالا أفشار، يغطي فوائد وتحديات استخدام الذكاء الاصطناعي التوليدي لتخصيص المحتوى.

واجهات اللغة الطبيعية للبرمجيات

نظرًا لأن البرامج أصبحت أكثر تعقيدًا وكاملة الميزات، فإن واجهة المستخدم تمتلئ بالقوائم والأزرار والأدوات التي لا يمكن للمستخدمين العثور عليها أو معرفة كيفية استخدامها. يمكن لواجهات اللغة الطبيعية، حيث يرغب المستخدمون في شرح ما يريدون في جملة، أن تحسن بشكل كبير من سهولة استخدام البرامج. يمكن أن تشير "واجهة اللغة الطبيعية" إلى الطرق المنطوقة أو المكتوبة للتحكم في البرامج. المفتاح هو أنه يمكنك استخدام جمل قياسية مفهومة للإنسان.

تعد منصات ذكاء الأعمال من بين أوائل الجهات التي تبنّت هذا الأمر، حيث تساعد واجهات اللغة الطبيعية محللي الأعمال على كتابة تعليمات برمجية أقل لمعالجة البيانات. ومع ذلك، فإن تطبيقات ذلك لا حدود لها إلى حد ما: يمكن لكل برنامج غني بالميزات تقريبًا الاستفادة من واجهة اللغة الطبيعية.

هذه المقالة فوربس على احتضان الذكاء الاصطناعي وواجهات اللغة الطبيعية من غوراف تيواري، المؤسس والشريك الإداري لشركة Omega Venture Partners، لديه وصف سهل القراءة حول السبب الذي يجعل واجهات اللغة الطبيعية تساعد في سهولة استخدام البرامج.

أولاً، أنت بحاجة إلى نموذج ذكاء اصطناعي توليدي! للعمل مع النص، وهذا يعني نموذج لغة كبير. يعد GPT 4.0 هو المعيار الذهبي الحالي للأداء، ولكن هناك العديد من البدائل مفتوحة المصدر مثل Llama 2 وFalcon وMistral. 

ثانيا، أنت بحاجة إلى قاعدة بيانات المتجهات. Pinecone هي قاعدة بيانات المتجهات التجارية الأكثر شيوعًا، وهناك بعض البدائل مفتوحة المصدر مثل Milvus وWeaviate وChroma.

فيما يتعلق بلغة البرمجة، يبدو أن المجتمع قد استقر حول Python وJavaScript. تعد JavaScript مهمة لتطبيقات الويب، أما لغة Python فهي مناسبة لأي شخص آخر.

علاوة على ذلك، من المفيد استخدام إطار عمل تطبيق الذكاء الاصطناعي التوليدي. المتنافسان الرئيسيان هما LangChain وLlamaIndex. LangChain هو إطار أوسع يسمح لك بتطوير مجموعة واسعة من تطبيقات الذكاء الاصطناعي التوليدية، ويركز LlamaIndex بشكل أكثر إحكامًا على تطوير تطبيقات البحث الدلالي. 

إذا كنت تقوم بإنشاء تطبيق بحث، استخدم LlamaIndex؛ بخلاف ذلك، استخدم LangChain.

ومن الجدير بالذكر أن المشهد يتغير بسرعة كبيرة، وأن العديد من الشركات الناشئة الجديدة في مجال الذكاء الاصطناعي تظهر كل أسبوع، إلى جانب أدوات جديدة. إذا كنت ترغب في تطوير تطبيق ما، فتوقع تغيير أجزاء من حزمة البرامج بشكل متكرر أكثر مما تفعله مع التطبيقات الأخرى.

على وجه الخصوص، تظهر نماذج جديدة بانتظام، ومن المرجح أن يتغير الأداء الأفضل لحالة الاستخدام الخاصة بك. أحد مسارات العمل الشائعة هو البدء في استخدام واجهات برمجة التطبيقات (على سبيل المثال، OpenAI API لواجهة برمجة التطبيقات وPinecone API لقاعدة بيانات المتجهات) نظرًا لسرعة تطويرها. مع نمو قاعدة المستخدمين الخاصة بك، يمكن أن تصبح تكلفة استدعاءات واجهة برمجة التطبيقات (API) مرهقة، لذا في هذه المرحلة، قد ترغب في التبديل إلى أدوات مفتوحة المصدر (يعد النظام البيئي Hugging Face خيارًا جيدًا هنا).

كما هو الحال مع أي مشروع جديد، ابدأ ببساطة! من الأفضل أن تتعلم أداة واحدة في كل مرة ثم تكتشف لاحقًا كيفية الجمع بينها.

الخطوة الأولى هي إعداد حسابات لأي أدوات تريد استخدامها. ستحتاج إلى حسابات المطورين ومفاتيح واجهة برمجة التطبيقات (API) للاستفادة من الأنظمة الأساسية.

دليل المبتدئين إلى واجهة برمجة تطبيقات OpenAI: برنامج تعليمي عملي وأفضل الممارسات يحتوي على تعليمات خطوة بخطوة حول إعداد حساب مطور OpenAI وإنشاء مفتاح API.

وبالمثل، إتقان قواعد بيانات المتجهات باستخدام البرنامج التعليمي لكوز الصنوبر: دليل شامل يحتوي على تفاصيل إعداد Pinecone.

ما هو عناق الوجه؟ واحة مجتمع الذكاء الاصطناعي مفتوحة المصدر يشرح كيفية البدء باستخدام Hugging Face.

تعلم ماجستير إدارة الأعمال

للبدء في استخدام LLMs مثل GPT برمجيًا، فإن أبسط شيء هو معرفة كيفية الاتصال بواجهة برمجة التطبيقات (API) لإرسال مطالبة وتلقي رسالة. 

في حين أنه يمكن تحقيق العديد من المهام باستخدام تبادل واحد ذهابًا وإيابًا مع LLM، فإن حالات الاستخدام مثل برامج الدردشة الآلية تتطلب محادثة طويلة. أعلنت شركة OpenAI مؤخرًا عن ميزة "المواضيع" كجزء من واجهة برمجة تطبيقات المساعدين الخاصة بها، والتي يمكنك التعرف عليها في البرنامج التعليمي لـ OpenAI Assistants API

هذا غير مدعوم من قبل كل ماجستير إدارة الأعمال، لذلك قد تحتاج أيضًا إلى معرفة كيفية إدارة حالة المحادثة يدويًا. على سبيل المثال، يتعين عليك تحديد أي من الرسائل السابقة في المحادثة لا تزال ذات صلة بالمحادثة الحالية.

أبعد من ذلك، ليست هناك حاجة للتوقف عند العمل مع النص فقط. يمكنك تجربة العمل مع وسائط أخرى؛ على سبيل المثال، نسخ الصوت (الكلام إلى نص) أو إنشاء صور من النص.

تعلم قواعد بيانات المتجهات

إن أبسط حالة استخدام لقواعد البيانات المتجهة هي البحث الدلالي. هنا، يمكنك استخدام نموذج التضمين (انظر مقدمة إلى تضمين النص باستخدام OpenAI API) الذي يحول النص (أو أي مدخلات أخرى) إلى متجه رقمي يمثل معناه.

تقوم بعد ذلك بإدراج بياناتك المضمنة (المتجهات الرقمية) في قاعدة بيانات المتجهات. البحث يعني فقط كتابة استعلام بحث، والسؤال عن الإدخالات الموجودة في قاعدة البيانات التي تتوافق بشكل وثيق مع الشيء الذي طلبته.

على سبيل المثال، يمكنك أخذ بعض الأسئلة الشائعة حول أحد منتجات شركتك وتضمينها وتحميلها إلى قاعدة بيانات متجهة. بعد ذلك، تطرح سؤالاً حول المنتج، وسيقوم بإرجاع أقرب التطابقات، ويتحول مرة أخرى من متجه رقمي إلى النص الأصلي.

الجمع بين LLMs وقواعد بيانات المتجهات

قد تجد أن إرجاع إدخال النص مباشرةً من قاعدة بيانات المتجهات ليس كافيًا. في كثير من الأحيان، تريد معالجة النص بطريقة تجيب على الاستعلام بشكل أكثر طبيعية.

الحل لهذه المشكلة هو تقنية تعرف باسم الجيل المعزز للاسترجاع (RAG). وهذا يعني أنه بعد استرداد النص الخاص بك من قاعدة بيانات المتجهات، يمكنك كتابة مطالبة للحصول على LLM، ثم تضمين النص المسترد في المطالبة الخاصة بك (أنت زيادة موجه مع استرجاع نص). بعد ذلك، تطلب من LLM أن يكتب إجابة يمكن قراءتها بواسطة الإنسان.

في مثال الإجابة على أسئلة المستخدم من الأسئلة الشائعة، يمكنك كتابة مطالبة باستخدام العناصر النائبة، كما يلي.

"""
Please answer the user's question about {product}.
---
The user's question is : {query}
---
The answer can be found in the following text: {retrieved_faq}
"""

 

الخطوة الأخيرة هي الجمع بين مهارات RAG لديك والقدرة على إدارة سلاسل الرسائل لإجراء محادثة أطول. هاهو! لديك روبوت الدردشة!

يحتوي DataCamp على سلسلة من تسعة رموز متوازية ليعلمك أن تصبح مطورًا مبدعًا للذكاء الاصطناعي. أنت بحاجة إلى مهارات بايثون الأساسية للبدء، ولكن يتم تدريس جميع مفاهيم الذكاء الاصطناعي من الصفر.

يتم تدريس هذه السلسلة من قبل كبار المدربين من Microsoft، وPinecone، وImperial College London، وFidelity (وأنا!).

ستتعرف على جميع المواضيع التي تتناولها هذه المقالة، مع ستة أكواد برمجية تركز على المجموعة التجارية لـ OpenAI API، وPinecone API، وLangChain. تركز البرامج التعليمية الثلاثة الأخرى على نماذج Hugging Face.

بحلول نهاية السلسلة، ستكون قادرًا على إنشاء روبوت الدردشة وبناء تطبيقات البرمجة اللغوية العصبية (NLP) ورؤية الكمبيوتر.
 
 

ريتشي قطن هو مبشر البيانات في DataCamp. وهو مضيف بودكاست DataFramed، وقد كتب كتابين عن برمجة R، وأنشأ 2 دورات DataCamp حول علوم البيانات التي شارك فيها أكثر من 10 ألف متعلم.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة