شعار زيفيرنت

البدء مع Claude 3 Opus الذي دمر GPT-4 وGemini – KDnuggets

التاريخ:

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini
صورة المؤلف 

أطلقت Anthropic مؤخرًا سلسلة جديدة من نماذج الذكاء الاصطناعي التي تفوقت على كل من GPT-4 وGemini في الاختبارات المعيارية. مع نمو صناعة الذكاء الاصطناعي وتطورها السريع، تحقق نماذج كلود 3 خطوات كبيرة باعتبارها الشيء الكبير التالي في نماذج اللغات الكبيرة (LLMs).

في منشور المدونة هذا، سوف نستكشف معايير الأداء لنماذج كلود الثلاثة. سنتعرف أيضًا على واجهة برمجة تطبيقات Python الجديدة التي تدعم توليد الاستجابة البسيطة وغير المتزامنة والمتدفقة، إلى جانب إمكانات الرؤية المحسنة.

يعد كلود 3 قفزة كبيرة إلى الأمام في مجال تكنولوجيا الذكاء الاصطناعي. فهو يتفوق على أحدث نماذج اللغة في معايير التقييم المختلفة، بما في ذلك MMLU وGPQA وGSM8K، مما يدل على مستويات قريبة من الإنسان من الفهم والطلاقة في المهام المعقدة.

تأتي نماذج كلود 3 في ثلاثة أنواع: هايكو، السوناتة، والتأليف، ولكل منها قدراتها ونقاط قوتها الفريدة.

  1. الهايكو هو النموذج الأسرع والأكثر فعالية من حيث التكلفة، وهو قادر على قراءة ومعالجة الأوراق البحثية كثيفة المعلومات في أقل من ثلاث ثوان.
  2. السونيتة قصيدة من 14 بيتا أسرع مرتين من Claude 2 و2، ويتفوق في المهام التي تتطلب استجابات سريعة، مثل استرجاع المعرفة أو أتمتة المبيعات.
  3. أبوس يوفر سرعات مماثلة لكلود 2 و2.1 ولكن بمستويات ذكاء أعلى بكثير.

وفقًا للجدول أدناه، تفوقت Claude 3 Opus على GPT-4 وGemini Ultra في جميع معايير LLM، مما يجعلها الرائدة الجديدة في عالم الذكاء الاصطناعي.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini
الجدول من كلود 3 

إحدى التحسينات المهمة في نماذج Claude 3 هي قدرات الرؤية القوية. يمكنهم معالجة العديد من التنسيقات المرئية، بما في ذلك الصور والمخططات والرسوم البيانية والمخططات الفنية.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini
الجدول من كلود 3 

يمكنك البدء في استخدام أحدث طراز بالانتقال إلى https://www.anthropic.com/claude وإنشاء حساب جديد. إنه بسيط جدًا مقارنة بملعب OpenAI.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

  1. قبل أن نقوم بتثبيت حزمة بايثون، علينا أن نذهب إلى https://console.anthropic.com/dashboard والحصول على مفتاح API. 
    البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 
  2. بدلاً من توفير مفتاح API مباشرة لإنشاء كائن العميل، يمكنك تعيين متغير البيئة `ANTHROPIC_API_KEY` وتوفيره كمفتاح.
  3. قم بتثبيت حزمة Python "الإنسانية" باستخدام PIP.
pip install anthropic
  1. قم بإنشاء كائن العميل باستخدام مفتاح API. سوف نستخدم العميل لإنشاء النص والوصول إلى إمكانية الرؤية والبث.
import os
import anthropic
from IPython.display import Markdown, display

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)

دعونا نجرب واجهة برمجة تطبيقات Python القديمة لاختبار ما إذا كانت لا تزال تعمل أم لا. سنزود واجهة برمجة التطبيقات المكتملة باسم النموذج والحد الأقصى لطول الرمز المميز والموجه.

from anthropic import HUMAN_PROMPT, AI_PROMPT

completion = client.completions.create(
    model="claude-3-opus-20240229",
    max_tokens_to_sample=300,
    prompt=f"{HUMAN_PROMPT} How do I cook a original pasta?{AI_PROMPT}",
)
Markdown(completion.completion)

يظهر الخطأ أنه لا يمكننا استخدام واجهة برمجة التطبيقات القديمة للنموذج `claude-3-opus-20240229`. نحتاج إلى استخدام واجهة برمجة التطبيقات للرسائل بدلاً من ذلك.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

دعونا نستخدم واجهة برمجة تطبيقات الرسائل لإنشاء الاستجابة. بدلًا من المطالبة، علينا تزويد الوسيطة messages بقائمة من القواميس التي تحتوي على الدور والمحتوى.

Prompt = "Write the Julia code for the simple data analysis."
message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": Prompt}
    ]
)
Markdown(message.content[0].text)

سيؤدي استخدام IPython Markdown إلى عرض الاستجابة بتنسيق Markdown. وهذا يعني أنه سيُظهر النقاط وكتل التعليمات البرمجية والعناوين والروابط بطريقة نظيفة.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

يمكننا أيضًا توفير موجه النظام لتخصيص استجابتك. في حالتنا نطلب من كلود 3 أوبوس الرد باللغة الأردية.

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)

Prompt = "Write a blog about neural networks."

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    system="Respond only in Urdu.",
    messages=[
        {"role": "user", "content": Prompt}
    ]
)

Markdown(message.content[0].text)

نموذج Opus جيد جدًا. أعني أنني أستطيع أن أفهم ذلك بوضوح تام.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

تقوم واجهات برمجة التطبيقات المتزامنة بتنفيذ طلبات واجهة برمجة التطبيقات بشكل تسلسلي، وتحظر حتى تلقي استجابة قبل استدعاء المكالمة التالية. من ناحية أخرى، تسمح واجهات برمجة التطبيقات غير المتزامنة بطلبات متزامنة متعددة دون حظر، مما يجعلها أكثر كفاءة وقابلة للتطوير.

  1. يتعين علينا إنشاء عميل Async Anthropic.
  2. قم بإنشاء الوظيفة الرئيسية باستخدام غير متزامن.
  3. قم بإنشاء الاستجابة باستخدام بناء جملة الانتظار.
  4. قم بتشغيل الوظيفة الرئيسية باستخدام بناء جملة الانتظار.
import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)


async def main() -> None:

    Prompt = "What is LLMOps and how do I start learning it?"
       
    message = await client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": Prompt,
            }
        ],
        model="claude-3-opus-20240229",
    )
    display(Markdown(message.content[0].text))


await main()

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

ملحوظة: إذا كنت تستخدم غير متزامن في Jupyter Notebook، فحاول استخدام انتظار main()، بدلاً من asyncio.run(main())

البث هو أسلوب يتيح معالجة مخرجات نموذج اللغة بمجرد توفرها، دون انتظار الاستجابة الكاملة. تعمل هذه الطريقة على تقليل زمن الوصول المتصور عن طريق إرجاع رمز الإخراج المميز برمز مميز، بدلاً من إرجاعه مرة واحدة.

بدلاً من "messages.create"، سنستخدم "messages.stream" لتدفق الاستجابة وسنستخدم حلقة لعرض كلمات متعددة من الرد بمجرد توفرها.

from anthropic import Anthropic

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)


Prompt = "Write a mermaid code for typical MLOps workflow."


completion = client.messages.stream(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": Prompt,
        }
    ],
    model="claude-3-opus-20240229",
)

with completion as stream:
    for text in stream.text_stream:
            print(text, end="", flush=True)

وكما نرى، فإننا نولد الاستجابة بسرعة كبيرة.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

يمكننا استخدام وظيفة غير متزامنة مع البث أيضًا. كل ما عليك فعله هو أن تكون مبدعًا وأن تجمع بينهما.

import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic()

async def main() -> None:
   
    completion = client.messages.stream(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": Prompt,
            }
        ],
        model="claude-3-opus-20240229",
    )
    async with completion as stream:
        async for text in stream.text_stream:
            print(text, end="", flush=True)

await main()

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

لقد تحسنت رؤية Claude 3 بمرور الوقت، وللحصول على الاستجابة، ما عليك سوى تقديم نوع الصورة الأساسي 64 إلى واجهة برمجة تطبيقات الرسائل.

في هذا المثال سنستخدم الزنبق (الصورة 1) و طيور النحام (الصورة 2) صور من موقع Pexel.com لتوليد الرد عن طريق طرح أسئلة حول الصورة.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

سنستخدم مكتبة "httpx" لجلب الصورتين من موقع pexel.com وتحويلهما إلى ترميز base64.

import anthropic
import base64
import httpx

client = anthropic.Anthropic()

media_type = "image/jpeg"

img_url_1 = "https://images.pexels.com/photos/20230232/pexels-photo-20230232/free-photo-of-tulips-in-a-vase-against-a-green-background.jpeg"

image_data_1 = base64.b64encode(httpx.get(img_url_1).content).decode("utf-8")

img_url_2 = "https://images.pexels.com/photos/20255306/pexels-photo-20255306/free-photo-of-flamingos-in-the-water.jpeg"

image_data_2 = base64.b64encode(httpx.get(img_url_2).content).decode("utf-8")

نحن نقدم صورًا مشفرة بـ base64 إلى واجهة برمجة تطبيقات الرسائل في كتل محتوى الصورة. يرجى اتباع نمط الترميز الموضح أدناه لإنشاء الاستجابة بنجاح.

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_1,
                    },
                },
                {
                    "type": "text",
                    "text": "Write a poem using this image."
                }
            ],
        }
    ],
)
Markdown(message.content[0].text)

وصلنا قصيدة جميلة عن زهرة التوليب.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

دعونا نحاول تحميل صور متعددة إلى نفس واجهة برمجة تطبيقات رسائل Claude 3.

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Image 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_1,
                    },
                },
                {
                    "type": "text",
                    "text": "Image 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_2,
                    },
                },
                {
                    "type": "text",
                    "text": "Write a short story using these images."
                }
            ],
        }
    ],
)
Markdown(message.content[0].text)

لدينا قصة قصيرة عن حديقة التوليب وطيور النحام.

البدء مع Claude 3 Opus الذي دمر للتو GPT-4 وGemini 

إذا كنت تواجه مشكلة في تشغيل التعليمات البرمجية، فإليك أ مساحة عمل Deepnote حيث يمكنك مراجعة الكود وتشغيله بنفسك.

أعتقد أن Claude 3 Opus نموذج واعد، على الرغم من أنه قد لا يكون بنفس سرعة GPT-4 وGemini. أعتقد أن المستخدمين المدفوعين قد يتمتعون بسرعات أفضل.

في هذا البرنامج التعليمي، تعرفنا على سلسلة النماذج الجديدة من Anthropic والتي تسمى Claude 3، وقمنا بمراجعة معاييرها واختبار قدراتها على الرؤية. لقد تعلمنا أيضًا كيفية إنشاء استجابات بسيطة وغير متزامنة ومتدفقة. من السابق لأوانه القول ما إذا كان هذا هو أفضل ماجستير في القانون على الإطلاق، ولكن إذا نظرنا إلى معايير الاختبار الرسمية، فلدينا ملك جديد على عرش الذكاء الاصطناعي.

 
 

عابد علي عوان (@ 1abidaliawan) هو عالم بيانات متخصص محترف يحب بناء نماذج التعلم الآلي. يركز حاليًا على إنشاء المحتوى وكتابة مدونات تقنية حول تقنيات التعلم الآلي وعلوم البيانات. عابد حاصل على درجة الماجستير في إدارة التكنولوجيا ودرجة البكالوريوس في هندسة الاتصالات. تتمثل رؤيته في بناء منتج للذكاء الاصطناعي باستخدام شبكة عصبية بيانية للطلاب الذين يعانون من مرض عقلي.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة