Zephyrnet Logosu

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken – KDnuggets

Tarih:

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken
Yazara göre resim 

Anthropic yakın zamanda kıyaslama testlerinde hem GPT-4'ü hem de Gemini'yi geride bırakan yeni bir AI modeli serisini piyasaya sürdü. Yapay zeka endüstrisinin hızla büyümesi ve gelişmesiyle birlikte Claude 3 modelleri, Büyük Dil Modellerinde (LLM'ler) bir sonraki büyük adım olarak önemli ilerlemeler kaydediyor.

Bu blog yazısında Claude'un 3 modelinin performans kıyaslamalarını inceleyeceğiz. Ayrıca basit, eşzamansız ve akış yanıtı oluşturmayı destekleyen yeni Python API'sinin yanı sıra gelişmiş görme yetenekleri hakkında da bilgi edineceğiz.

Claude 3, yapay zeka teknolojisi alanında önemli bir atılımdır. MMLU, GPQA ve GSM8K dahil olmak üzere çeşitli değerlendirme kriterlerinde son teknoloji ürünü dil modellerinden daha iyi performans göstererek karmaşık görevlerde insana yakın düzeyde kavrama ve akıcılık sergiler.

Claude 3 modellerinin üç çeşidi vardır: Haiku, Sonnet ve Opus, her birinin kendine özgü yetenekleri ve güçlü yanları var.

  1. Haiku bilgi yoğun araştırma makalelerini üç saniyeden daha kısa sürede okuyabilen ve işleyebilen en hızlı ve en uygun maliyetli modeldir.
  2. Sone Claude 2 ve 2'den 2.1 kat daha hızlıdır ve bilgi erişimi veya satış otomasyonu gibi hızlı yanıtlar gerektiren görevlerde mükemmeldir.
  3. opus Claude 2 ve 2.1'e benzer hızlar sunar ancak çok daha yüksek zeka seviyelerine sahiptir.

Aşağıdaki tabloya göre Claude 3 Opus, tüm Yüksek Lisans kıyaslamalarında GPT-4 ve Gemini Ultra'dan daha iyi performans göstererek onu yapay zeka dünyasının yeni lideri haline getirdi.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken
Tablo Claudia 3 

Claude 3 modellerindeki önemli gelişmelerden biri de güçlü görme yetenekleridir. Fotoğraflar, çizelgeler, grafikler ve teknik diyagramlar dahil olmak üzere çeşitli görsel formatları işleyebilirler.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken
Tablo Claudia 3 

adresine giderek en son modeli kullanmaya başlayabilirsiniz. https://www.anthropic.com/claude ve yeni bir hesap oluşturuyoruz. OpenAI oyun alanına kıyasla oldukça basittir.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

  1. Python Paketini kurmadan önce şuraya gitmemiz gerekiyor: https://console.anthropic.com/dashboard ve API anahtarını alın. 
    GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 
  2. İstemci nesnesini oluşturmak için doğrudan API anahtarını sağlamak yerine, 'ANTHROPIC_API_KEY' ortam değişkenini ayarlayabilir ve bunu anahtar olarak sağlayabilirsiniz.
  3. PIP kullanarak 'antropik' Python paketini yükleyin.
pip install anthropic
  1. API anahtarını kullanarak istemci nesnesini oluşturun. İstemciyi metin oluşturma, erişim görme yeteneği ve akış için kullanacağız.
import os
import anthropic
from IPython.display import Markdown, display

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)

Hala çalışıp çalışmadığını test etmek için eski Python API'sini deneyelim. Tamamlama API'sine model adını, maksimum belirteç uzunluğunu ve istemi sağlayacağız.

from anthropic import HUMAN_PROMPT, AI_PROMPT

completion = client.completions.create(
    model="claude-3-opus-20240229",
    max_tokens_to_sample=300,
    prompt=f"{HUMAN_PROMPT} How do I cook a original pasta?{AI_PROMPT}",
)
Markdown(completion.completion)

Hata, "claude-3-opus-20240229" modeli için eski API'yi kullanamayacağımızı gösteriyor. Bunun yerine Mesajlar API'sini kullanmamız gerekiyor.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Yanıtı oluşturmak için Mesajlar API'sini kullanalım. İstem yerine, mesaj argümanına rolü ve içeriği içeren sözlüklerin bir listesini sağlamalıyız.

Prompt = "Write the Julia code for the simple data analysis."
message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": Prompt}
    ]
)
Markdown(message.content[0].text)

IPython Markdown kullanıldığında yanıt Markdown formatında görüntülenecektir. Bu, madde işaretlerini, kod bloklarını, başlıkları ve bağlantıları temiz bir şekilde göstereceği anlamına gelir.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Yanıtınızı özelleştirmeniz için bir sistem istemi de sağlayabiliriz. Bizim durumumuzda Claude 3 Opus'tan Urdu dilinde yanıt vermesini istiyoruz.

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)

Prompt = "Write a blog about neural networks."

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    system="Respond only in Urdu.",
    messages=[
        {"role": "user", "content": Prompt}
    ]
)

Markdown(message.content[0].text)

Opus modeli oldukça iyi. Yani gayet net anlayabiliyorum.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Senkronize API'ler, API isteklerini sırayla yürütür ve bir sonraki çağrıyı başlatmadan önce bir yanıt alınana kadar bloke eder. Öte yandan, eşzamansız API'ler, birden fazla eşzamanlı isteği engellemeden izin vererek bunları daha verimli ve ölçeklenebilir hale getirir.

  1. Async Anthropic istemcisi oluşturmamız gerekiyor.
  2. Ana işlevi async ile oluşturun.
  3. Bekleme sözdizimini kullanarak yanıtı oluşturun.
  4. Bekleme sözdizimini kullanarak ana işlevi çalıştırın.
import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)


async def main() -> None:

    Prompt = "What is LLMOps and how do I start learning it?"
       
    message = await client.messages.create(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": Prompt,
            }
        ],
        model="claude-3-opus-20240229",
    )
    display(Markdown(message.content[0].text))


await main()

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Not: Jupyter Notebook'ta eşzamansız kullanıyorsanız, asyncio.run(main()) yerine wait main() kullanmayı deneyin.

Akış, bir Dil Modeli çıktısının, tam yanıt beklenmeden, kullanılabilir hale gelir gelmez işlenmesini sağlayan bir yaklaşımdır. Bu yöntem, çıktı jetonunu tek seferde döndürmek yerine jeton bazında döndürerek algılanan gecikmeyi en aza indirir.

Yanıt akışı için "messages.create" yerine "messages.stream"i kullanacağız ve yanıttaki birden fazla kelimeyi kullanılabilir oldukları anda görüntülemek için bir döngü kullanacağız.

from anthropic import Anthropic

client = anthropic.Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
)


Prompt = "Write a mermaid code for typical MLOps workflow."


completion = client.messages.stream(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": Prompt,
        }
    ],
    model="claude-3-opus-20240229",
)

with completion as stream:
    for text in stream.text_stream:
            print(text, end="", flush=True)

Gördüğümüz gibi oldukça hızlı bir şekilde yanıt üretiyoruz.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Akışla birlikte eşzamansız bir işlev de kullanabiliriz. Sadece yaratıcı olmanız ve bunları birleştirmeniz gerekiyor.

import asyncio
from anthropic import AsyncAnthropic

client = AsyncAnthropic()

async def main() -> None:
   
    completion = client.messages.stream(
        max_tokens=1024,
        messages=[
            {
                "role": "user",
                "content": Prompt,
            }
        ],
        model="claude-3-opus-20240229",
    )
    async with completion as stream:
        async for text in stream.text_stream:
            print(text, end="", flush=True)

await main()

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Claude 3 Vision zamanla daha iyi hale geldi ve yanıt almak için mesaj API'sine base64 türündeki görüntüyü sağlamanız yeterli.

Bu örnekte kullanacağımız Laleler (Resim 1) ve Flamingolar (Resim 2) Pexel.com'dan fotoğraflara görselle ilgili sorular sorarak yanıt oluşturmak.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Her iki görseli de pexel.com'dan almak ve bunları base64 kodlamasına dönüştürmek için 'httpx' kütüphanesini kullanacağız.

import anthropic
import base64
import httpx

client = anthropic.Anthropic()

media_type = "image/jpeg"

img_url_1 = "https://images.pexels.com/photos/20230232/pexels-photo-20230232/free-photo-of-tulips-in-a-vase-against-a-green-background.jpeg"

image_data_1 = base64.b64encode(httpx.get(img_url_1).content).decode("utf-8")

img_url_2 = "https://images.pexels.com/photos/20255306/pexels-photo-20255306/free-photo-of-flamingos-in-the-water.jpeg"

image_data_2 = base64.b64encode(httpx.get(img_url_2).content).decode("utf-8")

Image içerik bloklarında mesaj API'sine base64 kodlu görseller sağlıyoruz. Yanıtı başarıyla oluşturmak için lütfen aşağıda gösterilen kodlama modelini izleyin.

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_1,
                    },
                },
                {
                    "type": "text",
                    "text": "Write a poem using this image."
                }
            ],
        }
    ],
)
Markdown(message.content[0].text)

Lalelerle ilgili güzel bir şiirimiz var.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Aynı Claude 3 mesaj API'sine birden fazla resim yüklemeyi deneyelim.

message = client.messages.create(
    model="claude-3-opus-20240229",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Image 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_1,
                    },
                },
                {
                    "type": "text",
                    "text": "Image 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": media_type,
                        "data": image_data_2,
                    },
                },
                {
                    "type": "text",
                    "text": "Write a short story using these images."
                }
            ],
        }
    ],
)
Markdown(message.content[0].text)

Lale ve Flamingo Bahçesi ile ilgili kısa bir hikayemiz var.

GPT-3 ve Gemini'yi Yok Eden Claude 4 Opus'a Başlarken 

Kodu çalıştırmada sorun yaşıyorsanız, işte Derin not çalışma alanı Kodu kendiniz inceleyip çalıştırabileceğiniz yer.

Claude 3 Opus'un gelecek vaat eden bir model olduğunu düşünüyorum, ancak GPT-4 ve Gemini kadar hızlı olmayabilir. Ücretli kullanıcıların daha iyi hızlara sahip olabileceğine inanıyorum.

Bu eğitimde Anthropic'in Claude 3 adlı yeni model serisini öğrendik, karşılaştırmalı değerlendirmesini inceledik ve görüş yeteneklerini test ettik. Ayrıca basit, eşzamansız ve akış yanıtları oluşturmayı da öğrendik. Piyasadaki en iyi LLM olup olmadığını söylemek için henüz çok erken, ancak resmi test kriterlerine bakarsak, AI tahtında yeni bir kralımız var.

 
 

Abid Ali Avan (@1abidaliwan), makine öğrenimi modelleri oluşturmayı seven sertifikalı bir veri bilimcisi uzmanıdır. Şu anda, makine öğrenimi ve veri bilimi teknolojileri üzerine içerik oluşturmaya ve teknik bloglar yazmaya odaklanıyor. Abid, Teknoloji Yönetimi alanında yüksek lisans ve Telekomünikasyon Mühendisliği alanında lisans derecesine sahiptir. Vizyonu, akıl hastalığı ile mücadele eden öğrenciler için bir grafik sinir ağı kullanarak bir AI ürünü oluşturmaktır.

spot_img

En Son İstihbarat

spot_img