Yazara göre resim
Gemini, Google'ın geliştirdiği yeni bir model ve Bard yeniden kullanılabilir hale geliyor. Gemini ile artık sorularınıza resim, ses ve metin sunarak neredeyse mükemmel yanıtlar almanız mümkün.
Bu eğitimde Gemini API'sini ve makinenize nasıl kurulacağını öğreneceğiz. Ayrıca metin oluşturma ve görüntü anlama dahil olmak üzere çeşitli Python API işlevlerini de inceleyeceğiz.
İkizler burcu Google Research ve Google DeepMind dahil olmak üzere Google'daki ekiplerin işbirliğiyle geliştirilen yeni bir yapay zeka modelidir. Özellikle çok modlu olacak şekilde tasarlanmıştır; yani metin, kod, ses, görüntü ve video gibi farklı veri türlerini anlayabilir ve bunlarla çalışabilir.
Gemini, Google'ın bugüne kadar geliştirdiği en gelişmiş ve en büyük yapay zeka modelidir. Veri merkezlerinden mobil cihazlara kadar çok çeşitli sistemlerde verimli bir şekilde çalışabilmesi için son derece esnek olacak şekilde tasarlanmıştır. Bu, işletmelerin ve geliştiricilerin yapay zeka uygulamaları oluşturma ve ölçeklendirme biçiminde devrim yaratma potansiyeline sahip olduğu anlamına gelir.
Gemini modelinin farklı kullanım durumları için tasarlanmış üç versiyonu:
- İkizler Ultra: Karmaşık görevleri yerine getirebilen en büyük ve en gelişmiş yapay zeka.
- İkizler Pro: İyi performansa ve ölçeklenebilirliğe sahip dengeli bir model.
- İkizler Nano: Mobil cihazlar için en verimlisi.
Image İkizler burcuyla tanışın
Gemini Ultra, çeşitli ölçümlerde GPT-4'ün performansını aşan son teknoloji ürünü bir performansa sahiptir. Bu, 57 farklı konuda dünya bilgisini ve problem çözmeyi test eden Massive Multitask Language Understanding kriterinde insan uzmanlardan daha iyi performans gösteren ilk modeldir. Bu onun gelişmiş anlayış ve problem çözme yeteneklerini gösterir.
API'yi kullanmak için öncelikle buradan alabileceğiniz bir API anahtarı almamız gerekiyor: https://ai.google.dev/tutorials/setup
Bundan sonra “API anahtarı al” butonuna tıklayın ve ardından “Yeni projede API anahtarı oluştur”a tıklayın.
API anahtarını kopyalayın ve ortam değişkeni olarak ayarlayın. Deepnote kullanıyoruz ve “GEMINI_API_KEY” isimli anahtarı ayarlamamız oldukça kolay. Entegrasyona gidin, aşağı kaydırın ve ortam değişkenlerini seçin.
Bir sonraki adımda PIP kullanarak Python API'sini kuracağız:
pip install -q -U google-generativeai
Bundan sonra API anahtarını Google’ın GenAI’sine ayarlayıp örneği başlatacağız.
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
API anahtarını ayarladıktan sonra içerik oluşturmak için Gemini Pro modelini kullanmak basittir. 'generate_content' işlevine bir istem sağlayın ve çıktıyı Markdown olarak görüntüleyin.
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
Bu şaşırtıcı ama listeye katılmıyorum. Ancak bunun tamamen kişisel tercihle ilgili olduğunu anlıyorum.
Gemini, tek bir istem için aday adı verilen birden fazla yanıt üretebilir. En uygun olanı seçebilirsiniz. Bizim durumumuzda tek bir cevabımız vardı.
response.candidates
Python'da basit bir oyun yazmasını isteyelim.
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
Sonuç basit ve anlamlıdır. Çoğu Yüksek Lisans Python kodunu yazmak yerine açıklamaya başlar.
Yanıtınızı "jenerasyon_config" bağımsız değişkenini kullanarak özelleştirebilirsiniz. Aday sayısını 1 ile sınırlıyoruz, "boşluk" durdurma sözcüğünü ekliyoruz ve maksimum jetonları ve sıcaklığı ayarlıyoruz.
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
Gördüğünüz gibi yanıt “boşluk” sözcüğünden önce durdu. İnanılmaz.
Yanıtı yayınlamak için "akım" bağımsız değişkenini de kullanabilirsiniz. Antropik ve OpenAI API'lerine benzer ancak daha hızlıdır.
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
Bu bölümde yükleyeceğiz Masood Aslami'nin fotoğrafını çekin ve Gemini Pro Vision'ın çok modluluğunu test etmek için kullanın.
Görüntüleri 'PIL'e yükleyin ve görüntüleyin.
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
Rua Augusta Arch'ın yüksek kaliteli bir fotoğrafına sahibiz.
Gemini Pro Vision modelini yükleyelim ve imajını sağlayalım.
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
Model, sarayı doğru bir şekilde tanımladı ve sarayın tarihi ve mimarisi hakkında ek bilgi sağladı.
Aynı görseli GPT-4’e sağlayalım ve görseli ona soralım. Her iki model de neredeyse benzer yanıtlar verdi. Ama GPT-4 yanıtını daha çok seviyorum.
Artık API'ye metin ve resim sağlayacağız. Vizyon modelinden görseli referans olarak kullanarak bir seyahat blogu yazmasını istedik.
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
Bana kısa bir blog sağladı. Ben daha uzun bir format bekliyordum.
GPT-4 ile karşılaştırıldığında Gemini Pro Vision modeli uzun formatlı bir blog oluşturmakta zorlandı.
Modeli ileri geri sohbet oturumu yapacak şekilde ayarlayabiliriz. Bu şekilde model, önceki konuşmaları kullanarak bağlamı ve yanıtı hatırlar.
Bizim durumumuzda sohbet oturumunu başlattık ve modelden Dota 2 oyununa başlamama yardım etmesini istedik.
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
Gördüğünüz gibi 'chat' nesnesi kullanıcının geçmişini ve mod sohbetini kaydediyor.
Bunları Markdown tarzında da görüntüleyebiliriz.
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Devam sorusunu soralım.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Aşağı kaydırıp modelin bulunduğu oturumun tamamını görebiliriz.
Gömme modelleri bağlama duyarlı uygulamalar için giderek daha popüler hale geliyor. Gemini gömme-001 modeli kelimelerin, cümlelerin veya tüm belgelerin anlamsal anlamı kodlayan yoğun vektörler olarak temsil edilmesine olanak tanır. Bu vektör temsili, karşılık gelen gömme vektörlerini karşılaştırarak farklı metin parçaları arasındaki benzerliği kolayca karşılaştırmayı mümkün kılar.
İçeriği 'embed_content'e sağlayabilir ve metni embedlere dönüştürebiliriz. Bu kadar basit.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
Bir dize listesini 'içerik' argümanına ileterek birden fazla metin parçasını yerleştirmelere dönüştürebiliriz.
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
Aynı sonucu elde etmekte sorun yaşıyorsanız, Derin not çalışma alanı.
Bu giriş eğitiminde ele almadığımız pek çok gelişmiş işlev var. Gemini API'si hakkında daha fazla bilgiyi şu adrese giderek edinebilirsiniz: Gemini API: Python ile Hızlı Başlangıç.
Bu eğitimde Gemini'yi ve yanıt oluşturmak için Python API'sine nasıl erişileceğini öğrendik. Özellikle metin oluşturma, görsel anlama, akış, konuşma geçmişi, özel çıktı ve yerleştirmeler hakkında bilgi edindik. Ancak bu, Gemini'nin yapabileceklerinin sadece yüzeyini çiziyor.
Ücretsiz Gemini API'sini kullanarak oluşturduklarınızı benimle paylaşmaktan çekinmeyin. Olasılıklar sınırsızdır.
Abid Ali Avan (@1abidaliwan), makine öğrenimi modelleri oluşturmayı seven sertifikalı bir veri bilimcisi uzmanıdır. Şu anda, makine öğrenimi ve veri bilimi teknolojileri üzerine içerik oluşturmaya ve teknik bloglar yazmaya odaklanıyor. Abid, Teknoloji Yönetimi alanında yüksek lisans ve Telekomünikasyon Mühendisliği alanında lisans derecesine sahiptir. Vizyonu, akıl hastalığı ile mücadele eden öğrenciler için bir grafik sinir ağı kullanarak bir AI ürünü oluşturmaktır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free