Zephyrnet Logosu

Google Gemini Neden Sohbet Verilerini “Sızdırdı”?

Tarih:

Birisinin sohbetlerin Google'ın arama sonuçlarında herkese açık olarak görüntülendiğini fark etmesi için Google'ın Gemini'sinin kamuya açıklanmasının üzerinden yalnızca yirmi dört saat geçti. Google, sızıntı gibi görünen duruma hızlı bir şekilde yanıt verdi. Bunun gerçekleşmesinin nedeni oldukça şaşırtıcıdır ve ilk bakışta göründüğü kadar kötü değildir.

@semiadhikarath tweeted:

"@Google Gemini'nin kullanıma sunulmasından birkaç saat sonra, Bing gibi arama motorları Gemini'deki herkese açık konuşmaları dizine ekledi."

gemini.google.com/share/ adresindeki site aramasının ekran görüntüsünü yayınladılar

Ancak ekran görüntüsüne baktığınızda “Size burada bir açıklama göstermek istiyoruz ancak site bize izin vermiyor” şeklinde bir mesaj göreceksiniz.

13 Şubat Salı sabahı erken saatlerde Google Gemini sohbetleri Google arama sonuçlarından düşmeye başladı, Google yalnızca üç arama sonucu gösteriyordu. Öğleden sonraya gelindiğinde, arama sonuçlarında gösterilen sızdırılan Gemini sohbetlerinin sayısı tek bir arama sonucuna düşmüştü.

Google Gemini sohbet alt alan adından dizine eklenen sayfalar için Google'ın arama sonuçlarının ekran görüntüsü

Google Gemini sohbet alt alan adından dizine eklenen sayfalar için Google'ın arama sonuçlarının ekran görüntüsü

Gemini Sohbet Sayfaları Nasıl Oluşturuldu?

Gemini, özel bir sohbetin herkese açık olarak görüntülenebilen bir sürümüne bağlantı oluşturmanın bir yolunu sunar.

Google, özel sohbetlerden otomatik olarak web sayfaları oluşturmaz. Kullanıcılar sohbet sayfalarını her sohbetin altındaki bir bağlantı aracılığıyla oluşturur.

Paylaşılan Sohbet Sayfası Nasıl Oluşturulur Ekran Görüntüsü

Özel bir Google Gemini Sohbetinin genel web sayfasının nasıl oluşturulacağını gösteren ekran görüntüsü

Özel bir Google Gemini Sohbetinin genel web sayfasının nasıl oluşturulacağını gösteren ekran görüntüsü

Gemini Sohbet Sayfaları Neden Dizine Alındı?

Sohbet sayfalarının taranmasının ve dizine eklenmesinin bariz nedeni, Google'ın Gemini alt alan adının (gemini.google.com) köküne bir robots.txt koymayı unutmasıdır.

Robots.txt dosyası, web sitelerindeki tarayıcı etkinliğini kontrol etmeye yönelik bir belgedir. Bir yayıncı, Robots.txt Protokolünde standartlaştırılmış komutları kullanarak belirli tarayıcıları engelleyebilir.

4 Şubat sabah saat 19:13'da robots.txt dosyasını kontrol ettim ve bir tanesinin mevcut olduğunu gördüm:

Google Gemini robots.txt dosyası

Google Gemini robots.txt dosyası

Daha sonra robots.txt dosyasının ne kadar süredir orada olduğunu görmek için İnternet Arşivi'ni kontrol ettim ve bu dosyanın en azından Gemini Uygulamalarının duyurulduğu gün olan 8 Şubat'tan bu yana orada olduğunu keşfettim.

İnternet Arşivinden Ekran Görüntüsü

Google Gemini robotlarının ekran görüntüsü. İnternet Arşivi'nden 8 Şubat 2024'te orada olduğunu gösteren txt.

Google Gemini robotlarının ekran görüntüsü. İnternet Arşivi'nden 8 Şubat 2024'te orada olduğunu gösteren txt.

Bu, sohbet sayfalarının taranmasının bariz sebebinin doğru sebep olmadığı, sadece en bariz sebep olduğu anlamına gelir.

Google Gemini alt etki alanı, web tarayıcılarını hem Bing hem de Google'dan engelleyen bir robots.txt dosyasına sahip olmasına rağmen, bu sayfaları nasıl tarayıp dizine eklemeyi başardılar?

İki Yollu Özel Sohbet Sayfaları Keşfedildi ve Dizine Eklendi

  • Bir yerlerde halka açık bir bağlantı olabilir.
  • Daha az olası ama belki de mümkün olan şey, çerezlerle bağlantılı tarama geçmişi aracılığıyla keşfedilmiş olmalarıdır.

Herkese açık bağlantıların olması muhtemeldir.

Bill Hartzer'a sordum (@bhartzer) bu konuda ve o bir şey keşfetti genel bağlantı indekslenen sayfalardan biri için:

Google Gemini paylaşılan sohbet sayfasına genel bağlantı

Google Gemini paylaşılan sohbet sayfasına genel bağlantı

Artık, bu Gemini Sohbet sayfalarının taranmasına ve dizine eklenmesine genel bir bağlantının neden olma ihtimalinin yüksek olduğunu biliyoruz.

Bill Hartzer şu gözlemi sundu:

“Gemini URL'si robots.txt dosyasında engellenmiş olsa da, bir blog yorumunda Gemini URL'sine bir bağlantı var, böylece Gemini URL'si dizine ekleniyor.

Bu, Google'ın robots.txt dosyasında taranması engellenen URL'leri hâlâ dizine ekleyeceğini gösteriyor.

Google, Gemini URL'sinin dizine eklenmediğinden gerçekten emin olmak isteseydi, robots.txt dosyasında taramaya İZİN VERİR ve sayfalara bir noindex meta etiketi eklerdi. Belki de Google burada kendi tavsiyesine uymalı?”

Sohbet Sayfaları Neden Arama Sonuçlarından Çıkmaya Başladı?

Ancak halka açık bir bağlantı varsa Google neden sohbet sayfalarını tamamen kaldırmaya başladı? Google, arama tarayıcısı için, /share/ klasöründeki web sayfalarını, herkese açık olarak bağlantılı olsalar bile, arama dizininden hariç tutacak bir dahili kural oluşturdu mu?

Bing ve Google Arama Dizini İçeriğinin Nasıl Olduğuna İlişkin Bilgiler

Şimdi Google ve Bing'in içeriği nasıl indekslediğiyle ilgilenen tüm arama meraklıları için gerçekten ilginç kısım burada.

Microsoft Bing arama dizini, Gemini içeriğine Google aramasından farklı yanıt verdi. 13 Şubat sabahının erken saatlerinde Google hâlâ üç arama sonucu gösterirken, Bing alt alan adından yalnızca bir sonuç gösteriyordu. Neyin indekslendiği ve ne kadarının indekslendiği konusunda görünüşte rastgele bir kalite vardı.

Gemini Sohbet Sayfaları Neden Sızdı?

İşte bilinen gerçekler:

  • Google'ın 8 Şubat'tan beri bir robots.txt dosyası vardı.
  • Hem Google hem de Bing, gemini.google.com alt alan adından sayfaları dizine ekledi.
  • Hem Google hem de Bing, sohbetlerin bağlantılarını bulmuş ve ardından bunları dizine eklemiş olabilir.
  • Arama motorları, robots.txt dosyasına bakılmaksızın içeriği dizine ekledi ve ardından bunları boşaltmaya başladı.

Bu da bizi bu sayfaların neden hem Google hem de Bing'in arama sonuçlarından düşmeye başladığı sorusuna geri getiriyor. Benim tahminim, Google Gemini sohbet sayfalarının, aslında uzun kuyruklu aramalar için gösterilmeye değer olmayan düşük kaliteli web sayfaları olduğu yönündedir (site:gemini.google.com/share/). Bu sayfaların arama sonuçlarında görünmesinin gerçekten hiçbir faydası yok.

Robots.txt tarafından engellenen içerik yine de keşfedilebilir, taranabilir ve arama dizininde yer alabilir ve sayfalar yararlıysa, yararlı olmadıkları sürece de sıralanabilir. Durumun bu olabileceğini düşünüyorum.

spot_img

En Son İstihbarat

spot_img