Zephyrnet Logosu

Sinir Ağlarının Öğrenmek İçin Veriye İhtiyacı Var. Sahte Olsa Bile. | Quanta Dergisi

Tarih:

Giriş

1987 yılının sonlarında güneşli bir günde, bir Chevy minibüsü, Pittsburgh'daki Carnegie Mellon Üniversitesi kampüsündeki virajlı, ormanlık bir yoldan aşağı indi. Navlab adlı hantal araç, güzelliği veya hızıyla değil, beyniyle dikkat çekiyordu: Kargo alanında (zamanlarına göre) dört güçlü bilgisayar tarafından yönlendirilen, otonom bir aracın deneysel bir versiyonuydu.

İlk başta, Navlab'ın arkasındaki mühendisler aracı kontrol etmeye çalıştı ancak önceki birçok araştırmacı gibi, çok çeşitli sürüş koşullarını tek bir talimat setiyle açıklamakta zorlandılar. Böylece, bu kez yapay zekaya makine öğrenimi adı verilen bir yaklaşım kullanarak tekrar denediler: Minibüs kendi kendine araba sürmeyi öğrenecekti. Dean Pomerleau adında bir yüksek lisans öğrencisi yapay sinir ağı kurdu, beyin hücreleri gibi çalışması amaçlanan küçük mantık işlem birimlerinden yapılmış ve onu farklı koşullar altındaki yolların fotoğraflarıyla eğitmek için yola çıkmış. Ancak çok çeşitli potansiyel sürüş durumlarını kapsayacak kadar fotoğraf çekmek küçük ekip için çok zordu, bu nedenle Pomerleau bir bilgisayarda 1,200 sentetik yol görüntüsü oluşturdu ve bunları sistemi eğitmek için kullandı. Kendi kendine öğretilen makine, araştırmacıların bulduğu diğer her şey kadar iyi sürdü.

Navlab, otonom sürüşte doğrudan herhangi bir büyük buluşa yol açmadı, ancak proje yapay zeka sistemlerini eğitmek için sentetik verilerin gücünü gösterdi. Sonraki on yıllarda makine öğrenimi ileri atıldıkça, eğitim verileri için doymak bilmez bir iştah geliştirdi. Ancak verileri elde etmek zordur: Pahalı, özel veya yetersiz olabilir. Sonuç olarak, araştırmacılar sinir ağlarını eğitmek için doğal verileri desteklemek veya hatta değiştirmek için giderek daha fazla sentetik verilere yöneliyorlar. "Makine öğrenimi uzun süredir veri sorunuyla mücadele ediyor" dedi Sergey Nikolenko, müşterilerin daha iyi yapay zeka modelleri oluşturmasına yardımcı olmak için sentetik veriler üreten bir şirket olan Synthesis AI'da yapay zeka başkanı. "Sentetik veriler, bu sorunu çözmenin en umut verici yollarından biridir."

Neyse ki, makine öğrenimi daha karmaşık hale geldikçe, yararlı sentetik veriler oluşturmaya yönelik araçlar da gelişmiştir.

Sentetik verilerin yararlı olduğu alanlardan biri de yüz tanımayla ilgili endişeleri ele almaktır. Birçok yüz tanıma sistemi, görüntülerdeki insanların mahremiyetiyle ilgili sorunları gündeme getiren, gerçek yüzlerin görüntülerinden oluşan devasa kitaplıklarla eğitilir. Önyargı da bir sorundur, çünkü çeşitli popülasyonlar bu kütüphanelerde aşırı ve yetersiz temsil edilmektedir. Microsoft'un Karma Gerçeklik ve Yapay Zeka Laboratuvarı'ndaki araştırmacılar bu endişeleri ele aldılar, koleksiyon yayınlamak AI sistemlerini eğitmek için 100,000 sentetik yüz. Bu yüzler, yüzlerinin taranmasına izin veren 500 kişilik bir gruptan oluşturulmuştur.

Microsoft'un sistemi, yeni ve benzersiz kombinasyonlar oluşturmak için ilk setteki yüz öğelerini alır, ardından makyaj ve saç gibi ayrıntılarla görsel bir yetenek katar. Araştırmacılar, veri setlerinin çok çeşitli etnik kökenleri, yaşları ve stilleri kapsadığını söylüyor. “İnsan çeşitliliğinde her zaman uzun bir kuyruk vardır. Birçoğunu yakaladığımızı düşünüyor ve umuyoruz" dedi. Tadas Baltrušaitis, proje üzerinde çalışan bir Microsoft araştırmacısı.

Sentetik yüzlerin bir başka avantajı da bilgisayarın her yüzün her parçasını etiketleyebilmesidir, bu da sinir ağının daha hızlı öğrenmesine yardımcı olur. Bunun yerine gerçek fotoğraflar elle etiketlenmelidir, bu çok daha uzun sürer ve hiçbir zaman o kadar tutarlı veya doğru olmaz.

Sonuçlar fotogerçekçi değil - yüzler bir Pixar filmindeki karakterlere biraz benziyor - ancak Microsoft bunları, doğruluğu milyonlarca gerçek yüz üzerinde eğitilmiş ağlarınkine yaklaşan yüz tanıma ağlarını eğitmek için kullandı.

Giriş

Bilgisayarların yararlı sentetik veriler üretme yeteneği de kısmen daha iyi GPU'lar - daha gerçekçi görüntüler üretebilen grafik işleme için tasarlanmış bir çip türü - nedeniyle son zamanlarda gelişmiştir. Şu anda Google'da sentetik yüzlerin oluşturulmasına da yardımcı olan bir araştırmacı olan Erroll Wood, bir göz izleme projesi için GPU'lara güvendi. Göz takibi bilgisayarlar için zor bir görevdir, çünkü farklı ışık koşullarında, göz küresi zar zor görülebilen aşırı açılarda bile farklı görünen gözlerin çok küçük hareketlerini takip etmeyi içerir. Normalde bir makinenin bir kişinin nereye baktığını öğrenmesi için insan gözünün binlerce fotoğrafını çekerdi ve bu fotoğrafları elde etmek zor ve aşırı derecede pahalı.

Wood'un ekibi gösterdi GPU ile çalışan ve video oyunları üretmek için bir yazılım paketi olan Unity çalıştıran bir bilgisayarın, kavisli, ıslak insan gözünün etrafına sarılmış dijital görüntülerin ayrıntılı yansımaları dahil olmak üzere gerekli resimleri oluşturabileceği. Her bir fotoğrafı oluşturmak için GPU sistemi yalnızca 23 milisaniye sürdü. (Aslında, her görüntünün üretilmesi yalnızca 3.6 milisaniye sürdü; geri kalan süre görüntüyü depolamak için harcandı.) Araştırmacılar 1 milyon göz görüntüsü üretti ve bunları, aynı ağ kadar iyi performans gösteren bir sinir ağını eğitmek için kullandı. fiyatının çok altında ve çok daha kısa sürede insan gözünün gerçek fotoğrafları üzerinde eğitildi. Microsoft'un sentetik yüzlerinde olduğu gibi, göz izleme ağı, bilgisayarın eğitim görüntülerine mükemmel piksel etiketleri uygulama yeteneğinden yararlandı.

Araştırmacılar ayrıca yapay zeka sistemlerini eğitmek için gereken verileri oluşturmak için en son yapay zeka sistemlerini kullanıyor. Örneğin tıpta uzun süredir devam eden bir hedef, radyolojik görüntüleri insan radyologlarının yapabileceği kadar iyi yorumlayabilen bir sinir ağı oluşturmak olmuştur. Ancak bu sistemleri eğitmek için gerekli verileri elde etmek zordur, çünkü gerçek hastaların röntgenleri ve BT taramaları özel sağlık bilgileridir. Gerçekten doğru bir modeli eğitmek için gerekli olan binlerce veya milyonlarca görüntüye erişim sağlamak bir yüktür.

Bu senenin başlarında, Hazreti AliPakistan'daki COMSATS Üniversitesi'nde bir bilgisayar bilimcisi olan tarif edilen popüler bir DALL·E 2 kullanarak yaptığı ilk deneyler difüzyon modeli, belirli akciğer koşullarının temsilleri de dahil olmak üzere akciğerlerin gerçekçi X-ışını ve CT görüntülerini oluşturmak için. Bu görüntüler daha sonra tümörleri ve diğer anormallikleri tespit etmek için bir sinir ağı eğitmek için kullanılabilir. Bir yıl içinde, difüzyon modellerinin yapay zeka radyoloji araçları için yeni bir ölçüt belirlemesini bekliyor. "Daha gerçekçi MRI'ları, CT'leri ve belki de ultrasonları sentezleyebildiğimizde, bu, hastaların mahremiyeti ve veri paylaşımıyla ilgili endişeleri artırmadan araştırmayı ve nihayetinde klinik çeviriyi hızlandıracak."

Navlab, CMU kampüsünde çekingen bir şekilde ilerlerken, izleyiciler muhtemelen önemli bir teknolojinin doğuşunu izlediklerini düşünmediler. Ancak bu yavaş yolculuk, yapay zekanın gelişiminde kilit bir rol üstlenen sentetik verilerin dünyaya tanıtılmasına yardımcı oldu. Ve bu rol gelecekte gerçekten gerekli hale gelebilir. "Sentetik veriler burada kalacak" dedi Marina Ivasic-Kos, Hırvatistan'daki Rijeka Üniversitesi'nde makine öğrenimi araştırmacısı. "Oyunsonu, gerçek verileri tamamen sentetik verilerle değiştirmektir."

spot_img

En Son İstihbarat

spot_img