Zephyrnet Logosu

Yapay Zeka Destekli Beyin İmplantı, Düşünceleri Metne Dönüştürme Hız Rekorunu Ezdi

Tarih:

Her dakika yaklaşık 160 kelime hızında konuşuyoruz. Konuşma beyni implantları için bu hıza ulaşmak inanılmaz derecede zordur.

On yıllardır yapım aşamasında olan konuşma implantları, düşünceleri metne veya sese dönüştürmek amacıyla nöral aktiviteyi ölçmek için beyne yerleştirilen küçük elektrot dizilerini kullanır. Felç, hastalık veya diğer yaralanmalar nedeniyle konuşma yetisini kaybeden insanlar için paha biçilmezdir. Ama aynı zamanda inanılmaz derecede yavaşlar, dakikada kelime sayısını neredeyse on kat azaltıyorlar. Yavaş yüklenen bir web sayfası veya ses dosyası gibi, gecikme günlük konuşmalar için sinir bozucu olabilir.

Dr liderliğindeki bir ekip. Stanford Üniversitesi'nden Krishna Shenoy ve Jaimie Henderson bu hız farkını kapatıyor.

Ön baskı sunucusunda yayınlandı bioRxiv, Çalışmaları, 67 yaşındaki bir kadının, rekor kıran bir hızda beyin implantları kullanarak dış dünyayla iletişim kurma yeteneğini geri kazanmasına yardımcı oldu. "T12" olarak bilinen kadın, amyotrofik lateral skleroz (ALS) veya beynin vücuttaki kasları kontrol etme yeteneğini aşamalı olarak çalan Lou Gehrig hastalığından yavaş yavaş konuşmasını kaybetti. T12 konuşmaya çalışırken hala sesleri seslendirebiliyordu ama kelimeler anlaşılmaz bir şekilde çıktı.

İmplantı sayesinde, T12'nin konuşma girişimleri artık ekranda metin olarak gerçek zamanlı olarak çözülüyor ve "çok zor" veya "Gelmelerinden zevk alıyorum" gibi ifadeler de dahil olmak üzere bilgisayarlı bir sesle yüksek sesle konuşuluyor. Sözler, önceki rekorların üç katından daha hızlı, dakikada 62 hızla hızlı ve öfkeli geldi.

Bu sadece hız için bir ihtiyaç değil. Çalışma aynı zamanda, bu ölçekteki ilk gösterimde, yaklaşık 125,000 kelimelik bir implant kullanarak konuşma kodunu çözmek için kullanılan en büyük kelime dağarcığı kitaplığından da yararlandı.

Açık olmak gerekirse, bir “olsa dabüyük atılım” ve uzmanlara göre “etkileyici yeni performans ölçütlerine” ulaştı, çalışma henüz hakem denetiminden geçmedi ve sonuçlar bir katılımcıyla sınırlı.

Bununla birlikte, altta yatan teknoloji ALS ile sınırlı değildir. Konuşma tanımadaki artış, RNN'ler (tekrarlayan sinir ağları, daha önce sinir sinyallerini çözmede etkili olan bir makine öğrenme algoritması) ve dil modelleri arasındaki evlilikten kaynaklanıyor. Daha fazla test edildiğinde kurulum, şiddetli felç, inme veya kilitli kalma sendromu olan kişilerin sevdikleriyle sadece düşüncelerini kullanarak gelişigüzel sohbet etmelerini sağlamanın yolunu açabilir.

Yazarlar, "doğal konuşma hızına yaklaşmaya" başladığımızı söyledi.

Kelimelerin Kaybı

Ekip, insanlara konuşma güçlerini geri vermeye yabancı değil.

Bir parçası olarak BrainGateBeyin implantlarını kullanarak iletişimleri eski haline getirmek için öncü bir küresel işbirliği olan ekip, beyinden gelen nöral sinyalleri kullanarak iletişimleri yeniden kurma becerisini tasavvur etti ve sonra gerçekleştirdi.

2021'de bir beyin-bilgisayar arayüzü (BCI) tasarladılar. bir kişiye yardım etti omurilik zedelenmesi ve felç tipi ile aklı başında. Ekip, hastanın beyninin motor bölgelerine yerleştirilen 96 mikroelektrot dizisiyle, her bir karakteri yazmak için hareketleri hayal ederken farklı harfler için beyin sinyallerini deşifre edebildi ve yüzde 94'ün üzerinde doğrulukla bir tür "zihin mesajı" elde etti.

Sorun? Hız kabaca dakikada en fazla 90 karakterdi. Önceki kurulumlara göre büyük bir gelişme olsa da, günlük kullanım için hala acı verecek kadar yavaştı.

Öyleyse neden doğrudan beynin konuşma merkezlerine dokunmuyoruz?

Dilden bağımsız olarak, konuşmanın kodunu çözmek bir kabustur. Dilin ve çevredeki kasların küçük ve genellikle bilinçaltı hareketleri fonem olarak da bilinen çok farklı ses kümelerini tetikleyebilir. Bir yüz kasının her seğirmesinin veya dilin titremesinin beyin aktivitesini bir sese bağlamaya çalışmak muazzam bir iştir.

Hacking Konuşması

BrainGate2 Neural Interface System denemesinin bir parçası olan yeni çalışma, zekice bir geçici çözüm kullandı.

Ekip önce stratejik olarak yerleştirilmiş dört elektrot mikro dizisini T12'nin beyninin dış katmanına yerleştirdi. İki tanesi, ağzı çevreleyen yüz kaslarının etrafındaki hareketleri kontrol eden bölgelere yerleştirildi. Diğer ikisi doğrudan beynin "dil merkezi" olarak adlandırılan "dil merkezine" bağlandı. Broca'nın alanı.

Teorik olarak, yerleştirme ikisi bir arada bir dahiydi: hem kişinin söylemek istediklerini hem de kas hareketleriyle konuşmanın gerçek uygulamasını yakaladı.

Ancak bu aynı zamanda riskli bir önermeydi: Konuşmanın sadece ağız ve yüz çevresindeki kasları kontrol eden küçük bir beyin alanıyla mı sınırlı olduğunu yoksa dilin beynin içinde daha küresel bir ölçekte kodlanıp kodlanmadığını henüz bilmiyoruz.

RNN'leri girin. Bir tür derin öğrenme olan algoritma, daha önce beynin motor alanlarından gelen nöral sinyalleri metne çevirmişti. Ekip, ilk testte, yalnızca nöral sinyallere dayalı olarak yüzde 92'nin üzerinde doğrulukla, konuşma için farklı türdeki yüz hareketlerini (örneğin, kaşları çatmak, dudakları büzmek veya dili sallamak) kolayca ayırdığını buldu.

Daha sonra RNN'ye ses birimlerini gerçek zamanlı olarak önermesi öğretildi - örneğin, "huh", "ah" ve "tze". Fenomenler, bir kelimeyi diğerinden ayırmaya yardımcı olur; özünde, konuşmanın temel unsurlarıdır.

Eğitim işe yaradı: Her gün, T12 algoritmaya konuşma kalıplarının altında yatan belirli sinirsel aktiviteyi öğretmek için kendi hızında 260 ila 480 cümle konuşmaya çalıştı. Genel olarak, RNN yaklaşık 11,000 cümleyle eğitildi.

Zihni için bir kod çözücüye sahip olan ekip, RNN arayüzünü iki dil modeliyle ilişkilendirdi. Birinin 125,000 kelimelik geniş bir kelime dağarcığı vardı. Diğeri ise günlük hayatta basit cümleler için kullanılan 50 kelimelik daha küçük bir kütüphaneydi.

Beş günlük konuşma denemesinden sonra, her iki dil modeli de T12'nin sözcüklerini çözebildi. Sistemde hatalar vardı: küçük kitaplık için yaklaşık yüzde 10 ve büyük kitaplık için yaklaşık yüzde 24. Yine de bir ekranda cümle komutlarını tekrarlaması istendiğinde, sistem onun sinirsel aktivitesini önceki modellere göre üç kat daha hızlı cümlelere çevirdi.

İmplant, konuşmaya çalışsa da cümleleri sessizce söylese de işe yaradı (daha az enerji gerektirdiği için ikincisini tercih etti).

T12'nin nöral sinyallerini inceleyen ekip, beynin belirli bölgelerinin ünlüleri ve diğer fonemleri kodlamak için nöral sinyal kalıplarını koruduğunu buldu. Başka bir deyişle, yıllarca süren konuşma felcinden sonra bile, beyin hala beyin implantları kullanılarak çözülebilen "ayrıntılı bir ifade kodu" - yani nöral sinyallerin içine gömülü ses birimleri sözlüğü - tutar.

BT Your Mind

Çalışma, genellikle ciddi yaralanmalardan on yıllar sonra veya nörodejeneratif bozukluklardan yavaş yavaş yayılan felçten sonra, konuşmayı geri yüklemek için bir beyin implantı kullanan diğer birçok kişiye dayanmaktadır. Donanım iyi biliniyor: Beynin elektrik sinyallerini dinlemek için 64 kanaldan oluşan Blackrock mikroelektrot dizisi.

Farklı olan, nasıl çalıştığıdır; yani, yazılımın gürültülü sinirsel gevezelikleri tutarlı anlamlara veya niyetlere nasıl dönüştürdüğü. Önceki modeller çoğunlukla doğrudan beyinden alınan nöral kayıtlardan elde edilen verilerin kodunu çözmeye dayanıyordu.

Ekip burada yeni bir kaynaktan yararlandı: dil modelleri veya otomatik tamamlama işlevine benzer yapay zeka algoritmaları artık Gmail veya kısa mesaj için yaygın olarak kullanılabilir. Teknolojik etiket ekibi, yükselişiyle birlikte özellikle umut vericidir. GPT 3 ve ortaya çıkan diğer büyük dil modelleri. Basit istemlerden konuşma kalıpları oluşturmada mükemmel olan teknoloji, hastanın kendi nöral sinyalleriyle birleştirildiğinde, saatlerce eğitime ihtiyaç duymadan düşüncelerini potansiyel olarak "otomatik olarak tamamlayabilir".

Beklenti, çekici olsa da, bir ihtiyatlılık ile birlikte gelir. GPT-3 ve benzeri yapay zeka modelleri, önceki eğitim verilerine dayanarak kendi başlarına ikna edici konuşmalar üretebilir. Konuşamayan felçli bir kişi için, yapay zeka kişinin söylemeye çalıştığı şeyi ürettiği için korkuluklara ihtiyacımız olacaktır.

Yazarlar, çalışmalarının şimdilik bir kavram kanıtı olduğu konusunda hemfikir. Umut verici olmakla birlikte, konuşmanın şifresini çözmek için "henüz tam, klinik olarak uygulanabilir bir sistem" değildir. Birincisi, dekoderi daha kısa sürede eğitmemiz ve sürekli değişen beyin aktivitesine uyum sağlamasına izin vererek onu daha esnek hale getirmemiz gerektiğini söylediler. İkincisi, kabaca yüzde 24'lük hata oranı günlük kullanım için çok yüksek; ancak implant kanallarının sayısını artırmak doğruluğu artırabilir.

Yazarlar, ancak şimdilik, bizi "artık konuşamayan felçli insanlarla hızlı iletişimi yeniden sağlama" nihai hedefine yaklaştırdığını söyledi.

Resim Kredi: Miguel A. Padriñán itibaren Pixabay

spot_img

En Son İstihbarat

spot_img

Bizimle sohbet

Merhaba! Size nasıl yardım edebilirim?