Taal stelt mensen in staat gedachten aan elkaar over te brengen, omdat de hersenen van elke persoon op dezelfde manier reageren op de betekenis van woorden. In nieuw gepubliceerd onderzoek, mijn collega's en ik ontwikkelde een raamwerk om de hersenactiviteit van sprekers te modelleren terwijl ze face-to-face gesprekken voerden.
We hebben de elektrische activiteit van de hersenen van twee mensen vastgelegd terwijl ze ongeschreven gesprekken voerden. Uit eerder onderzoek is gebleken dat wanneer twee mensen praten, hun hersenactiviteit wordt gekoppeld of op één lijn wordt gebracht, en dat de mate van neurale koppeling verband houdt met een beter begrip van de boodschap van de spreker.
Een neurale code verwijst naar bepaalde patronen van hersenactiviteit geassocieerd met verschillende woorden in hun context. We ontdekten dat de hersenen van de sprekers op één lijn liggen met een gedeelde neurale code. Belangrijk is dat de neurale code van de hersenen leek op de kunstmatige neurale code van grote taalmodellen.
De neurale patronen van woorden
A groot taalmodel is een machine learning-programma dat tekst kan genereren door te voorspellen welke woorden hoogstwaarschijnlijk op anderen volgen. Grote taalmodellen blinken uit in het leren van de taal structuur van taal, het genereren van menselijke tekst en het voeren van gesprekken. Ze kunnen zelfs passeren Turing-test, waardoor het voor iemand moeilijk wordt om te onderscheiden of hij interactie heeft met een machine of met een mens. Net als mensen leren grote taalmodellen spreken door tekst te lezen of ernaar te luisteren geproduceerd door andere mensen.
Door het grote taalmodel een transcriptie van het gesprek te geven, konden we de ‘neurale activaties’ ervan achterhalen, oftewel hoe het woorden in cijfers vertaalt, terwijl het het script ‘leest’. Vervolgens hebben we de hersenactiviteit van de spreker gecorreleerd met zowel de activaties van het grote taalmodel als met de hersenactiviteit van de luisteraar. We ontdekten dat de activeringen van het grote taalmodel de gedeelde hersenactiviteit van de spreker en luisteraar konden voorspellen.
Om elkaar te begrijpen, hebben mensen een gedeelde overeenstemming over de grammaticale regels en de betekenis van woorden in context. We weten bijvoorbeeld dat we de verleden tijd van een werkwoord moeten gebruiken om over daden uit het verleden te praten, zoals in de zin: "Hij heeft gisteren het museum bezocht." Bovendien begrijpen we intuïtief dat hetzelfde woord in verschillende situaties verschillende betekenissen kan hebben. Het woord koud in de zin 'je bent zo koud als ijs' kan bijvoorbeeld verwijzen naar iemands lichaamstemperatuur of persoonlijkheidskenmerk, afhankelijk van de context. Vanwege de complexiteit en rijkdom van natuurlijke taal ontbrak het ons, tot het recente succes van grote taalmodellen, aan een nauwkeurig wiskundig model om deze te beschrijven.
Uit onze studie bleek dat grote taalmodellen kunnen voorspellen hoe taalkundige informatie in het menselijk brein wordt gecodeerd, waardoor ze een nieuw hulpmiddel bieden om de menselijke hersenactiviteit te interpreteren. De gelijkenis tussen de taalcode van het menselijk brein en het grote taalmodel heeft ons voor het eerst in staat gesteld te volgen hoe informatie in de hersenen van de spreker wordt gecodeerd in woorden en woord voor woord wordt overgedragen naar de hersenen van de luisteraar tijdens face-to-face gesprekken. gezicht gesprekken. We ontdekten bijvoorbeeld dat hersenactiviteit die verband houdt met de betekenis van een woord in de hersenen van de spreker naar voren komt voordat hij een woord articuleert, en dat dezelfde activiteit snel weer in de hersenen van de luisteraar opduikt nadat hij het woord heeft gehoord.
Krachtig nieuw hulpmiddel
Ons onderzoek heeft inzicht gegeven in de neurale code voor taalverwerking in het menselijk brein en hoe zowel mensen als machines deze code kunnen gebruiken om te communiceren. We ontdekten dat grote taalmodellen beter in staat waren gedeelde hersenactiviteit te voorspellen in vergelijking met verschillende kenmerken van taal, zoals syntaxis, of de volgorde waarin woorden met elkaar verbonden zijn om zinsdelen en zinnen te vormen. Dit is deels te danken aan het vermogen van de grote taalmodellen om de contextuele betekenis van woorden te incorporeren, en om meerdere niveaus van de taalhiërarchie in één model te integreren: van woorden tot zinnen tot conceptuele betekenis. Dit suggereert belangrijk overeenkomsten tussen de hersenen en kunstmatige neurale netwerken.
Een belangrijk aspect van ons onderzoek is het gebruik van alledaagse opnames van natuurlijke gesprekken om ervoor te zorgen dat onze bevindingen de verwerking van de hersenen in het echte leven vastleggen. Dit heet Ecologische validiteit. In tegenstelling tot experimenten waarbij deelnemers wordt verteld wat ze moeten zeggen, geven we de controle over het onderzoek uit handen en laten we de deelnemers zo natuurlijk mogelijk praten. Dit verlies aan controle maakt het moeilijk om de gegevens te analyseren, omdat elk gesprek uniek is en er twee op elkaar inwerkende individuen betrokken zijn die spontaan spreken. Ons vermogen om neurale activiteit te modelleren terwijl mensen deelnemen aan alledaagse gesprekken getuigt van de kracht van grote taalmodellen.
Andere afmetingen
Nu we een raamwerk hebben ontwikkeld om de gedeelde neurale code tussen hersenen tijdens alledaagse gesprekken te beoordelen, zijn we geïnteresseerd in welke factoren deze koppeling aandrijven of belemmeren. Neemt de taalkundige koppeling bijvoorbeeld toe als een luisteraar de bedoeling van de spreker beter begrijpt? Of misschien kan complexe taal, zoals jargon, de neurale koppeling verminderen.
Een andere factor die de taalkundige koppeling kan beïnvloeden, kan de relatie tussen de sprekers zijn. U kunt bijvoorbeeld met een paar woorden veel informatie overbrengen aan een goede vriend, maar niet aan een vreemde. Of misschien ben je er neuraal beter mee verbonden politieke bondgenoten in plaats van rivalen. Dit komt omdat verschillen in de manier waarop we woorden gebruiken tussen groepen het gemakkelijker kunnen maken om op één lijn te komen en te worden gekoppeld aan mensen binnen onze sociale groepen in plaats van daarbuiten.
Dit artikel is opnieuw gepubliceerd vanaf The Conversation onder een Creative Commons-licentie. Lees de originele artikel.
Krediet van het beeld: Mohamed Hassan / Pixabay
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://singularityhub.com/2024/08/07/a-new-study-says-ai-models-encode-language-like-the-human-brain-does/