Zephyrnet-logo

OpenAI Scholars Lente 2020: Afstudeerprojecten

Datum:


Alethea kracht

Op zoek naar grammatica op alle juiste plaatsen

Ik ben gefascineerd door de interpreteerbaarheid van neurale netwerken. Begrijpen hoe netwerken van verschillende architecturen informatie vertegenwoordigen, kan ons helpen om eenvoudigere en efficiëntere netwerken te bouwen, evenals voorspellen hoe de netwerken die we hebben gebouwd zich zullen gedragen, en misschien zelfs enig inzicht geven in hoe mensen denken. Langs deze lijnen heb ik geanalyseerd hoe GPT-2 de Engelse grammatica vertegenwoordigt, en vond ik kleinere subnetwerken die lijken te corresponderen met verschillende grammaticale structuren. Ik zal mijn methodologie en resultaten presenteren.

Vervolgens wil ik werken aan het begrijpen hoe neurale netwerken informatie vertegenwoordigen en dat begrip gebruiken om beter te voorspellen hoe deep learning-systemen zich gedragen. Ik denk dat dit werk dergelijke systemen veiliger en gunstiger zal maken voor de mensheid, en ze ook eenvoudiger, sneller en rekenkrachtiger zal maken.

Blog


André Carerra

Semantisch parseren van Engels naar GraphQL

Mijn scholars-programmaproject is semantisch parseren van Engels naar GraphQL. Gegeven een Engelse prompt zoals "Hoeveel werknemers hebben we?", Zoek een overeenkomstige GraphQL-query om de informatie te retourneren. Het project omvatte het creëren van een dataset, trainingsmodellen en het creëren van een interactietool om resultaten te zien.

Ik wilde inspraak hebben in hoe AI wordt gevormd: het Scholars-programma was een geweldige kans om te leren en deel te nemen.

Blog


Cathy Ja

Krediettoewijzing op lange termijn met tijdelijk beloningsvervoer

Standaard algoritmen voor versterking van leerprocessen worstelen met een slechte monsterefficiëntie in de aanwezigheid van spaarzame beloningen met lange temporele vertragingen tussen actie en effect. Om het krediettoewijzingsprobleem op lange termijn aan te pakken, gebruiken we "temporal reward transport" (TRT) om de onmiddellijke beloningen van belangrijke staats-actieparen te vergroten met beloningen uit de verre toekomst, met behulp van een aandachtsmechanisme om kandidaten voor TRT te identificeren. Een reeks gridworld-experimenten toont duidelijke verbeteringen in het leren wanneer TRT wordt gebruikt in combinatie met een standaard voordeel-criticus-algoritme.

Ik waardeer dat dit programma me de vrijheid gaf om diep te leren en mijn creativiteit te gebruiken.

Blog


Jorge Orbay

Kwantificeerbare interpreteerbaarheid van op Coinrun getrainde modellen

Het doel van dit project is om een ​​scalair te maken die de interpreteerbaarheid meet van een A2C-model dat getraind is op Procgen's Coinrun. De scalair wordt gegenereerd met behulp van een combinatie van attributie op het model en maskers van de activa van Coinrun. De scalair wordt gebruikt om de validiteit van de diversiteitshypothese te testen.

Dit programma, en in het bijzonder mijn mentor, heeft mij meer zelfvertrouwen gegeven om in een veld te duiken dat ik niet begrijp en om problemen op te lossen totdat ik ze kan oplossen. Ik hoop het zelfvertrouwen te nemen dat ik van dit programma heb geleerd om problemen in en met AI voort te zetten.

Blog


Kamal Ndousse

Sociaal leren in onafhankelijk leren met meerdere agenten

Mijn project heeft de sociale overdracht van expertise onderzocht tussen volledig onafhankelijke RL-agenten die zijn opgeleid in gedeelde omgevingen. De motiverende vraag is of beginnende agenten kunnen leren om deskundig gedrag na te bootsen om moeilijke verkenningstaken op te lossen die ze niet in hun eentje onder de knie konden krijgen. Ik zal mijn observaties bespreken, evenals de omgevingen die ik heb ontwikkeld om te experimenteren met overdracht van sociale vaardigheden.

Ik ben lid geworden van het Scholars-programma om te leren van de briljante mensen bij OpenAI en mezelf onder te dompelen in AI-onderzoek. Ik ben dankbaar dat ik de kans heb gehad om state-of-the-art onderzoek te verkennen met de steun van zulke getalenteerde onderzoekers (met speciale dank aan mijn mentor Natasha Jaques!)

Blog



Kat Slama

Op weg naar voorspelling van epileptische aanvallen met Deep Network

Ik heb aan een project gewerkt om epileptische aanvallen te voorspellen met behulp van hersenregistraties. Ik heb het in beeld gebracht als een beeldclassificatieprobleem op basis van de spectrogramrepresentatie van de hersengegevens. Mijn meest succesvolle model tot nu toe was een ResNet18. In mijn leven na mijn studie ben ik van plan om aan dit project te blijven werken en mijn weg te vinden naar de interpreteerbaarheid van spectrogramclassificatienetwerken.

Ik wilde leren hoe je diep leren kunt toepassen om wetenschappelijke en echte problemen op te lossen. Het OpenAI Scholars-programma was deze magische kans om te beginnen door te leren van de allerbeste geesten in het veld.

Blog



Pamela Misjkin

Universele tegenstrijdige verstoringen en taalmodellen

Omstandige verstoringen zijn goed begrepen voor afbeeldingen, maar minder voor taal. Mijn presentatie bespreekt de literatuur over hoe universele tegenstrijdige voorbeelden het begrip van generatieve modellen kunnen informeren, resultaten kunnen repliceren die universele adversariële triggers genereren voor GPT-2 en voor het aanvallen van NLI-modellen.

Dit programma versterkte mijn technische basis in machine learning en hielp me te begrijpen hoe AI-onderzoekers de beleidsimplicaties van hun werk begrijpen.

Blog

Bron: https://openai.com/blog/openai-scholars-spring-2020-final-projects/

spot_img

Laatste intelligentie

spot_img