Zephyrnet-logo

De nieuwe AI van Google DeepMind evenaart de prestaties van de gouden medaille op de Olympische Wiskundespelen

Datum:

Na het kraken van een onoplosbare wiskunde Probleem van vorig jaar is AI terug om de geometrie aan te pakken.

Een nieuw algoritme, AlphaGeometry, ontwikkeld door Google DeepMind, kan problemen van eerdere Internationale Wiskundeolympiades (een competitie op het hoogste niveau voor middelbare scholieren) verpletteren en evenaart de prestaties van eerdere gouden medaillewinnaars.

Toen de AI werd uitgedaagd met 30 moeilijke geometrieproblemen, loste hij er met succes 25 op binnen de standaard toegewezen tijd, waarbij hij eerdere state-of-the-art algoritmen met 15 antwoorden versloeg.

Hoewel vaak beschouwd als de vloek van de wiskundelessen op de middelbare school, is geometrie ingebed in ons dagelijks leven. Kunst, astronomie, interieurontwerp en architectuur zijn allemaal afhankelijk van geometrie. Dat geldt ook voor navigatie, kaarten en routeplanning. In de kern is geometrie een manier om ruimte, vormen en afstanden te beschrijven met behulp van logisch redeneren.

In zekere zin lijkt het oplossen van geometrieproblemen een beetje op schaken. Gegeven sommige regels – stellingen en bewijzen genoemd – is er voor elke stap een beperkt aantal oplossingen, maar om te bepalen welke de juiste is, is afhankelijk van flexibel redeneren volgens strikte wiskundige regels.

Met andere woorden: het aanpakken van geometrie vereist zowel creativiteit als structuur. Terwijl mensen deze mentale acrobatische vaardigheden ontwikkelen door jarenlange oefening, heeft AI het altijd moeilijk gehad.

AlphaGeometry combineert beide functies op slimme wijze in één systeem. Het bestaat uit twee hoofdcomponenten: een aan regels gebonden logisch model dat probeert een antwoord te vinden, en een groot taalmodel om kant-en-klare ideeën te genereren. Als de AI er niet in slaagt een oplossing te vinden die alleen gebaseerd is op logisch redeneren, komt het taalmodel in actie om nieuwe invalshoeken te bieden. Het resultaat is een AI met zowel creativiteit als redeneervaardigheden die de oplossing ervan kan verklaren.

Het systeem is DeepMind’s nieuwste poging om wiskundige problemen op te lossen met machine-intelligentie. Maar hun ogen zijn gericht op een grotere prijs. AlphaGeometry is gebouwd voor logisch redeneren in complexe omgevingen, zoals onze chaotische wereld van alledag. Naast wiskunde kunnen toekomstige iteraties wetenschappers mogelijk helpen oplossingen te vinden in andere gecompliceerde systemen, zoals het ontcijferen van hersenverbindingen of het ontrafelen van genetische netwerken die tot ziekten leiden.

“We maken een grote sprong, een grote doorbraak in termen van resultaat”, studieauteur Dr. Trieu Trinh vertelde de New York Times.

Double Team

Een snelle meetkundevraag: stel je een driehoek voor waarvan beide zijden even lang zijn. Hoe bewijs je dat de onderste twee hoeken precies hetzelfde zijn?

Dit is een van de eerste uitdagingen waarmee AlphaGeometry werd geconfronteerd. Om het op te lossen, moet je de regels in de geometrie volledig begrijpen, maar ook de creativiteit hebben om naar het antwoord toe te gaan.

“Het bewijzen van stellingen demonstreert de beheersing van logisch redeneren…wat een opmerkelijke probleemoplossende vaardigheid betekent”, aldus het team schreef in onderzoek dat vandaag is gepubliceerd in NATUUR.

Dit is waar de architectuur van AlphaGeometry uitblinkt. Nagesynchroniseerd een neuro-symbolisch systeem, pakt het eerst een probleem aan met zijn symbolische deductiemotor. Stel je deze algoritmen voor als een leerling van groep A die wiskundeboeken strikt bestudeert en regels volgt. Ze laten zich leiden door logica en kunnen gemakkelijk elke stap uiteenzetten die naar een oplossing leidt, zoals het uitleggen van een redenering in een wiskundetoets.

Deze systemen zijn ouderwets maar ongelooflijk krachtig, in die zin dat ze niet het ‘black box’-probleem hebben dat veel moderne deep learning-algoritmen achtervolgt.

Deep learning heeft onze wereld opnieuw vormgegeven. Maar vanwege de manier waarop deze algoritmen werken, kunnen ze hun output vaak niet verklaren. Dit is gewoon niet voldoende als het gaat om wiskunde, die afhankelijk is van strikte logische redeneringen die kunnen worden opgeschreven.

Symbolische deductiemotoren gaan het black box-probleem tegen doordat ze rationeel en verklaarbaar zijn. Maar geconfronteerd met complexe problemen zijn ze traag en hebben ze moeite om zich flexibel aan te passen.

Hier komen grote taalmodellen in beeld. Deze algoritmen, de drijvende kracht achter ChatGPT, zijn uitstekend in het vinden van patronen in gecompliceerde gegevens en het genereren van nieuwe oplossingen, als er voldoende trainingsgegevens zijn. Maar ze missen vaak het vermogen om zichzelf uit te leggen, waardoor het noodzakelijk is om hun resultaten nogmaals te controleren.

AlphaGeometry combineert het beste van twee werelden.

Wanneer je geconfronteerd wordt met een meetkundig probleem, probeert de symbolische deductiemotor dit eerst. Neem het driehoeksprobleem. Het algoritme ‘begrijpt’ het uitgangspunt van de vraag, in die zin dat het moet bewijzen dat de onderste twee hoeken hetzelfde zijn. Het taalmodel stelt vervolgens voor om een ​​nieuwe lijn van de bovenkant van de driehoek recht naar beneden te tekenen om het probleem op te lossen. Elk nieuw element dat de AI in de richting van de oplossing brengt, wordt een ‘construct’ genoemd.

De symbolische deductiemachine neemt het advies en schrijft de logica achter de redenering op. Als de constructie niet werkt, doorlopen de twee systemen meerdere beraadslagingen totdat AlphaGeometry de oplossing bereikt.

De hele opzet is “verwant aan het idee van ‘denken, snel en langzaam’”, schreef het team op de blog van DeepMind. “Het ene systeem zorgt voor snelle, ‘intuïtieve’ ideeën, en het andere voor meer weloverwogen, rationele besluitvorming.”

Wij zijn de kampioenen

In tegenstelling tot tekst- of audiobestanden is er een gebrek aan voorbeelden gericht op geometrie, wat het moeilijk maakte om AlphaGeometry te trainen.

Als oplossing genereerde het team hun eigen dataset met 100 miljoen synthetische voorbeelden van willekeurige geometrische vormen en in kaart gebrachte relaties tussen punten en lijnen – vergelijkbaar met hoe je geometrie oplost in de wiskundeles, maar dan op een veel grotere schaal.

Van daaruit begreep de AI de regels van de geometrie en leerde hij achteruit te werken vanuit de oplossing om erachter te komen of er constructies moesten worden toegevoegd. Dankzij deze cyclus kon de AI helemaal opnieuw leren zonder enige menselijke inbreng.

Het team stelde de AI op de proef en daagde hem uit met 30 Olympiade-problemen uit meer dan tien jaar eerdere competities. De gegenereerde resultaten werden geëvalueerd door een voormalig gouden medaillewinnaar van de Olympiade, Evan Chen, om de kwaliteit ervan te garanderen.

In totaal evenaarde de AI de prestaties van eerdere gouden medaillewinnaars en voltooide hij 25 problemen binnen de tijdslimiet. De eerder state-of-the-art resultaat waren 10 juiste antwoorden.

“De output van AlphaGeometry is indrukwekkend omdat het zowel verifieerbaar als schoon is,” Chen zei. “Het maakt gebruik van klassieke geometrieregels met hoeken en soortgelijke driehoeken, net zoals leerlingen dat doen.”

Voorbij wiskunde

AlphaGeometry is DeepMinds nieuwste uitstapje naar wiskunde. in 2021, kraakte hun AI wiskundige puzzels waar mensen al tientallen jaren last van hadden. Recenter, zij gebruikten grote taalmodellen om STEM-problemen op universitair niveau te beredeneren en gebarsten een voorheen ‘onoplosbaar’ wiskundig probleem gebaseerd op een kaartspel met het algoritme FunSearch.

Voorlopig is AlphaGeometry afgestemd op geometrie, en met kanttekeningen. Een groot deel van de geometrie is visueel, maar het systeem kan de tekeningen niet ‘zien’, wat het oplossen van problemen zou kunnen versnellen. Afbeeldingen toevoegen, eventueel met Google's Gemini-AI, dat eind vorig jaar werd gelanceerd, kan zijn geometrische slimheid versterken.

Een soortgelijke strategie zou het bereik van AlphaGeometry ook kunnen uitbreiden naar een breed scala aan wetenschappelijke domeinen die een strikte redenering met een vleugje creativiteit vereisen. (Laten we eerlijk zijn: het zijn ze allemaal.)

“Gezien het bredere potentieel van het vanaf het begin trainen van AI-systemen met grootschalige synthetische data, zou deze aanpak vorm kunnen geven aan de manier waarop de AI-systemen van de toekomst nieuwe kennis ontdekken, op het gebied van wiskunde en daarbuiten”, schreef het team.

Krediet van het beeld: Joël Filipe / Unsplash 

spot_img

Laatste intelligentie

spot_img