Zephyrnet-logo

Kunst is niet dood, het is gewoon machinaal gegenereerd

Datum:

Waarom AI-modellen artiesten zullen vervangen lang voordat ze programmeurs zullen vervangen

Misschien wel de meest verbijsterende implicatie die we zien van generatieve AI is dat, in tegenstelling tot de algemene opvatting dat creativiteit het laatste bastion van menselijke vindingrijkheid zal zijn in het licht van automatisering, het in feite lijkt te zijn veel makkelijker om vrij moeilijke creatieve taken te automatiseren dan om relatief eenvoudige programmeertaken te automatiseren. Om hier een idee van te krijgen, vergelijken we twee van de meer populaire use-cases voor generatieve AI: het genereren van code en het genereren van afbeeldingen. Maar we geloven dat de bewering meer in het algemeen standhoudt, zelfs als generatieve modellen zich uitbreiden naar complexere toepassingen.

De korte versie van het argument (die we hieronder in meer detail behandelen) is dat hoewel een product leuk is GitHub-copiloot, in zijn huidige vorm, het coderen iets efficiënter kan maken, neemt de behoefte aan bekwame softwareontwikkelaars met programmeerkennis niet weg. Een belangrijke reden is dat correctheid er echt toe doet als het gaat om het bouwen van een programma. Als AI een programma genereert, is er nog steeds een mens nodig om te verifiëren dat het correct is - een inspanning van bijna hetzelfde niveau als het maken ervan om mee te beginnen.

Aan de andere kant kan iedereen die kan typen een model gebruiken zoals Stabiele diffusie om binnen enkele minuten unieke afbeeldingen van hoge kwaliteit te produceren, tegen vele ordes van grootte tegen lagere kosten. Creatieve werkproducten hebben vaak geen strikte correctheidsbeperkingen en de resultaten van de modellen zijn verbluffend compleet. Het is moeilijk om geen volledige faseverschuiving te zien in industrieën die afhankelijk zijn van creatieve visuals, omdat voor veel toepassingen de visuals die AI nu kan produceren al voldoende zijn en we ons nog in de allereerste fase van de technologie bevinden.

We erkennen volledig dat het moeilijk is om vertrouwen te hebben in voorspellingen in het tempo waarin het veld beweegt. Op dit moment lijkt het echter veel waarschijnlijker dat we applicaties vol met creatieve afbeeldingen zien die uitsluitend door programmeurs zijn gemaakt, dan applicaties met door mensen ontworpen kunst die uitsluitend door makers zijn gemaakt. 

Waarom de hype, en waarom nu?

Voordat we ingaan op de details van het genereren van code versus het genereren van afbeeldingen, is het handig om een ​​idee te krijgen van hoe populair AI in het algemeen en generatieve AI in het bijzonder op dit moment zijn.

Generatieve AI ziet de snelste acceptatie door ontwikkelaars die we ooit hebben gezien. Terwijl we dit schrijven, staat Stable Diffusion ruimschoots bovenaan de trending charts van GitHub-repositories. De groei is ver vooruit op elke recente technologie in infrastructuur of crypto (zie de figuur hierboven). Er zijn bijna dagelijks lancerings- en financieringsaankondigingen van startups die de technologie gebruiken, en online sociale netwerken worden overspoeld met inhoud die is gemaakt door generatieve modellen.

Het totale investeringsniveau in AI in het afgelopen decennium kan ook moeilijk worden overschat. Alleen al in publicaties hebben we sinds het midden van de jaren 2010 een exponentiële toename gezien (zie onderstaande figuur). Tegenwoordig gaat ongeveer 20% van alle artikelen op arXiv over AI, ML en NLP. Belangrijk is dat de theoretische resultaten een kritieke drempel hebben overschreden waar ze gemakkelijk consumeerbaar zijn geworden en een Cambrische explosie van nieuwe technieken, software en startups hebben veroorzaakt. 

De meest recente piek in bovenstaande figuur is grotendeels te danken aan generatieve AI. In een decennium zijn we geëvolueerd van AI-modellen die alleen voor experts zijn bedoeld en die afbeeldingen kunnen classificeren en woordinbeddingen kunnen maken, naar openbaar bruikbare modellen die effectieve code kunnen schrijven en opmerkelijk nauwkeurige afbeeldingen kunnen maken met behulp van aanwijzingen in natuurlijke taal. Het is geen verrassing dat het tempo van innovatie alleen maar is toegenomen, en het zou geen verrassing moeten zijn wanneer generatieve modellen hun intrede doen in andere gebieden die ooit door mensen werden gedomineerd.

Generatieve AI en programmeren

Een van de eerste toepassingen van generatieve AI was als hulpmiddel voor programmeurs. De manier waarop het werkt, is dat een model wordt getraind op een groot corpus code (bijvoorbeeld alle openbare repo's in GitHub) en vervolgens een suggestie doet aan een programmeur terwijl deze codeert. De resultaten zijn uitstekend. Zozeer zelfs dat het redelijk is dat deze benadering in de toekomst synoniem zal worden met programmeren.

Gegenereerde code: beveiligd tegen aanvallen die geen puntkomma's gebruiken.

De productiviteitswinsten waren echter bescheiden ten opzichte van het genereren van afbeeldingen, die we hieronder bespreken. Een deel van de reden hiervoor, zoals hierboven vermeld, is dat correctheid van cruciaal belang is bij het programmeren (en inderdaad technische problemen in bredere zin, maar we concentreren ons op programmeren in dit bericht). Bijvoorbeeld, een recente studie gevonden dat voor scenario's die overeenkomen met een hoog risico CWE's (gemeenschappelijke zwakte-opsommingen), bevatte 40% van de door AI gegenereerde code kwetsbaarheden.

De gebruiker moet dus een evenwicht zien te vinden tussen het genereren van voldoende code om een ​​zinvolle productiviteitsverhoging te bieden, en tegelijkertijd deze te beperken zodat het mogelijk is om op juistheid te controleren. Als gevolg hiervan heeft Copilot geholpen de productiviteit van ontwikkelaars verbeteren — recente studies (hier en hier) winst in de orde van grootte van 2x of minder, maar op een niveau dat vergelijkbaar is met wat we hebben gezien in eerdere ontwikkelingen op het gebied van ontwikkeltalen en tooling. De sprong van assemblage naar C verbeterde bijvoorbeeld de productiviteit 2-5x volgens sommige schattingen.

Voor meer ervaren programmeurs kunnen zorgen verder gaan dan de correctheid van de code en de algehele kwaliteit van de code. Net zo snel.aiis Jeremy Howard heeft uitgelegd met betrekking tot recente versies van het OpenAI Codex-model, “[I] t schrijft uitgebreide code omdat het genereert gemiddelde code. Voor mij is het veel langzamer om gemiddelde code te nemen en er code van te maken die ik leuk vind en waarvan ik weet dat hij correct is, dan het helemaal opnieuw te schrijven - tenminste in talen die ik goed ken.

Dus hoewel het duidelijk is dat generatief programmeren een stapsgewijze functie is in de productiviteit van ontwikkelaars, is het niet duidelijk dat de verbetering dramatisch verschilt van de verbeteringen die we eerder hebben gezien. Generatieve AI maakt betere programmeurs, maar ze moeten nog steeds programmeren.

Generatieve AI en visuals

Aan de andere kant is de impact van generatieve modellen op creatieve werkoutput, zoals het genereren van afbeeldingen, extreem. Het heeft geresulteerd in vele ordes van grootte verbeteringen in efficiëntie en kosten, en het is moeilijk om niet te zien dat het een sectorbrede faseverschuiving inluidt.

De manier waarop generatieve AI in deze ruimte werkt, is door eenvoudige tekstinvoer van de gebruiker te nemen, prompts genaamd, en vervolgens genereert het model een visuele uitvoer. Momenteel zijn er modellen voor het maken van vele uitvoerformaten, waaronder afbeeldingen, video's, 3D-modellen en texturen.

Wat vooral interessant is, is hoe deze modellen kunnen worden uitgebreid om nieuwe of domeinspecifieke afbeeldingen te genereren met bijna geen creatieve tussenkomst. Guido (een van de auteurs) nam bijvoorbeeld een vooraf getraind beeldmodel en trainde dit opnieuw op enkele tientallen foto's van hemzelf. Van daaruit kon hij afbeeldingen genereren met behulp van in de prompt. Hieronder staan ​​foto's die zijn gegenereerd op basis van de volgende prompts: "als kapitein Amerika","in Parijs","op een schilderij'.


Waar beeldgeneratie een enorme afwijking is van codegeneratie in een zakelijke context, is de mate waarin generatieve AI de economische calculus verandert. Om de bovenstaande foto's te maken, trainde Guido het model op een handvol foto's die ongeveer $ 50 aan infrastructuurmiddelen kostten. Eenmaal getraind, kost het genereren van afbeeldingen ongeveer $ 0.001 in rekenbronnen en kan worden gedaan in de cloud of op een laptop van de nieuwste generatie. Verder duurt het genereren van de afbeelding slechts enkele seconden. 

Zonder generatieve AI is de enige manier om een ​​aangepaste afbeelding te krijgen, een artiest inhuren of het zelf doen. Zelfs als we uitgaan van de veronderstelling dat een persoon binnen een uur een volledig op maat gemaakte, fotorealistische afbeelding kan maken voor $ 10, de generatieve AI-benadering is al snel vier ordes van grootte goedkoper en een orde van grootte sneller. Meer realistisch gezien zal elk aangepast kunstwerk of grafisch ontwerpproject waarschijnlijk dagen of weken in beslag nemen en honderden, zo niet duizenden dollars kosten. 

Net als bij de bovenstaande programmeerhulpmiddelen, zal generatieve AI zijn overgenomen als hulpmiddel door kunstenaars en beide vereisen een zekere mate van toezicht van de gebruiker. Maar het verschil in economie dat wordt gecreëerd door het vermogen van een beeldmodel om de volledige uitvoer van een artiest na te bootsen, kan moeilijk worden overschat. Met behulp van een model voor het genereren van code vereist het schrijven van zelfs een zeer eenvoudig functioneel programma dat een standaard computertaak uitvoert, het beoordelen, bewerken en testen van veel codefragmenten. Maar voor een basisafbeelding kan het invoeren van een prompt en het kiezen van een afbeelding uit een dozijn suggesties binnen een minuut worden gedaan.

Neem bijvoorbeeld onze eigen cartoonist (en investeringspartner) Yoko Li (@stuffyokodraws). We hebben een model getraind met behulp van 70 van haar eerdere afbeeldingen en het model was in staat afbeeldingen te genereren met een griezelig niveau van nabootsing. Elke artiest moet uitzoeken wat hij vervolgens gaat maken, en ze ontdekte zelfs dat de getrainde modellen meer opties naar voren kunnen brengen dan ze in gedachten had - tenminste als ze onder druk werden gezet om iets te produceren binnen een bepaalde tijdsperiode. Er zijn honderden manieren om hetzelfde object te tekenen, maar generatieve modellen maakten meteen duidelijk welke paden het ontdekken waard zijn. 

Dus als het om dergelijke taken gaat, beweren we niet dat computers dat noodzakelijkerwijs zijn beter dan mensen op een 1:1 basis. Maar zoals bij zoveel andere taken, wanneer computers volledige werkoutput kunnen produceren, vermoorden ze ons gewoon schaal

Probeer te raden welke van de onderstaande tekeningen rechtstreeks door Yoko zijn getekend en welke zijn gegenereerd. 

Antwoord: Het AI-model genereerde de afbeeldingen met een niet-witte achtergrond.

De enorme verbetering in economie, de flexibiliteit om nieuwe stijlen en concepten te kunnen bedenken en de mogelijkheid om volledige of bijna volledige werkoutput te genereren, suggereert voor ons dat we op het punt staan ​​een duidelijke verandering te zien in alle industrieën waar creatieve middelen een belangrijke rol spelen. grootste deel van het bedrijf. En dit beperkt zich niet tot afbeeldingen, maar geldt voor het hele ontwerpveld. Bijvoorbeeld:

  • Generatieve AI kan 2D-kunst, texturen, 3D-modellen maken en helpen bij het ontwerpen van levels voor games. 
  • In marketing lijkt het klaar om stock art, productfotografie en illustratie te vervangen. 
  • We zien al toepassingen in webdesign, interieurontwerp en landschapsontwerp.

En we staan ​​echt nog maar aan het begin. Als een use case creatieve generatie van content vereist, is het moeilijk te begrijpen waarom generatieve AI deze niet zal verstoren of op zijn minst onderdeel van het proces zal worden.

-

Oké, dus wat is het punt van dit bericht? Hoewel het enigszins eng is gericht op het genereren van code en het genereren van afbeeldingen, vermoeden we dat de resultaten breder gelden. In het bijzonder dat creatieve inspanningen over de hele linie - of ze nu visueel, tekstueel of muzikaal zijn - waarschijnlijk zullen worden verstoord door AI lang voordat systemen worden gebouwd. 

Naast het correctheidsargument dat we hierboven gebruiken, kan het ook zo zijn dat het combineren en opnieuw combineren van alle stand van de techniek voldoende kan zijn voor het praktische bereik van creatieve outputs. De muziek- en filmindustrie hebben bijvoorbeeld in het verleden talloze kopieën van populaire albums en films geproduceerd. Het is heel goed denkbaar dat generatieve modellen deze functies in de loop van de tijd kunnen helpen automatiseren. Het opmerkelijke aan zoveel van de beelden die door Stable Diffusion en DALL-E 2 worden geproduceerd, is echter dat ze zijn echt goed en echt interessant. Het is niet moeilijk om je een AI-model voor te stellen dat echt interessante fusies van muziekstijlen produceert of zelfs speelfilms 'schrijft' die intrigerend zijn in hoe ze concepten en stijlen met elkaar verbinden. 

Integendeel, het is moeilijk voor te stellen dat eerdere systemen alle tools zullen bevatten die we nodig hebben om alle toekomstige systemen te ontwikkelen. Of zelfs dat complexe systemen net zo gemakkelijk gecombineerd kunnen worden als verschillende kunst- of muziekstijlen. Zo vaak zit de waarde van een systeem, en waarom ze zo moeilijk te bouwen zijn, in de lange staart van details - alle compromissen, tijdelijke oplossingen, optimalisaties voor een bepaalde ontwerpruimte en institutionele/latente kennis die ze bevatten. Dus verder bouwen moeten we.

We zullen de drang om te voorspellen weerstaan precies hoe generatieve AI de creatieve industrie zal beïnvloeden. Echter, de geschiedenis suggereert dat nieuwe tools de neiging hebben uitbreiden in plaats van de definitie van kunst te contracteren, en om het toegankelijk te maken voor nieuwe soorten artiesten. In dit geval zijn de nieuwe artiesten systeembouwers. Dus, voor tech-oprichters zijn we van mening dat generatieve AI strikt een positieve tool is voor het vergroten van het bereik van software – games worden mooier, marketing aantrekkelijker, geschreven inhoud boeiender, films inspirerender.

Wie weet: ooit zal een internetarchief van eind 2022 worden gekoesterd als een van de laatste grotendeels door mensen gegenereerde inhoudsbronnen. Deze tekst voor dit artikel is in ieder geval volledig door mensen gegenereerd. 

Dit stuk is geschreven door het a16z infra-team, met primaire auteurs Guido Appenzeller, Matt Bornstein, Martin Casado en Yoko Li, en een grote bijdrage van de rest van het team.

***

De standpunten die hier naar voren worden gebracht, zijn die van het individuele personeel van AH Capital Management, LLC (“a16z”) dat wordt geciteerd en zijn niet de standpunten van a16z of haar gelieerde ondernemingen. Bepaalde informatie in dit document is verkregen uit externe bronnen, waaronder van portefeuillebedrijven van fondsen die worden beheerd door a16z. Hoewel ontleend aan bronnen die betrouwbaar worden geacht, heeft a16z dergelijke informatie niet onafhankelijk geverifieerd en doet het geen uitspraken over de huidige of blijvende nauwkeurigheid van de informatie of de geschiktheid ervan voor een bepaalde situatie. Bovendien kan deze inhoud advertenties van derden bevatten; a16z heeft dergelijke advertenties niet beoordeeld en keurt de daarin opgenomen advertentie-inhoud niet goed.

Deze inhoud is uitsluitend bedoeld voor informatieve doeleinden en mag niet worden beschouwd als juridisch, zakelijk, investerings- of belastingadvies. U dient hierover uw eigen adviseurs te raadplegen. Verwijzingen naar effecten of digitale activa zijn alleen voor illustratieve doeleinden en vormen geen beleggingsaanbeveling of aanbod om beleggingsadviesdiensten te verlenen. Bovendien is deze inhoud niet gericht op of bedoeld voor gebruik door beleggers of potentiële beleggers, en mag er in geen geval op worden vertrouwd bij het nemen van een beslissing om te beleggen in een fonds dat wordt beheerd door a16z. (Een aanbod om te beleggen in een a16z-fonds wordt alleen gedaan door middel van het onderhandse plaatsingsmemorandum, de inschrijvingsovereenkomst en andere relevante documentatie van een dergelijk fonds en moet in hun geheel worden gelezen.) Alle genoemde beleggingen of portefeuillebedrijven waarnaar wordt verwezen, of beschreven zijn niet representatief voor alle investeringen in voertuigen die door a16z worden beheerd, en er kan geen garantie worden gegeven dat de investeringen winstgevend zullen zijn of dat andere investeringen die in de toekomst worden gedaan vergelijkbare kenmerken of resultaten zullen hebben. Een lijst van investeringen die zijn gedaan door fondsen die worden beheerd door Andreessen Horowitz (met uitzondering van investeringen waarvoor de uitgevende instelling geen toestemming heeft gegeven aan a16z om openbaar te maken, evenals onaangekondigde investeringen in openbaar verhandelde digitale activa) is beschikbaar op https://a16z.com/investments /.

De grafieken en grafieken die hierin worden verstrekt, zijn uitsluitend bedoeld voor informatieve doeleinden en er mag niet op worden vertrouwd bij het nemen van een investeringsbeslissing. In het verleden behaalde resultaten zijn geen indicatie voor toekomstige resultaten. De inhoud spreekt alleen vanaf de aangegeven datum. Alle projecties, schattingen, voorspellingen, doelstellingen, vooruitzichten en/of meningen die in deze materialen worden uitgedrukt, kunnen zonder voorafgaande kennisgeving worden gewijzigd en kunnen verschillen of in strijd zijn met meningen van anderen. Zie https://a16z.com/disclosures voor aanvullende belangrijke informatie.

spot_img

Laatste intelligentie

spot_img