Zephyrnet-logo

Emu Video en Emu Edit: Meta introduceert AI-modellen voor video en afbeeldingen - Decrypt

Datum:

Meta op donderdag liet een voorproefje zien van zijn twee nieuwste AI-tools, Emu Video en Emu Edit, die de eerste echte kijk op technologie bieden, aangekondigd op Meta Connect in september. Emu Video is een tool waarmee gebruikers video's kunnen maken op basis van pure tekstprompts, terwijl Emu Edit een andere benadering van beeldbewerking introduceert, bekend als inpainting.

De introductie van Emu Video en Emu Edit is een strategische zet voor Meta, die volgens hem nog steeds aansluit bij de eigen strategie bredere visie voor de Metaverse. Het bedrijf zegt dat deze tools nieuwe creatieve mogelijkheden bieden die zijn ontworpen om een ​​breed scala aan gebruikers aan te spreken, van professionele makers van inhoud tot mensen die eenvoudigweg op zoek zijn naar nieuwe manieren om ideeën uit te drukken.

Met name Emu Video demonstreert de toewijding van het bedrijf aan het bevorderen van AI-gestuurde contentgeneratie – en zou een belangrijke concurrent kunnen worden van populaire namen als Runway en Pika Labs, die tot nu toe de ruimte hebben gedomineerd.

Emu Video: tekst-naar-video-creatie

Emu Video hanteert een proces in twee stappen voor het maken van video's op basis van tekstprompts. Het genereert eerst een afbeelding op basis van de ingevoerde tekst en produceert vervolgens een video die is afgeleid van zowel de tekst als de gegenereerde afbeelding. Deze aanpak vereenvoudigt het proces voor het genereren van video's en vermijdt de complexere, multi-modelmethoden die worden gebruikt om Meta's vorige aan te drijven Maak een video gereedschap.

De video's gemaakt door Emu Video zijn beperkt tot een resolutie van 512×512 pixels, maar vertonen een opmerkelijke samenhang met de aangeboden tekstprompts. Het nauwkeurig omzetten van tekst in visuele verhalen onderscheidt Emu Video van de meeste bestaande modellen en commerciële oplossingen.

Hoewel de modellen zelf niet openbaar beschikbaar zijn, kunnen gebruikers experimenteren met een reeks vooraf bepaalde aanwijzingen, en de resultaten zijn dat ook behoorlijk soepel, met minimale verschillen tussen frames.

Emu Edit: beeldbewerking met inpainting

Naast Emu Video demonstreerde Meta ook de mogelijkheden van Emu Edit, een AI-gestuurde tool die is ontworpen om verschillende beeldbewerkingstaken uit te voeren op basis van AI's interpretatie van natuurlijke taalinstructies. Met Emu Edit kunnen gebruikers afbeeldingen bewerken met een hoge mate van precisie en flexibiliteit.

"Emu Edit [is] een multi-task beeldbewerkingsmodel dat state-of-the-art resultaten oplevert in op instructies gebaseerde beeldbewerking", zegt Meta's research paper want de tool onderstreept zijn vermogen om complexe bewerkingsinstructies nauwkeurig uit te voeren.

De precisie van Emu Edit wordt verbeterd door het gebruik van diffusers, een geavanceerde AI-technologie die populair is geworden Stabiele diffusie. Deze aanpak zorgt ervoor dat bewerkingen de visuele integriteit van de originele afbeeldingen behouden.

Meta's focus op het ontwikkelen van AI-tools zoals Emu Video en Emu Edit belichaamt haar strategie om technologieën te creëren die cruciaal zijn voor het creëren van de Metaverse. Dit omvat de ontwikkeling van Meta-AI, een persoonlijke assistent aangedreven door het grote taalmodel LLaMA-2, en de introductie van multimodaliteit in AR-apparaten.

Bewerkt door Ryan Ozawa.

Blijf op de hoogte van cryptonieuws, ontvang dagelijkse updates in je inbox.

spot_img

Laatste intelligentie

spot_img