Zephyrnet-logo

Point-E: een systeem voor het genereren van 3D-puntenwolken op basis van complexe prompts

Datum:

Hoewel recent werk aan het genereren van tekstvoorwaardelijke 3D-objecten veelbelovende resultaten heeft opgeleverd, vereisen de geavanceerde methoden doorgaans meerdere GPU-uren om een ​​enkel monster te produceren. Dit staat in schril contrast met state-of-the-art generatieve beeldmodellen, die samples produceren in een aantal seconden of minuten. In dit artikel onderzoeken we een alternatieve methode voor het genereren van 3D-objecten die 3D-modellen produceert in slechts 1-2 minuten op een enkele GPU. Onze methode genereert eerst een enkele synthetische weergave met behulp van een tekst-naar-beeld-diffusiemodel en produceert vervolgens een 3D-puntenwolk met behulp van een tweede diffusiemodel dat de gegenereerde afbeelding bepaalt. Hoewel onze methode nog steeds achterblijft bij de state-of-the-art in termen van monsterkwaliteit, is het één tot twee ordes van grootte sneller om monsters uit te nemen, wat een praktische afweging biedt voor sommige gebruikssituaties. We geven onze voorgetrainde puntenwolk-diffusiemodellen, evenals evaluatiecode en -modellen vrij op deze https-URL.

spot_img

Laatste intelligentie

spot_img