Vandaag heeft Tencent officieel het Hunyuan 3D World Model 2.0 (HY-World 2.0) vrijgegeven en open source beschikbaar gesteld. Volgens rapporten is HY-World 2.0 een multimodaal wereldmodel dat verschillende soorten invoer, zoals tekst, afbeeldingen en video's, kan begrijpen en automatisch 3D-werelden kan genereren, reconstrueren en simuleren. Het ondersteunt ook de export van 3D-middelen in meerdere formaten (Mesh/3DGS/puntenwolken, enz.) en kan naadloos worden verbonden met bestaande gameworkflows om snel gamekaarten en niveauprototypes te genereren.
Er wordt gemeld dat, in tegenstelling tot Google's Genie 3 en Hunyuan World Model 1.5, die alleen videobestanden kunnen genereren, World Model 2.0 zelfs nog praktischer is: het kan rechtstreeks 3D-activabestanden genereren die twee keer kunnen worden bewerkt. Deze gegenereerde 3D-middelen kunnen rechtstreeks worden geïmporteerd in gameproductie of in belichaamde simulatie-engines om echt speelbare en bruikbare resultaten te bereiken.
Momenteel is World Model 2.0 gelanceerd op de officiële website van Tencent Hunyuan 3D Creation Engine, en gebruikers kunnen zich aanmelden om het te gebruiken.
Hunyuan World Model 2.0 ondersteunt meerdere invoer van tekst, afbeeldingen en video's. Voer een stukje tekst of een afbeelding in en het model kan met één klik de complexe semantiek nauwkeurig analyseren en een verscheidenheid aan verplaatsbare werelden genereren. Vergeleken met Hunyuan World Model 1.0 is de modelarchitectuur van 2.0 volledig geüpgraded en zijn de beeldprecisie en het realisme aanzienlijk verbeterd. Gebruikers kunnen ook de stijl aanpassen en op verzoek realistische, komische of game-achtige 3D-ruimtes genereren. Nadat het genereren is voltooid, kunnen gebruikers de assets importeren in zoekmachines zoals Unity en UE voor secundaire bewerking, wat de drempel voor het maken van gamekaarten aanzienlijk verlaagt.
Het model ondersteunt ook de karaktermodus. Gebruikers kunnen personages besturen om vrijelijk straten, gebouwen en scènes te verkennen, zonder tijdslimiet en fysieke botsingen, net als in het spel. Tegelijkertijd ondersteunt World Model 2.0 het repliceren van echte 3D-scènes. Gebruikers kunnen een video- of multiview-afbeelding van een echte ruimte invoeren, en het model kan een zeer nauwkeurige digitale dubbele ruimte bouwen. Gebaseerd op de geüpgradede WorldMirror 2.0-architectuur ondersteunt het model beeld- en video-invoer van elke grootte, voorspelt het in één keer dichte puntenwolken, dieptekaarten met meerdere weergaven, oppervlaktenormalen en cameraparameters, en genereert deze één keer en kan ze permanent hergebruiken. In de toekomst kunnen op basis van deze mogelijkheden snel vooruitzicht op interieurdecoratie, stadsplanning, bescherming van cultureel erfgoed en andere scenario's worden gebouwd en hersteld.
Hunyuan World Model 2.0 neemt 3D als hoofdas en bereikt generatie-effecten op SOTA-niveau door middel van een uniforme architectuur voor ruimtelijk begrip, generatie en reconstructie. Vergeleken met andere wereldmodellen presteert Hunyuan World Model 2.0 beter op het gebied van volledigheid van scènes (zij- en achterkanten van objecten) en naleving van invoerafbeeldingen. De hybride weergave van 3DGS en Mesh, gegenereerd door Hunyuan, stelt gebruikers ook in staat de karaktermodus in te schakelen voor interactie met echte objectbotsingen.
