Tehnologia AvatarFX dezvoltată de echipa Character AI Multimodal deschide noi orizonturi pentru creație. Această inovație permite aducerea imaginilor la viață, generând videoclipuri fotorealiste, însoțite de sunet, mișcări faciale, ale mâinilor și ale corpului, toate păstrând o coerență temporală remarcabilă.
Cum funcționează AvatarFX?
Utilizând modele de difuzie bazate pe arhitectura DiT, AvatarFX oferă un realism excepțional în mișcările generate. Inovațiile includ o strategie de inferență unică, care păstrează calitatea vizuală și diversitatea expresivă chiar și în videoclipurile de lungă durată. Modelul poate anima atât personaje umane, cât și creaturi mitice sau obiecte inanimate.
Generarea vocilor se face printr-un model TTS (Text-to-Speech) proprietar, iar tehnicile avansate de distilare reduc timpul de procesare, menținând totodată calitatea.
Ce face AvatarFX diferit?
Caracteristicile distincte ale AvatarFX includ:
- Capacitatea de a genera videoclipuri de calitate superioară dintr-o imagine preexistentă;
- Coerență temporală ridicată, indiferent de durata videoclipului;
- Posibilitatea animării personajelor 2D și 3D, precum și a fețelor neobișnuite, cum ar fi cele ale animalelor;
- Control maxim asupra rezultatului final.
Prioritizarea siguranței
AvatarFX vine cu măsuri stricte pentru a preveni utilizările necorespunzătoare, cum ar fi deepfake-urile. Printre acestea se numără filtre pentru conținutul utilizatorilor, blocarea generării videoclipurilor ce implică minori sau figuri publice și aplicarea unui filigran pentru a evidenția faptul că videoclipurile nu sunt reale.