Volgens de officiële Weibo van Bytedance Seed heeft het Bytedance Seed-team officieel een nieuwe generatie beeldcreatiemodel Seedream 4.0 uitgebracht. Volgens rapporten gebruikt Seedream 4.0 dezelfde architectuur om grafische en algemene bewerkingsmogelijkheden te implementeren, waarbij gezond verstand en redeneervermogen worden geïntegreerd. Vergeleken met de vorige generatie modellen Seedream 3.0 en SeedEdit 3.0 heeft Seedream 4.0 aanzienlijke doorbraken bereikt op het gebied van multimodale effecten, snelheid en bruikbaarheid:


Multimodale gameplay-uitbreiding: ondersteunt flexibel de gecombineerde invoer van tekst en afbeeldingen, waardoor creatieve modi mogelijk zijn zoals op tekst gebaseerde afbeeldingen, op afbeeldingen gebaseerde afbeeldingen, beeldbewerking, bewerking van meerdere afbeeldingen en het genereren van groepsfoto's. De gameplay is creatief en divers.

Verbeterde gestileerde esthetiek: ondersteunt een hoge mate van vrijheid bij de migratie van artistieke stijlen, van barok tot cyberpunk, de stijlen veranderen voortdurend en kunnen worden gecombineerd om nieuwe stijlen met een uitstekende esthetiek te creëren.

Verbeterd logisch begrip: Gecombineerd met wereldkennis verbetert het het multimodale invoerbegrip. Het kan eerst 'tekenen' en 'denken', waarbij het zijn redeneer- en generatievermogen laat zien bij taken waarbij fysieke beperkingen en tijdsdruk een rol spelen, het oplossen van puzzels en kruiswoordraadsels, en doorgaan met het schrijven van strips.

Adaptieve en 4K-generatie: het best geproportioneerde beeld kan worden gegenereerd volgens instructies of referentiebeelden, en ondersteunt ook door de gebruiker gedefinieerde formaten. De maximale resolutie reikt van 2K tot 4K Ultra HD.

Inferentiesnelheidssprong: Door een nieuw en efficiënt architectuurontwerp en extreme destillatieversnelling is de inferentiesnelheid van de gegenereerde grafieken van DiT meer dan 10 keer hoger dan die van Seedream 3.0.

Volgens de officiële Weibo is Seedream 4.0 niet alleen een model voor het genereren van afbeeldingen, maar ook een complete multimodale creatieve motor. Gebaseerd op de nieuwste mogelijkheden van Seedream 4.0 worden acht basisgameplay-methoden van het model voorgesteld. Naast het genereren en bewerken van algemene afbeeldingen, wordt ook het potentieel van het model op het gebied van het maken van afgeleiden, het genereren van inferenties en professionele toepassingen onderzocht.