Tijdens de I/O Developer Conference van dit jaar heeft Google officieel de nieuwe generatie modellen uit de Gemini 3.5-serie en de nieuwe Gemini Omni-serie uitgebracht. Gemini 3.5 Flash is de eerste die voor het publiek is opengesteld, terwijl Gemini Omni zich richt op de mogelijkheid om "video te genereren uit elke invoer".
Gemini 3.5 Flash is al beschikbaar voor alle gebruikers via de AI-modus in de Gemini-app en Google Search. Google beweert dat het model in veel opzichten een intelligentieniveau heeft dat vergelijkbaar is met grote vlaggenschipmodellen, terwijl de consistente hogesnelheidsprestaties van de Flash-serie behouden blijven.

Volgens de inleiding is Gemini 3.5 Flash momenteel het sterkste Gemini-agent- en codegeneratiemodel. Het overtreft Gemini 3.1 Pro zelfs in benchmarktests met betrekking tot complexe code en agenten, en behoudt de leiding op het gebied van multimodaal begrip, dus het is ook ingesteld als het huidige standaardmodel. Gebruikers kunnen dit model rechtstreeks aanroepen in dagelijkse zoekopdrachten, in-app-gesprekken en andere scenario's om snellere en slimmere antwoorden en code-ondersteuning te krijgen.
Gemini Omni, dat tegelijkertijd wordt onthuld, vertegenwoordigt Google's nieuwste poging in de richting van generatieve video. Dit nieuwe model kan vanuit elke invoer video's genereren. Gebruikers kunnen afbeeldingen, audio, video's en tekst vrij combineren als invoer, en het model genereert video-inhoud van hoge kwaliteit op basis van Gemini's praktijkkennis. Nadat het genereren is voltooid, kunnen gebruikers ook meerdere rondes van gespreksbewerking uitvoeren via natuurlijke taal om de details in de video aan te passen en te verfijnen.
Het eerste model in de Gemini Omni-serie is Gemini Omni Flash, dat gedeeltelijke of algehele aanpassing van de video ondersteunt en de verhalende samenhang van de originele scène kan blijven behouden tijdens meerdere creatierondes, waardoor gebruikers zich voortdurend kunnen aanpassen zonder de hoofdverhaallijn te verliezen. Google zei dat dit model een meer intuïtief begrip heeft van fysieke concepten zoals zwaartekracht, kinetische energie en vloeistofdynamica, waardoor het realistischere en geloofwaardiger dynamische scènes kan genereren.
Op het gebied van creatieve ervaring stelt Gemini Omni gebruikers in staat hun eigen stemmen en avatars te gebruiken om deel te nemen aan het maken van video's, waardoor digitale avatars met persoonlijke kenmerken worden gegenereerd. Om de traceerbaarheids- en veiligheidsproblemen van synthetische inhoud aan te pakken, zullen alle video’s die door dit model worden gegenereerd, worden ingebed met digitale watermerken van SynthID voor het labelen en identificeren van door AI gegenereerde inhoud.
Wat de beschikbaarheid betreft, is Gemini Omni Flash vanaf vandaag beschikbaar voor wereldwijde abonnees. Gebruikers die zich abonneren op de Google AI Plus-, Pro- en Ultra-abonnementen kunnen het model rechtstreeks in de Gemini-app en Google Flow gebruiken. Tegelijkertijd introduceert Google deze mogelijkheid ook gratis in YouTube Shorts en YouTube Create, waardoor meer videomakers de functie voor het genereren van video's op basis van Gemini-technologie op reguliere inhoudsplatforms kunnen ervaren.