Google heeft vandaag een nieuwe familie open source-vertaalmodellen uitgebracht, TranslateGemma, gebaseerd op het nieuwste open source-gewichtsmodel Gemma 3, dat officieel "een belangrijke stap in het openstellen van het vertaalveld" wordt genoemd. De eerste batch ondersteunt maximaal 55 talen, waaronder reguliere talen zoals Spaans, Frans, Chinees en Hindi.

De timing van deze release volgt nauwgezet de dynamiek van de concurrenten: nog maar een paar uur geleden had OpenAI zojuist de ChatGPT Translate-tool gelanceerd, die zich richt op toon- en contextcontrole. Via een interface met twee kolommen en automatische taalherkenning probeert het traditionele vertaaldiensten zoals Google Translate uit te dagen op het gebied van gebruikerservaring en contextbegrip. Daarentegen legt TranslateGemma meer nadruk op de mogelijkheden van open modellen en de algehele vertaalkwaliteit op meerdere benchmarks.
De TranslateGemma-familie is momenteel beschikbaar in drie groottes: 4 miljard, 12 miljard en 27 miljard parameters. Evaluatieresultaten van Google laten zien dat TranslateGemma 12B op de WMT24++ benchmark beter presteerde dan de basisversie van Gemma 3 27B, wat betekent dat het met minder dan de helft van het aantal parameters een hogere doorvoer en lagere latentie kan bereiken, terwijl de vertaalnauwkeurigheid behouden of zelfs verbeterd wordt, wat gunstig is voor ontwikkelaars bij het inzetten van hoogwaardige vertaalmodellen in omgevingen met beperkte rekenkracht.
In termen van implementatiescenario's zei Google dat het 4B-model is geoptimaliseerd voor mobiele inferentie en geschikt is om lokaal te draaien op eindapparaten zoals mobiele telefoons; het 12B-model is gericht op lokale rekenkrachtscenario's zoals consumentenlaptops; en het 27B-model vereist sterkere ondersteuning voor rekenkracht, zoals NVIDIA H100 met één kaart in de cloud en andere configuraties. Op de Vistra-benchmark voor beeldvertaling behaalde TranslateGemma ook betere resultaten op de taak voor tekstvertaling binnen de afbeelding, ook al was deze niet specifiek afgestemd op dit scenario, wat het potentieel van het model voor multimodaal tekstbegrip aantoont.
Google heeft bekendgemaakt dat de prestatieverbetering van TranslateGemma voortkomt uit een trainingsproces in twee fasen. De eerste fase is het begeleid afstemmen. Het onderzoeksteam introduceerde een grote hoeveelheid menselijk vertaalcorpus bovenop het Gemma 3-basismodel en combineerde dit met hoogwaardige synthetische gegevens gegenereerd door het Gemini-model voor training. De tweede fase maakt gebruik van versterkend leren om de optimalisatie van de vertaalkwaliteit te begeleiden via een reeks beloningsmodellen, waaronder MetricX-QE, AutoMQM en andere geavanceerde indicatoren, waardoor het model natuurlijker en contextueel geschikter wordt voor vertaaluitvoer.
Momenteel is het volledige assortiment TranslateGemma-modellen beschikbaar om te downloaden op de Kaggle- en Hugging Face-platforms, zodat onderzoekers en ontwikkelaars vrijelijk kunnen experimenteren en ontwikkelen. Terwijl OpenAI vertalingen verder integreert in op chat gebaseerde front-end-producten, biedt Google meer technische opties voor de constructie van applicaties van derden door het ontsluiten van krachtige onderliggende modellen, wat er ook op wijst dat het automatische vertaaltraject de concurrentie op de twee niveaus van open modellen en servicegerichte tools zal intensiveren.
Gerelateerde artikelen:
ChatGPT Translate is online: OpenAI lanceert een nieuwe reeks uitdagingen voor Google Translate