Op 27 juni bracht Tencent publiekelijk een nieuw lid van de Hunyuan-modelfamilie uit: het Hunyuan-A13B-model, en kondigde aan dat het volledig open source zal zijn. Volgens officiële bronnen kan het Hunyuan-A13B-model onder extreme omstandigheden worden ingezet met slechts één mid- tot low-end GPU-kaart.


In het wiskundig redeneerexperiment voltooide het model nauwkeurig decimale vergelijkingen en demonstreerde het stapsgewijze analysemogelijkheden. Het duurde 3 seconden om diep na te denken.

Het Hunyuan-A13B-model maakte ook technologische innovaties. Tijdens de pre-training gebruikte het model een corpus van netwerkwoorden van hoge kwaliteit van 20 biljoen en verbeterde het theoretische systeem van de Scaling Law van de MoE-architectuur, waardoor kwantificeerbare technische richtlijnen werden geboden voor het ontwerp van de MoE-architectuur.

Hunyuan heeft ook twee nieuwe datasets beschikbaar gesteld om de lacunes in de relevante evaluatienormen in de sector op te vullen. Onder hen wordt ArtifactsBench voornamelijk gebruikt voor code-evaluatie en bouwt het een nieuwe benchmark met 1825 taken; C3-Bench ontwerpt 1024 testgegevens voor de evaluatie van agentscènemodellen om tekortkomingen in de modelmogelijkheden te ontdekken.


Momenteel is de model-API online op de officiële website van Tencent Cloud.