ChatGPT-5 is uitgebracht, dus een grote versie-update van het binnenlandse grote model DeepSeek is niet ver weg.Afgaande op de vragen die internetgebruikers aan DeepSeek stellen, is het antwoord van het model dat DeepSeek-R2 naar verwachting tussen 15 en 30 augustus 2025 zal worden uitgebracht.

Tegen deze achtergrond zijn de aandelenkoersen van veel bedrijven in de binnenlandse computerketen enorm gestegen. Cambrian heeft vandaag bijvoorbeeld een dagelijkse limiet van 20 cm bereikt, waarbij de aandelenkoers een recordhoogte heeft bereikt en de marktwaarde meer dan 355 miljard yuan bedraagt.

Volgens eerdere verklaringen zal het grote DeepSeek-R2-model een geavanceerder hybride expertmodel (MoE) gebruiken, dat wordt gecombineerd met een intelligentere poortnetwerklaag (Gating Network) om de prestaties van inferentietaken met hoge belasting te optimaliseren.

Sommige analisten voorspellen dat de prijs van DeepSeek-R2 aanzienlijk lager kan zijn dan die van vergelijkbare producten van OpenAI, wat erop wijst dat dit het prijsmodel van bestaande AI-diensten kan ondermijnen.

Bovendien blijkt uit relevant nieuws dat DeepSeek-R2 naar verwachting 97% minder zal kosten dan GPT-4; en het is getraind op de Ascend-kaart, waarbij de nadruk ligt op een alomvattende en onafhankelijke controle over de gehele industriële keten.

Volgens relevante bronnen kan het totale aantal parameters van DeepSeek-R2 oplopen tot 1,2 biljoen, wat ongeveer het dubbele is van de 671 miljard parameters van DeepSeek-R1.

DeepSeek-R2 is een model dat is getraind op basis van Huawei's Ascend 910B-chipcluster. Het heeft een rekenkracht van 512PetaFLOPS met een nauwkeurigheid van FP16 en een chipgebruiksefficiëntie van 82%.

Volgens statistieken van Huawei Labs zijn deze prestaties gelijk aan ongeveer 91% van NVIDIA's vorige generatie A100-trainingscluster. Of deze echt zijn of niet, valt nog te bezien, maar het lijkt krachtiger en autonomer te zijn.