Het fysieke beeld van Huawei's nieuwe generatie Ascend 950 AI-accelerator is voor het eerst zichtbaar en toont de verpakkingsvorm van de zelfontwikkelde chip en het zelfontwikkelde geheugen met hoge bandbreedte (HBM) van het bedrijf. Deze chip integreert Huawei's zelfontwikkelde HBM van de eerste generatie en een nieuwe generatie AI-versnellingseenheden in hetzelfde pakket. Het is gepositioneerd voor grootschalige computerclusters en concurreert via systeemschaal en clusterdichtheid, in plaats van 'hard-core' rivalen zoals Nvidia in termen van prestaties van een enkele chip.

Huawei heeft eerder aangekondigd dat de Ascend 950-serie begin 2026 officieel zal worden gelanceerd en minimaal twee modellen zal omvatten.

Uit rapporten blijkt dat van de Ascend 950-serie de 950PR-versie 128 GB Huawei's zelfontwikkelde HBM integreert, met een bandbreedte van ongeveer 1,6 TB/s; terwijl de 950DT-versie de capaciteit vergroot tot 144 GB en de bandbreedte aanzienlijk vergroot tot bijna 4 TB/s. De rekenkrachtdoelstellingen van beide chips zijn 1 PetaFLOPS-niveau FP8-prestaties en 2 PetaFLOPS-niveau FP4-prestaties voor een enkele kaart, gericht op de huidige reguliere grote modelinferentie- en trainingsscenario's. De algemene strategie van Huawei legt meer nadruk op verpakkingen met een hoge dichtheid en efficiënte interconnectienetwerken, en compenseert de kloof in de prestaties van één chip door de rekenkracht en de interconnectie-efficiëntie op kast- en datacenterniveau te verbeteren.

Wat betreft het productieproces wijst het artikel erop dat er momenteel geen officieel bevestigde informatie over procesknooppunten bestaat, maar de industrie verwacht over het algemeen dat de Ascend 950 waarschijnlijk het nieuwste N+3-proces van SMIC zal gebruiken, dat is geclassificeerd als een 5 nm-knooppunt. SMIC heeft eerder aangekondigd dat zijn N+3-knooppunt massaproductie heeft bereikt zonder afhankelijk te zijn van EUV-apparatuur, en de eerste publieke klant is Huawei's eindproduct uitgerust met Kirin 9030 SoC. In deze context wordt het, als Huawei's strategische AI-versnellingsproduct, als een "natuurlijke" gevolgtrekking beschouwd dat de Ascend 950 hetzelfde knooppunt gebruikt.

Op de fysieke foto heeft de Ascend 950 een verpakkingsontwerp met meerdere chips. De kern bestaat uit twee computerchips, en wordt gecombineerd met twee extra vermoedelijke I/O- en netwerkgerelateerde chipchips om een ​​multi-chipmodule (MCM) te vormen. Aangenomen wordt dat deze I/O- en netwerkchips verantwoordelijk zijn voor het verbinden van acceleratorkaarten met grotere SuperPoD- en SuperCluster-clusters, waardoor een hoge bandbreedte-interconnectie van honderdduizenden Ascend 950-kaarten wordt bereikt via een nieuwe generatie "Lingqu"-interconnectieprotocol en optische interconnectietechnologie. Er wordt gespeculeerd dat de module met een ring van verpakkingsstructuur verdeeld rond de chip die lijkt op de "LPDDR/HBM hybride vorm" Huawei's zelf ontwikkelde HBM-pakket is. Het wordt hoogstwaarschijnlijk geproduceerd in een onafhankelijk pakket en vervolgens gestapeld en geïntegreerd op het acceleratorsubstraat in een pakket op systeemniveau.

Over het geheel genomen vertoont het ontwerptraject van de Ascend 950 enkele overeenkomsten met high-end GPU's zoals NVIDIA Blackwell. Beide maken gebruik van dual-chip-verpakkingen om meer rekenkracht op één kaart te superponeren, en vertrouwen op HBM met hoge bandbreedte en speciale interconnect-protocollen om grootschalige computerclusters te bouwen. Het verschil is dat Huawei in de huidige fase meer gefocust is op het idee van ‘winnen op schaal’, in de hoop alternatieve oplossingen te vormen in de datacenter- en AI-cloud computing-krachtmarkten door middel van compacte verpakkingen, multi-card interconnectie en superclusteroplossingen, terwijl de onafhankelijke controleerbaarheid van de lokale toeleveringsketen wordt versterkt.