Hoewel de hardwarefaciliteiten van DeepSeek geen details hebben vrijgegeven, wordt algemeen aangenomen dat er een groot aantal NVIDIA AI-chips wordt gebruikt, waaronder H100, H800, H20 en andere verschillende modellen. Volgens de laatste informatie heeft DeepSeek echter ook de nieuwste AI-chip van Huawei geverifieerd: Ascend 910C.

Ascend 910C werd later in 2024 blootgesteld. Er wordt gezegd dat het in batches is geleverd aan sommige klanten, waaronder Alibaba, Baidu en Tencent. De eerste batch van ongeveer 70.000 eenheden, met een gemiddelde van slechts ongeveer 20.000 yuan per stuk.

Het bericht laat zien,Ascend 910C wordt vervaardigd met behulp van het 7nm-proces van SMIC, met geïntegreerde dubbele chipverpakking. Het aantal transistors bereikt 53 miljard, en het totale lokalisatiepercentage heeft ongeveer 55% bereikt.

Het kan NVIDIA H100 vervangen en wordt ook gebruikt voor grootschalige AI-training en gevolgtrekking. Het presteert goed onder verschillende gegevenstypen, zoals FP8, FP16, FP32 en FP64.

Stijg 910C

Volgens de laatste verklaring isUit gemeten gegevens van het DeepSeek-team blijkt dat Huawei’s Ascend 910C onverwacht goed presteert op het gebied van AI-inferentie, waarbij hij ongeveer 60% van die van de NVIDIA H100-chip bereikt.

Verder,Door middel van handgeschreven CUNN-kernel en optimalisatie kunnen de prestaties van Ascend 910C verder worden verbeterd.

Er wordt gezegd datDeepSeek ondersteunt Huawei Ascend-chips vanaf dag één, en onderhoudt onafhankelijk het PyTorch-magazijn, dat CUDA naar CUNN kan converteren met slechts één regel code. Het potentieel voor prestatie-optimalisatie is ook enorm, en hogere prestaties kunnen worden bereikt door op maat gemaakte optimalisatie.

Er moet echter worden opgemerkt dat wat momenteel bekend is, is dat de Ascend 910CAI uitstekende inferentieprestaties levert, maarDe AI-trainingsprestaties kunnen nog steeds onbevredigend zijn.


Shengteng 910