Volgens nieuws van 17 december, volgens Jinyang.com, werd op 6 van deze maand de Supercomputing Innovation Application Conference 2023 met als thema "Superintelligence Fusion, Computing Starts a New Chapter" groots gehouden in Guangzhou. Op deze conferentie heeft het National Supercomputing Center in Guangzhou officieel de nieuwe generatie binnenlandse supercomputersystemen van het centrum vrijgegeven: "Tianhe Xingyi".
Volgens Lu Yutong, directeur van het National Supercomputing Center in Guangzhou, is "Tianhe Xingyi" applicatiegericht en gebouwd met behulp van sleuteltechnologieën zoals binnenlandse geavanceerde computerarchitectuur, krachtige multi-core processors, snelle interconnectienetwerken en grootschalige opslag.
Het heeft de algemene CPU-rekenkracht, netwerkmogelijkheden, opslagmogelijkheden en applicatieservicemogelijkheden verdubbeld in vergelijking met "Tianhe-2", en ondersteunt de behoeften van verschillende applicatiescenario's zoals high-performance computing, AI-training voor grote modellen en big data-analyse.
Het zal de multi-field applicatieservicemogelijkheden van het National Supercomputing Guangzhou Center verder verbeteren, sterke high-end rekenkracht en platformondersteuning bieden voor baanbrekende wetenschappelijke en technologische doorbraken, strategische engineeringconstructies en industriële modernisering en transformatie in Guangzhou, de provincie Guangdong en de Guangdong-Hong Kong-Macao Greater Bay Area, de wetenschappelijke en technologische innovatiekracht van Guangzhou als nationale centrale stad en alomvattende toegangspoort effectief versterken, en de hoogwaardige ontwikkeling van regionale wetenschap, technologie, economie en samenleving ondersteunen.
Chen Zhiguang, adjunct-directeur van het National Supercomputing Center in Guangzhou, zei dat "Tianhe Xingyi" de meest geavanceerde supercomputertechnologie gebruikt. Vergeleken met het originele systeem is de algemene rekenkracht vervijfvoudigd. Ook benadrukte hij de verbetering van applicatiemogelijkheden en er is ruimte voor verdere ontwikkeling van applicatiesoftware.
Het uiteindelijke doel van het supercomputing-internet is het realiseren van landelijke netwerken, en de volgende stap is het realiseren van netwerken met Shenzhen Supercomputing en Wuxi Supercomputing.
De algemene rekenkracht van Tianhe Xingyi is vervijfvoudigd
Volgens de gegevens wordt "Tianhe-2" ingezet in het National Supercomputing Center in Guangzhou. Het maakt gebruik van Intel Watt, de theoretische prestaties zijn 54,9 PFLOPS (549 miljard keer) en de topprestaties van Linpack zijn 33,86 PTFLOPS. De prestaties zijn niet veranderd tussen juni 2013 en juni 2016, en hij is zes keer verkozen tot TOP500-kampioen.
Tianhe-2 had oorspronkelijk een later upgradeplan, maar in 2015 vaardigde de Amerikaanse regering een verbod uit dat bedrijven zoals Intel verbood krachtige computerchips te exporteren naar de vier supercomputercentra van China. Als gevolg hiervan kan Tianhe-2, dat Intel Xeon Phi-acceleratorkaarten gebruikt, niet langer gebruik maken van krachtige chips van Amerikaanse bedrijven.
In september 2017 kondigde het Guangzhou Supercomputing Center aan dat het het Tianhe-2 supercomputersysteem tegen eind 2017 zou upgraden.Gebruik de binnenlandse versneller Matrix2000 om de originele IntelXeonPhi-versneller te vervangen.
Het is duidelijk dat de gehele architectuur van Matrix2000 ARM zou moeten zijn, maar de vectoreenheid is een in eigen land aangepaste 256bitVFU-vectoreenheid.
Elke Matrix2000 bestaat uit 128 cores, heeft een frequentie van 1,2 GHz, kan 16 dubbele-precisiebewerkingen per cyclus uitvoeren en heeft een piekprocessorprestatie van 2,45 TFLOPS. De geüpgradede Tianhe-2 heet Tianhe 2A en de topprestaties zijn verhoogd van de vorige 54,9PFLOPS naar ongeveer 100PFLOPS.
Volgens de officiële verklaring zijn de algemene prestaties van "Tianhe Xingyi" 5 keer hoger dan die van het originele systeem (de geüpgradede "Tianhe 2", ook bekend als Tianhe 2A) in termen van algemene rekenkracht. Met andere woorden, de piekrekenkracht van "Tianhe Xingyi" zou ongeveer 600PFlop/s (5 miljard keer per seconde) moeten bereiken.
Het is vermeldenswaard dat op de "ChinaSC2023 Fifth China Super Computing Power Conference", gehouden in Peking op 10 november van dit jaar, de 2023 China High-Performance Computer Performance Top 100 Ranking werd vrijgegeven, die de prestatieparameters onthulde van de hoogst gerangschikte "Supercomputing Center Host System Heterogeneous Many-Core Processor", geïnstalleerd in het supercomputercentrum in 2023.
Het aantal CPU-cores bedraagt 15.974.400 cores en de topprestaties bereiken 620PFLOPS, wat Sunway TaihuLight overtreft. Het is duidelijk dat deze gegevens consistent zijn met de vorige verklaring over de rekenkracht van "Tianhe Xingyi".
Op 12 augustus van dit jaar kondigde de National University of Defense Technology de "Single Source Negotiation Announcement (2023-YKJSJY-F5027) for Domestic Tianhe New Generation Supercomputer Intelligent Computing Node Machine Time Services" aan, waaruit bleek dat "het de bedoeling is om 360.000 node-uren van binnenlandse Tianhe nieuwe generatie supercomputer intelligent computing node machine-tijddiensten aan te schaffen om de functies en prestaties van dynamische windveldberekeningssoftware te testen en te verifiëren. De voorgestelde coöperatieve leverancier: National Supercomputing Tianjin Center."
De redenen om voor het National Supercomputing Tianjin Center als enige leverancier te kiezen zijn:
“Omdat het project de dynamische softwareomgeving voor windveldberekening moet testen en verifiëren op een huishoudelijk krachtig computersysteem uitgerust met een MT3000-processor, is het noodzakelijk om 360.000 knooppunturen aan computertijddiensten voor binnenlandse krachtige computersystemen aan te schaffen.
Het supercomputerhostsysteem van Tianjin is het Tianhe-1-systeem (TH-1A) en het Tianhe-systeem van de nieuwe generatie (inclusief verificatiesysteem op E-niveau). Onder hen beschikt Tianhe's nieuwe generatie systeem over computerknooppunten op basis van MT3000-processors, die aan de projectbehoeften kunnen voldoen. Momenteel kan alleen Tianjin Supercomputer een krachtige binnenlandse computeromgeving bieden op basis van MT3000-processors. Daarom is het de bedoeling dat deze aanbesteding vanuit één bron wordt uitgevoerd. "
In juli 2018 meldde Xinhua News Agency dat het "Tianhe-3" E-klasse prototype, een "binnenlandse nieuwe generatie exaschaal supercomputer ontwikkeld door het Tianjin Supercomputing Center, is ontwikkeld en ingezet en met succes de gespecificeerde acceptatie heeft doorstaan."
Het prototypesysteem maakt gebruik van drie in eigen land geproduceerde krachtige computer- en communicatiechips. "Vervolgens in 2019 toonden verdere rapporten aan dat" het exaschaal-supercomputer 'Tianhe-3'-prototype van mijn land grootschalige parallelle applicatietests voor meer dan 30 eenheden heeft voltooid en geleidelijk diensten heeft geopend."
Op basis van de bovenstaande informatie gebruikt de geruchten "Tianhe-3" met E-level rekenkracht preciesBinnenlandse MT3000-processor.
De "Tianhe Xingyi", uitgebracht door het Guangzhou Supercomputing Center, zal waarschijnlijk gebaseerd zijn op de MT3000-processor, en het kan natuurlijk ook gebaseerd zijn op de geruchten over de Matrix2000+. Er is momenteel geen verdere informatie over de MT3000-processor, maar wat zeker is, is dat de prestaties aanzienlijk zullen worden verbeterd ten opzichte van de vorige generatie MT2000.
Binnenlandse E-klasse supercomputer Shenwei Ocean Light
Bovendien is het vermeldenswaard dat, vergeleken met het krachtigere "Sunway TaihuLight" supercomputersysteem van Tianhe 2A,Het maakt gebruik van 40.960 "Shenwei 26010" veel-coreprocessors, onafhankelijk ontwikkeld in China.
Deze veelkernprocessor maakt gebruik van een 64-bit onafhankelijk Shenwei-instructiesysteem, met een kernwerkfrequentie van 1,45 GHz en een piekprestatie van 3,168 biljoen bewerkingen per seconde. Er zijn 40.960 van dergelijke processors geïnstalleerd in Sunway TaihuLight. De totale piekprestaties kunnen 1,25 miljard keer per seconde bereiken, en de aanhoudende prestatie is 9,3 miljard keer per seconde.
De geruchten over een nieuwe generatie Sunway-supercomputers - Sunway Oceanlite (Sunway Oceanlite) zullen de nieuwe Sunway SW26010-Pro-processor gebruiken, die naar verwachting krachtigere prestaties zal opleveren.
Op de SC23 (International Conference for High Performance Computing, Networking, Storage, and Analysis, een topconferentie op het gebied van high-performance computing en architectuur) die in november dit jaar werd gehouden, lieten Chinese wetenschappers de wereld de nieuwe Sunway SW26010-Pro-processor zien, die prestaties levert die vier keer hoger zijn dan die van de vorige generatie. Dit is een serie processorproducten waarvoor mijn land zijn eigen instructieset gebruikt (gebaseerd op Alpha-uitbreiding) en volledig onafhankelijke intellectuele eigendomsrechten heeft.
Volgens PPT-gegevens is SW26010pro een verbeterde versie van SW26010, bestaande uit 6 kernmodules en 1 protocolverwerkingseenheid (PPU). Elke module heeft 1 kern voor het beheer van Linux-threads (MPE) en 64 rekenkernen, voor een totaal van 384 kernen. Daarentegen heeft de vorige generatie SW26010 slechts 4 kerngroepen, wat aangeeft dat de SW26010pro enkele chip een prestatieverbetering van 50% zou moeten hebben.
Het netwerk van 64 (8x8) rekenkernen van de SW26010Pro-processor is een Compute Processing Unit (CPE) met een cache van 256KBL2. Elke CPE heeft vier logische blokken en kan FP64 en FP32 op het ene paar ondersteunen, en FP16 en BF16 op het andere paar.
Er is een DDR4-3200-geheugencontroller en 16 GB geheugen op elke kernmodule in de SW26010Pro, met een geheugenbandbreedte van 51,4 GB/s, zodat de gehele processor 96 GB hoofdgeheugen heeft (een aanzienlijke verbetering vergeleken met de 32 GB van de SW26010) en een bandbreedte van 307,2 GB/s.
De zes CPE's zijn verbonden via een ringverbinding en hebben twee netwerkinterfaces die een eigen verbinding gebruiken om ze met de buitenwereld te verbinden. De SW26010Pro-chip heeft een FP64- of FP32-nauwkeurigheid van 14,03PB en een BF16- of FP16-nauwkeurigheid van 55,3PB.
Bovendien werkt de MPE-kern van SW26010Pro op 2,1 GHz (het product van de vorige generatie was slechts 1,45 GHz) en de CPW-kern op 2,25 GHz. In combinatie met de nieuwe 64-bits RISC-microarchitectuur en systeemarchitectuurverbeteringen is de FP64-computerdoorvoer ook ruim vier keer zo groot geworden.
Volgens rapporten heeft de grootste configuratie van Sunway OceanLight meer dan 100.000 knooppunten, met in totaal meer dan 41 miljoen cores, verdeeld over ongeveer 105 kasten. De piekprestaties met halve precisie (FP16) bedragen meer dan 5 Exaflop/s, en de theoretische piekprestaties van FP64 bedragen 1,5 exaflops, de tweede alleen voor de Amerikaanse Frontier-supercomputer.
Volgens een eerder rapport van Thenextplatform zal, als de schaal van Sunway Ocean Light wordt uitgebreid naar 120 kasten, de piekwaarde onder FP64-toezicht 1,72 Exaflops bereiken.Dit zou de 1,68 Exaflops van de "Frontier" supercomputer van het Oak Ridge National Laboratory overschrijden.
Onder de conditie van 160 kasten zullen de topprestaties van FP64 dicht bij 2,3 Exaflops liggen, wat naar verwachting de geïnstalleerde nieuwe generatie supercomputer "Aurora" zal verslaan, gebaseerd op Intel CPU en GPU in het Argonne National Laboratory van het Amerikaanse ministerie van Energie, en de "El Capitan" supercomputer, gebaseerd op AMDMI300-chips in het Amerikaanse Lawrence Livermore National Laboratory in aanbouw. De FP64-prestaties van de laatste twee zullen meer dan 2 Exaflops bereiken.