A Huawei új Atlas 350 gyorsítókártyája, benne az Ascend 950PR AI-chippel, hivatalosan úgy van pozicionálva, hogy számítási teljesítményben érdemben felülmúlja az Nvidia Kínának szánt H20 GPU-ját, főként alacsony pontosságú (FP4) inferencia terheléseknél. A „felülmúlja” állítás ugyanakkor ma elsősorban Huawei és kínai források saját benchmarkjaira és marketingjére épül; független, átfogó összehasonlító mérések még nem érhetők el.
Mi ez az új Huawei chip?
- A termék neve Atlas 350 AI gyorsítókártya, a rajta lévő új generációs Ascend 950PR chippel.
- Kifejezetten AI inferencia feladatokra optimalizálták (LLM-ek futtatása, multimodális generálás, ajánlórendszerek), nem pedig elsődlegesen óriás modellek tanítására.
- A Huawei ezzel a kártyával a kínai adatközpont-piacon szeretné pótolni, illetve leváltani a szankciók miatt korlátozottan elérhető Nvidia H20-at.
Teljesítmény: miben „veri” a H20-at?
- A Huawei szerint az Atlas 350 FP4 pontosságon 1,56 petaflops számítási teljesítményt ér el, ami ~2,8×-os szorzó a H20-hoz képest az azonos mérce alapján.
- FP4 egy nagyon alacsony pontosságú lebegőpontos formátum, amely kifejezetten generatív AI-inferencia gyorsítására szolgál, nagyobb sebesség és alacsonyabb fogyasztás mellett.
- Kínai sajtóértesülések szerint az Atlas 350 egykártyás számítási teljesítménye 2,87×-e a H20-ének, és jelenleg az egyik első, amely natívan támogatja az ilyen alacsony pontosságú inferenciát Kínában.
Memória és sávszélesség
- Az Atlas 350-hez tartozó HBM memória kapacitása 112 GB, ami kicsivel több, mint az Nvidia H20-é (1,16×).
- A nagyobb HBM kapacitás különösen nagy nyelvi modellek, illetve multimodális modellek futtatásánál segít, mert kevesebb shardingra vagy modell-trükkre van szükség.
- A pontos memória-sávszélesség értékekről kevés publikus adat van, de elemzők más Ascend generációknál azt hangsúlyozzák, hogy a Huawei növekvő mértékben a hálózati/interconnect sebességre és HBM kapacitásra fókuszál, nem csak a nyers FLOPS-ra.
Valóban erősebb, mint a H20?
- Számítási teljesítmény (FP4/low‑precision inferencia): a Huawei saját benchmarkjai szerint az Atlas 350/Huawei 950PR érdemben gyorsabb, mint az Nvidia H20, akár ~2,8–2,9× faktorral, ha az adott workload kihasználja a FP4-et.
- Felhasználási területek: a Huawei kifejezetten olyan inferencia-workloadokra céloz (keresés, ajánlórendszerek, nagyméretű LLM-ek és multimodális generálás), ahol az alacsony pontosság elfogadható és a throughput a döntő.
- Szoftver-ökoszisztéma: elemzések szerint a Huawei még mindig elmarad az Nvidiától a szoftver stack (CUDA-ökoszisztéma, könyvtárak, fejlesztői eszközök) érettségében, ami gyakran fontosabb szűk keresztmetszet, mint a puszta FLOPS.
Kontextus: más Huawei AI-chipek és az Nvidia
- A korábbi Ascend 910B már bizonyos metrikák szerint meghaladta a H20 „total processing performance” mutatóját, míg az Ascend 960-at egyes jelentések az Nvidia H200 környékére teszik számítási erőben, magasabb interconnect sávszélességgel.
- A most bemutatott Ascend 950PR és Atlas 350 ennek a vonalnak a folytatása, kifejezetten Kína‑piacra optimalizálva, teljesen hazai ellátási lánccal, hogy a szankciókat megkerüljék.
- Nyugati elemzések ugyanakkor hangsúlyozzák: aggregált globális AI-kapacitásban Huawei még jóval az Nvidia mögött jár, és 2026‑ra is a teljes Nvidia‑kapacitás néhány százalékára becsülik.
Hozzászólások
Jelentkezz be a hozzászóláshoz.
Még nincs hozzászólás. Legyél az első!