Huawei új Atlas 350 gyorsítókártyája
Hírek

Huawei új Atlas 350 gyorsítókártyája

A Huawei új Atlas 350 gyorsítókártyája, úgy van pozícionálva, hogy számítási teljesítményben érdemben felülmúlja az Nvidia Kínának szánt H20 GPU-ját.

Mark De Leon Szerző: Mark De Leon 2026. március 23. 00:00 2 perc olvasás

A Huawei új Atlas 350 gyorsítókártyája, benne az Ascend 950PR AI-chippel, hivatalosan úgy van pozicionálva, hogy számítási teljesítményben érdemben felülmúlja az Nvidia Kínának szánt H20 GPU-ját, főként alacsony pontosságú (FP4) inferencia terheléseknél. A „felülmúlja” állítás ugyanakkor ma elsősorban Huawei és kínai források saját benchmarkjaira és marketingjére épül; független, átfogó összehasonlító mérések még nem érhetők el.

Mi ez az új Huawei chip?

  • A termék neve Atlas 350 AI gyorsítókártya, a rajta lévő új generációs Ascend 950PR chippel.
  • Kifejezetten AI inferencia feladatokra optimalizálták (LLM-ek futtatása, multimodális generálás, ajánlórendszerek), nem pedig elsődlegesen óriás modellek tanítására.
  • A Huawei ezzel a kártyával a kínai adatközpont-piacon szeretné pótolni, illetve leváltani a szankciók miatt korlátozottan elérhető Nvidia H20-at.

Teljesítmény: miben „veri” a H20-at?

  • A Huawei szerint az Atlas 350 FP4 pontosságon 1,56 petaflops számítási teljesítményt ér el, ami ~2,8×-os szorzó a H20-hoz képest az azonos mérce alapján.
  • FP4 egy nagyon alacsony pontosságú lebegőpontos formátum, amely kifejezetten generatív AI-inferencia gyorsítására szolgál, nagyobb sebesség és alacsonyabb fogyasztás mellett.
  • Kínai sajtóértesülések szerint az Atlas 350 egykártyás számítási teljesítménye 2,87×-e a H20-ének, és jelenleg az egyik első, amely natívan támogatja az ilyen alacsony pontosságú inferenciát Kínában.

Memória és sávszélesség

  • Az Atlas 350-hez tartozó HBM memória kapacitása 112 GB, ami kicsivel több, mint az Nvidia H20-é (1,16×).
  • A nagyobb HBM kapacitás különösen nagy nyelvi modellek, illetve multimodális modellek futtatásánál segít, mert kevesebb shardingra vagy modell-trükkre van szükség.
  • A pontos memória-sávszélesség értékekről kevés publikus adat van, de elemzők más Ascend generációknál azt hangsúlyozzák, hogy a Huawei növekvő mértékben a hálózati/interconnect sebességre és HBM kapacitásra fókuszál, nem csak a nyers FLOPS-ra.

Valóban erősebb, mint a H20?

  • Számítási teljesítmény (FP4/low‑precision inferencia): a Huawei saját benchmarkjai szerint az Atlas 350/Huawei 950PR érdemben gyorsabb, mint az Nvidia H20, akár ~2,8–2,9× faktorral, ha az adott workload kihasználja a FP4-et.
  • Felhasználási területek: a Huawei kifejezetten olyan inferencia-workloadokra céloz (keresés, ajánlórendszerek, nagyméretű LLM-ek és multimodális generálás), ahol az alacsony pontosság elfogadható és a throughput a döntő.
  • Szoftver-ökoszisztéma: elemzések szerint a Huawei még mindig elmarad az Nvidiától a szoftver stack (CUDA-ökoszisztéma, könyvtárak, fejlesztői eszközök) érettségében, ami gyakran fontosabb szűk keresztmetszet, mint a puszta FLOPS.

Kontextus: más Huawei AI-chipek és az Nvidia

  • A korábbi Ascend 910B már bizonyos metrikák szerint meghaladta a H20 „total processing performance” mutatóját, míg az Ascend 960-at egyes jelentések az Nvidia H200 környékére teszik számítási erőben, magasabb interconnect sávszélességgel.
  • A most bemutatott Ascend 950PR és Atlas 350 ennek a vonalnak a folytatása, kifejezetten Kína‑piacra optimalizálva, teljesen hazai ellátási lánccal, hogy a szankciókat megkerüljék.
  • Nyugati elemzések ugyanakkor hangsúlyozzák: aggregált globális AI-kapacitásban Huawei még jóval az Nvidia mögött jár, és 2026‑ra is a teljes Nvidia‑kapacitás néhány százalékára becsülik.
MEGOSZTÁS
HIRDETÉS

Hozzászólások

Még nincs hozzászólás. Legyél az első!