Kompania e çipave të udhëhequr nga Jim Keller Tenstorrent ka lëshuar procesorin e saj të gjeneratës së ardhshme Wormhole për ngarkesat e punës me AI, i cili pret të ofrojë performancë të mirë me një çmim të përballueshëm.Kompania aktualisht ofron dy karta shtesë PCIe që mund të strehojnë një ose dy procesorë Wormhole, si dhe stacione pune TT-LoudBox dhe TT-QuietBox për zhvilluesit e softuerit. Të gjitha njoftimet e sotme kanë për qëllim zhvilluesit, jo ata që përdorin bordet Wormhole për ngarkesat komerciale të punës.
“Është gjithmonë kënaqësi të marrim më shumë nga produktet tona në duart e zhvilluesve. Lëshimi i sistemeve të zhvillimit duke përdorur kartat tona Wormhole™ mund t'i ndihmojë zhvilluesit të shkallëzojnë dhe zhvillojnë softuerin e AI me shumë çipa, "tha Jim Keller, CEO i Tenstorrent.Përveç këtij lansimi, ne jemi të ngazëllyer për të parë përparimin që po bëjmë me nxjerrjen e shiritit dhe fuqizimin e produktit tonë të gjeneratës së dytë, Blackhole.
Çdo procesor Wormhole përmban 72 bërthama Tensix (pesë prej të cilave mbështesin bërthamat RISC-V në formate të ndryshme të të dhënave) dhe 108 MB SRAM, duke ofruar 262 FP8 TFLOPS në 1 GHz me një fuqi të projektimit termik prej 160 W. Karta Wormhole n150 me një çip të vetëm është e pajisur me memorie video 12 GB GDDR6 dhe ka një gjerësi brezi prej 288 GB/s.
Procesorët Wormhole ofrojnë shkallëzim fleksibël për të përmbushur nevojat e ndryshme të ngarkesave të punës. Në një konfigurim standard të stacionit të punës me katër karta Wormhole n300, procesorët mund të kombinohen në një njësi të vetme që shfaqet në softuer si një rrjet bazë i unifikuar, i gjerë Tensix. Ky konfigurim i lejon përshpejtuesit të trajtojë të njëjtën ngarkesë pune, të ndahet midis katër zhvilluesve ose të ekzekutojë deri në tetë modele të ndryshme të AI në të njëjtën kohë. Një tipar kryesor i kësaj shkallëzueshmërie është se mund të funksionojë në nivel lokal pa pasur nevojë për virtualizim. Në një mjedis të qendrës së të dhënave, procesorët Wormhole do të përdorin PCIe për zgjerim brenda makinës ose Ethernet për zgjerim të jashtëm.
Për sa i përket performancës, karta Wormhole n150 me një çip të vetëm të Tenstorrent (72 bërthama Tensix, frekuencë 1 GHz, 108 MB SRAM, 12 GB GDDR6, 288 GB/s gjerësi brezi) arriti 262 FP8 TFLOPS në 160 WW, 30 W, ndërsa therm 160 W. (128 bërthama Tensix, frekuenca 1 GHz, 192 MB SRAM, 24 GB GDDR6 e grumbulluar, 576 GB/s gjerësi bande) ofron deri në 466 FP8 TFLOPS në 300 W.
Për të vënë në kontekst 300 W nga 466 FP8 TFLOPS, ne do ta krahasojmë atë me atë që lideri i tregut të AI Nvidia ofron me këtë fuqi të dizajnit termik. A100 i Nvidia nuk mbështet FP8, por mbështet INT8, me performancë maksimale prej 624 TOPS (1,248 TOPS kur është i rrallë). Në krahasim, H100 e Nvidia mbështet FP8 dhe arrin performancën maksimale prej 1,670 TFLOPS në 300 W (3,341 TFLOPS në pak), e cila është dukshëm e ndryshme nga Wormhole n300 e Tenstorrent.
Megjithatë, ekziston një problem i madh. Wormhole n150 i Tenstorrent shitet me pakicë për 999 dollarë, ndërsa n300 shitet për 1,399 dollarë. Për krahasim, një kartë grafike e vetme Nvidia H100 shitet për 30,000 dollarë, në varësi të sasisë. Sigurisht, ne nuk e dimë nëse katër ose tetë procesorë Wormhole mund të ofrojnë performancën e një H300 të vetme, por TDP-të e tyre janë përkatësisht 600W dhe 1200W.
Përveç kartave, Tenstorrent ofron stacione pune të para-ndërtuara për zhvilluesit, duke përfshirë 4 karta n300 në TT-LoudBox më të përballueshme me bazë Xeon me ftohje aktive dhe TT-QuietBox të avancuar me funksionin e ftohjes së lëngshme të bazuar në EPYC).
Koha e postimit: 29 korrik 2024