Kompania e çipave Tenstorrent, e udhëhequr nga Jim Keller, ka lançuar procesorin e saj të gjeneratës së ardhshme Wormhole për ngarkesat e punës së inteligjencës artificiale, i cili pret të ofrojë performancë të mirë me një çmim të përballueshëm.Kompania aktualisht ofron dy karta shtesë PCIe që mund të akomodojnë një ose dy procesorë Wormhole, si dhe stacione pune TT-LoudBox dhe TT-QuietBox për zhvilluesit e softuerëve. Të gjitha njoftimet e sotme u drejtohen zhvilluesve, jo atyre që përdorin pllaka Wormhole për ngarkesa pune komerciale.
“Është gjithmonë kënaqësi të sjellim më shumë produkte tona në duart e zhvilluesve. Sistemet e zhvillimit të publikimeve duke përdorur kartat tona Wormhole™ mund t'i ndihmojnë zhvilluesit të zgjerohen dhe të zhvillojnë softuer të inteligjencës artificiale me shumë çipa”, tha Jim Keller, CEO i Tenstorrent.Përveç këtij lançimi, jemi të entuziazmuar të shohim progresin që po bëjmë me nxjerrjen e shiritit ngjitës dhe ndezjen e produktit tonë të gjeneratës së dytë, Blackhole.

Çdo procesor Wormhole përmban 72 bërthama Tensix (pesë prej të cilave mbështesin bërthama RISC-V në formate të ndryshme të të dhënave) dhe 108 MB SRAM, duke ofruar 262 FP8 TFLOPS në 1 GHz me një fuqi termike të projektuar prej 160W. Karta Wormhole n150 me një çip të vetëm është e pajisur me memorie video GDDR6 prej 12 GB dhe ka një gjerësi bande prej 288 GB/s.
Procesorët Wormhole ofrojnë shkallëzueshmëri fleksibile për të përmbushur nevojat e larmishme të ngarkesave të punës. Në një konfigurim standard të stacionit të punës me katër karta Wormhole n300, procesorët mund të kombinohen në një njësi të vetme që shfaqet në softuer si një rrjet i unifikuar dhe i gjerë bazë Tensix. Ky konfigurim i lejon përshpejtuesit të trajtojë të njëjtën ngarkesë pune, të ndahet midis katër zhvilluesve ose të ekzekutojë deri në tetë modele të ndryshme të inteligjencës artificiale njëkohësisht. Një veçori kryesore e kësaj shkallëzueshmërie është se mund të funksionojë lokalisht pa pasur nevojë për virtualizim. Në një mjedis qendre të dhënash, procesorët Wormhole do të përdorin PCIe për zgjerim brenda makinës ose Ethernet për zgjerim të jashtëm.
Për sa i përket performancës, karta Wormhole n150 me një çip të vetëm të Tenstorrent (72 bërthama Tensix, frekuencë 1 GHz, 108 MB SRAM, 12 GB GDDR6, gjerësi bande 288 GB/s) arriti 262 FP8 TFLOPS në 160W, ndërsa pllaka Wormhole n300 me dy çipa (128 bërthama Tensix, frekuencë 1 GHz, 192 MB SRAM, 24 GB GDDR6 të agreguar, gjerësi bande 576 GB/s) ofron deri në 466 FP8 TFLOPS në 300W.
Për ta vendosur 300W nga 466 FP8 TFLOPS në kontekst, do ta krahasojmë atë me atë që ofron lideri i tregut të IA-së, Nvidia, me këtë fuqi të projektimit termik. A100 i Nvidia-s nuk e mbështet FP8, por mbështet INT8, me performancë maksimale prej 624 TOPS (1,248 TOPS kur është i rrallë). Në krahasim, H100 i Nvidia-s mbështet FP8 dhe arrin performancë maksimale prej 1,670 TFLOPS në 300W (3,341 TFLOPS në të rrallë), gjë që është dukshëm e ndryshme nga Wormhole n300 i Tenstorrent.
Megjithatë, ekziston një problem i madh. Wormhole n150 i Tenstorrent shitet me pakicë për 999 dollarë, ndërsa n300 shitet për 1,399 dollarë. Në krahasim, një kartë grafike e vetme Nvidia H100 shitet me pakicë për 30,000 dollarë, varësisht nga sasia. Sigurisht, nuk e dimë nëse katër apo tetë procesorë Wormhole mund të ofrojnë realisht performancën e një H300 të vetëm, por TDP-të e tyre janë përkatësisht 600W dhe 1200W.
Përveç kartave, Tenstorrent ofron stacione pune të parapërgatitura për zhvilluesit, duke përfshirë 4 karta n300 në TT-LoudBox më të përballueshëm të bazuar në Xeon me ftohje aktive, dhe TT-QuietBox të përparuar me funksion ftohjeje me lëng Xiaolong të bazuar në EPYC.
Koha e postimit: 29 korrik 2024