Cerebras Systems, o startup din SUA, a lansat cel mai mare cip care integrează mai mult de 1,2 trilioane de tranzistoare și are o dimensiune de 46.225 milimetri pătrați. Noul cip Cerebras Wafer Scale Engine (WSE) este optimizat pentru AI și este de 56,7 ori mai mare decât cea mai mare unitate de procesare grafică care măsoară 815 milimetri pătrați și conține 21,1 miliarde de tranzistori. Noul Cerebras Wafer Scale Engine (WSE) oferă o memorie on-chip de 3.000 de ori mai mare, cu o lățime de bandă de memorie de 10.000 de ori mai mare. Dimensiunea mai mare a cipului asigură că informațiile pot fi procesate mai repede și chiar pot reduce timpul de intrare sau „timpul de instruire”, care le permite cercetătorilor să testeze mai multe idei, să utilizeze mai multe date și să rezolve noi probleme.
Cerebras WSE este conceput pentru AI și conține inovații fundamentale care avansează stadiul tehnicii prin rezolvarea unor provocări tehnice vechi de decenii, care au o dimensiune limitată a cipului - cum ar fi conectivitatea reticulată încrucișată, randamentul, livrarea energiei și ambalarea. WSE poate accelera calculele și comunicațiile, ceea ce reduce timpul de antrenament. WSE are o suprafață de siliciu de 56,7 ori mai mare decât cea mai mare unitate de procesare grafică. De asemenea, WSE poate oferi mai multe nuclee pentru a face mai multe calcule și oferă mai multă memorie mai aproape de nuclee, astfel încât nucleele să poată funcționa eficient. Toată comunicația este păstrată pe siliciu în sine, datorită gamei sale largi de nuclee, iar memoria este încorporată pe un singur cip.
Chip-ul Cerebras WSE conține 46.225 mm2 de siliciu și găzduiește 400.000 de nuclee de calcul optimizate AI, fără cache, fără overhead, de calcul și 18 gigaocteți de memorie SRAM locală, distribuită, super rapidă. Cipul vine cu 9 petabiți pe secundă de lățime de bandă de memorie, unde nucleele sunt legate împreună cu o rețea de comunicații cu granulație fină, complet hardware, conectată cu plasă, care oferă o lățime de bandă agregată de 100 petabiți pe secundă. Aceasta înseamnă că lățimea de bandă de comunicare cu latență scăzută a WSE este extrem de mare, ceea ce face ca grupurile de nuclee să colaboreze cu o eficiență maximă, iar lățimea de bandă a memoriei nu mai este un blocaj. Mai multă memorie locală, mai multe nuclee și o țesătură cu lățime de bandă cu latență scăzută, combinate împreună, formează arhitectura optimă pentru accelerarea muncii AI.
Caracteristicile cipului WSE Cerebras:
- Miezuri mărite: WSE integrează 400.000 de miezuri de calcul optimizate AI numite SLAC (Sparse Linear Algebra Cores), care sunt programabile, flexibile și optimizate pentru algebra liniară rară care stă la baza tuturor calculelor rețelei neuronale. Funcția de programare SLAC asigură faptul că nucleele pot rula cu ușurință toți algoritmii de rețea neuronală în câmpul de învățare automată în continuă schimbare. Miezurile WSE încorporează tehnologia de recoltare a rarității inventată de Cerebras, care accelerează performanța de calcul pe sarcini de lucru rare (sarcini de lucru care conțin zerouri), cum ar fi învățarea profundă.
- Memorie îmbunătățită: Cerebras WSE integrează mai multă memorie locală, împreună cu mai multe nuclee, care este mai mult decât orice cip care permite un calcul flexibil, rapid la o latență mai mică și cu mai puțină energie. WSE vine cu 18 GB (Gigabytes) de memorie on-chip accesibilă de bază într-un singur ciclu de ceas. Această colecție de memorie locală centrală face ca WSE să furnizeze un lărgime de bandă de memorie de 9 petabytes pe secundă, care este cu 10.000 X mai multă lățime de bandă de memorie și 3.000 X