На мероприятии Vision 2024 компания Intel представила новый ИИ-ускоритель Gaudi3, который обещает существенный скачок производительности относительно прошлого поколения.
Gaudi3 сочетает в себе два 5-нм кристалла. На борту 64 ядра Tensor Processing Cores пятого поколения, 96 МБ памяти SRAM с пропускной способностью 12,8 ТБ/с и 128 ГБ памяти HBM2e с пропускной способностью 3,7 ТБ/с. В наличии также 24 контроллера Ethernet RDMA с пропускной способностью по 200 ГБ/с.
Ускоритель будет доступен клиентам в двух форм-факторах. Первый — карта PCIe (HL-388) использует интерфейс PCI Express 5.0 и имеет TDP от 450 до 600 Вт. Производительность FP8 — до 1835 TFLOPS.
Второй — OAM (HL-328/325L/335) с TDP 450 до 900 Вт. В этом случае до восьми модулей устанавливаются на специальную плату HLB-325. Производительность FP8 — 14,6 PFLOPS.
Intel сравнивает свой новый продукт с главным конкурентом в лице Nvidia H100. По словам компании, Gaudi3 в 1,4–1,7 раза быстрее обучает нейронные сети, а с точки зрения эффективности у новинки преимущество в 1,2–2,3 раза.
Поставки Gaudi3 должны начаться в этом году.