Telum II: 360 МБ кэша на 8 вычислительных ядер
Сердцем перспективных мэйнфреймов станет Telum II — центральный процессор с 8 высокопроизводительными ядрами, работающими на частоте до 5.5 ГГц. Каждое ядро оснащается внушительным L2-кэшем объемом 36 МБ, что примерно на 40% выше, чем у чипов предыдущего поколения. Интересно, что на кристалле есть пространство для размещения двух дополнительных ядер, однако IBM по какой-то причине решила от них отказаться, сохранив блоки кэш-памяти, благодаря чему общий объем L2 составляет 360 МБ.
Как ни странно, именно кэш занимает наибольшую площадь кристалла Telum II — благодаря этому могут быть значительно сокращены задержки, связанные с обращениями к более медленным подсистемам памяти, таким как ОЗУ или L4-кэш.
Кроме того, новинки получат интегрированные ИИ-ускорители (NPU) мощностью 24 TOPS, что, впрочем, не слишком выразительно смотрится даже на фоне потребительских решений. Вполне вероятно, что NPU расположены в верхней части кристалла и организованы в два кластера.
По оценкам IBM, производительность Telum II в четыре раза выше, чем у чипов предыдущего поколения. В дополнение к этому, новый блок ускорения ввода-вывода (DPU) обеспечивает до 50% большую пропускную способность памяти, что улучшает общую эффективность и масштабируемость системы.
Spyre: 300 TOPS при потреблении всего 75 Вт
Предполагается, что Telum II будут использоваться вместе с ИИ-ускорителями Spyre, ориентированными на минимальные задержки и масштабируемость. Предполагается, что Spyre могут быть объединены в кластеры по восемь карт.
Каждый ускоритель оснащается 32 ядрами с вычислительной мощностью порядка 300 TOPS, работающими в паре со 128 ГБ выделенной памяти LPDDR5. Spyre имеет стандартный разъем PCIe 5.0×16 и не требует внешнего питания, «укладываясь» во вполне демократичные 75 Вт. Сама IBM заявляет, что Spyre поддерживают вычисления INT4, INT8, FP8 и FP16, что обеспечивает высокую производительность в широком спектре задач и максимальную энергоэффективность.
IBM на острие прогресса
Новые процессоры и ускорители IBM могут быть использованы в финансовом секторе для улучшения систем обнаружения мошенничества, в здравоохранении для анализа больших объемов медицинских данных и в других отраслях, где требуется высокая производительность и надежность. Архитектура Telum II и Spyre специально предназначена для вычислений в реальном времени с минимальными задержками и высокой энергоэффективностью, бросая вызов даже решениям, основанным на ARM.
Ожидается, что первые системы и ускорители на базе тандема Telum II и Spyre появятся на рынке уже в 2025 году.
А больше о том, что такое NPU и действительно ли они нужны современным компьютерам, читайте в специальном материале Hi-Tech Mail.