Процессорам Alder Lake от Intel понадобятся новые системы охлаждения и материнские платы
Совсем недавно в нашем блоге публиковалась статья о новой гибридной процессорной архитектуре Alder Lake от Intel. У процессоров на ее основе есть рабочее название — Core-1800 SKU, но оно вряд ли будет финальным. Образцы новых чипов удалось изучить, они включают 8 высокопроизводительных ядер Golden Cove и 8 энергоэффективных ядер Gracemont.
Базовая тактовая частота чипа — 1,8 ГГц. Но с включенным TurboBoost процессор сможет показать гораздо большую производительность, вплоть до 4,6 ГГц. Известно также, что новое поколение процессоров будет устанавливаться в новый сокет Socket V (LGA1700). Это касается как чипов Intel Alder Lake-S, так и следующего поколения, Raptor Lake-S. Что это значит? Полная несовместимость процессоров со всеми выпущенными на данный момент материнскими платами и системами охлаждения.
Предстоят новые траты
В целом, вполне логично, что новые сокеты означают необходимость приобретения новых материнских плат для процессоров 12-го поколения. Но здесь дело не только в сокетах — у новых процессоров другая форма, что влечет за собой необходимость модификации сопутствующих систем.
Процессоры тоньше, чем предыдущее поколение, но зато длиннее и шире. Разработчики добавили в новинку новую теплораспределительную крышку. Чуть уменьшена и толщина сокета. Разница в размерах не так и велика — всего около 1 мм, но ее придется учитывать.
Так, практически любые модели современных кулеров не подойдут для новых чипов — просто потому, что они не будут плотно прилегать к крышке процессора, а значит — не будет и нормального охлаждения. Но проблема не только в этом — у современных систем охлаждения отверстия для крепления расположены иначе, чем требуется для установки на новые сокеты.
Владельцу ресурса Igor’sLAB удалось получить чертежи новых систем. Он подтвердил их несовместимость с существующими системами. В то же время, он связался с представителями Cooler Master, которые предоставили на тесты систему охлаждения MasterLiquid ML360 Sub-Zero. Она предназначена как раз для установки на LGA1200. Ее удалось установить, причем результаты охлаждения были весьма неплохими. Но проблема здесь в том, что сама эта система потребляет большое количество энергии — не меньше, чем сам процессор.
Выше — фотография этой системы. Автор подчеркивает, что все это — чистой воды эксперимент, который вряд ли пригодится для реальных кейсов.
Не все так плохо
Если перед владельцем новой системы не стоит цель использовать все ресурсы процессора, то, возможно, ему не придется покупать новую систему охлаждения вместе с платой и самим процессором. Дело в том, что Intel планирует комплектовать свои чипы базовой системой охлаждения. Но ее возможностей хватит лишь для отвода тепла от процессора, работающего на штатных частотах. Будет ли радиатор кулера оснащаться медными вставками — неясно.
С другой стороны в мире полно производителей, которые в сжатые сроки смогут наладить выпуск адаптеров для существующих систем охлаждения., Здесь все вполне логично — если у пользователя есть дорогая и эффективная система, вряд ли он будет рад перспективе приобрести еще одну. Скорее, большинство пользователей согласятся доплатить за переходник, который позволит устанавливать существующие кулеры на новые процессоры.
Примеры таких систем есть, подобный подход применялся, например, компанией Noctua для некоторых модификаций систем охлаждения, несовместимых с сокетами AM4. Кулер Noctua NH-U9S, например, не подходит для установки на этот сокет. Но компания выпустила специальные крепежные адаптеры NM-AM4-UxS, которые решают эту задачу.
И если система охлаждения стоит около 7000 рублей, то крепежный адаптер к ней — всего 540. Вполне может быть, что прямо сейчас китайские производители уже проектируют переходники под новые платы для старых систем охлаждения — ведь размерность и спецификации уже известны.
Что известно о новых процессорах
Сейчас появилась информация о размерах нового сокета. Вместо квадрата со сторонами длиной 37,5мм это будет прямоугольник с длинами сторон 37,5×45.0 мм.
У 12-го поколения процессоров от Intel несколько модификаций, точнее, семейств:
- Alder Lake-S — для десктопных ПК.
- Alder Lake-P — для мощных ноутбуков.
- Alder Lake-М — для маломощных устройств.
- Alder Lake-L — для мобильных девайсов.
- Alder Lake-N — для всех прочих устройств, включая не очень производительные ноутбуки, хромбуки и т.п.
В однопоточном режиме процессоры смогут обеспечивать двукратный рост производительности по сравнению с предыдущим поколением, Rocket Lake. В многопоточном все не так радужно, но и здесь прирост производительности составит около 20%, что весьма неплохо.
Новые чипы должны появиться в конце 2021 года, именно тогда ожидается их отгрузка вендорам разного рода компьютерных систем. Устройства же на основе процессоров 12-го поколения появятся в начале 2022 года, возможно, чуть позже.
Обзор Alder Lake-S: варианты процессоров, ядра P и E, DDR5
Страница 1: Обзор Alder Lake-S: варианты процессоров, ядра P и E, DDR5
В рамках мероприятия Intel On, которое пришло на смену IDF, Intel представила новое поколение настольных процессоров под названием Alder Lake. Оно будет защищать позиции чипового гиганта до перехода на поколение Meteor Lake с 7-нм техпроцессом. В статье мы предоставим всю имеющуюся информацию, а через несколько дней опубликуем тесты.
Процессоры Alder Lake-S в настольной версии являются лишь частью нового поколения CPU, причем сегодня мы можем рассматривать их лишь частично, только в вариантах K для high-end сегмента. Позднее выйдут другие варианты настольных процессоров Alder Lake, а ближе к концу года можно ожидать мобильные CPU.
Alder Lake для Intel является весьма значимым шагом на рынке CPU, поскольку здесь впервые используется производительный гибридный дизайн. Процессор оснащен разными ядрами, предназначенными для своих задач. Первый гибридный дизайн Intel Lakefield оказался не самым удачным, он таки и не снискал популярности из-за своих ограничений. Но с его помощью Intel смогла отладить взаимодействие аппаратных и программных компонентов, что немаловажно.
Помимо платформы Alder Lake, чиповый гигант представляет несколько новых стандартов для настольного рынка, причем не единолично, а в составе экосистемы вместе с другими участниками. Например, процессоры Alder Lake содержат контроллер памяти DDR5, соответствующие планки станут доступны на рынке в ближайшем будущем. Кроме того, процессоры поддерживают PCI Express 5.0.
Intel с процессорами Alder Lake желает вернуть себе звание лидера. Будь то по однопоточной или многопоточной производительности, возможностям ввода/вывода или платформы в целом. Причем новая парадигма Intel будет работать не только в настольном, но и в мобильном сегменте.
Подписывайтесь на группы Hardwareluxx ВКонтакте и Facebook, а также на наш канал в Telegram (@hardwareluxxrussia).
Пока что Intel представила только процессоры K и KF. Перед тем, как мы перейдем к детальному их рассмотрению, позвольте привести сравнительную таблицу.
Ядра | Кэш L3 | Кэш L2 | Turbo 3.0 | Частота Boost | Базовая частота | Base Power | Turbo Power | Цена | |
Core i9-12900K | 8P+8E | 30 Мбайт | 14 Мбайт | 5,2 ГГц | 5,1 / 3,9 ГГц | 3,2 / 2,4 ГГц | 125 Вт | 241 Вт | от 67.000 ₽ |
Core i9-12900KF | 8P+8E | 30 Мбайт | 14 Мбайт | 5,2 ГГц | 5,1 / 3,9 ГГц | 3,2 / 2,4 ГГц | 125 Вт | 241 Вт | от 64.800 ₽ |
Core i7-12700K | 8P+4E | 25 Мбайт | 12 Мбайт | 5,0 ГГц | 4,9 / 3,8 ГГц | 3,6 / 2,7 ГГц | 125 Вт | 190 Вт | от 50.400 ₽ |
Core i7-12700KF | 8P+4E | 25 Мбайт | 12 Мбайт | 5,0 ГГц | 4,9 / 3,8 ГГц | 3,6 / 2,7 ГГц | 125 Вт | 190 Вт | от 52.700 ₽ |
Core i5-12600K | 6P+4E | 20 Мбайт | 9,5 Мбайт | — | 4,9 / 3,6 ГГц | 3,7 / 2,8 ГГц | 125 Вт | 150 Вт | от 38.200 ₽ |
Core i5-12600KF | 6P+4E | 20 Мбайт | 9,5 Мбайт | — | 4,9 / 3,6 ГГц | 3,7 / 2,8 ГГц | 125 Вт | 150 Вт | от 42.400 ₽ |
Все процессоры поддерживают DDR4-3200 и DDR5-4800. Как и раньше, Intel официально придерживается спецификации JEDEC по DDR4 или DDR5, но встроенный контроллер памяти IMC (Integrated Memory Controller) может работать и с более высокими тактовыми частотами. Подробности мы приведем в тесте, где рассмотрим разные частоты памяти. С планками DDR4 контроллер работает в двухканальном режиме, в случае же DDR5 активен 4-канальный режим. Максимальный объем памяти составляет 128 Гбайт. Кроме того, все процессоры имеют 16 линий последнего стандарта PCI Express 5.0 плюс четыре PCIe 4.0.
У процессоров KF интегрированной графики нет. Последняя впервые на настольном сегменте опирается на архитектуру Xe-LP и содержит 32 исполнительных блока EU. Интересно будет посмотреть, как более высокая пропускная способность DDR5 скажется на производительности встроенной графики.
Флагманский процессор Core i9-12900K(F) оснащен восемью производительными и восемью эффективными ядрами, которые работают на тактовых частотах до 5,1 и 3,9 ГГц, соответственно. Кэши L3 и L2 зависят от числа активных ядер, в данном случае они максимальные. Базовый TDP составляет 125 Вт, но процессоры могут работать и с постоянным уровнем до 241 Вт. Процессоры Core i7-12700K(F) отличаются от «старшей» модели не только выборкой менее качественных кристаллов, как было в случае Rocket Lake. Intel здесь выключила кластер ядер E, поэтому мы получаем конфигурацию 8+4. Соответственно, кэши L3 и L2 несколько меньше. Тактовые частоты были снижены на несколько сотен мегагерц. А Turbo Power — с уровня 241 Вт до 190 Вт.
Наконец, есть процессор Core i5-12600K(F), у которого отсутствуют два производительных ядра. Емкость кэшей L3 и L2 уменьшена до 20 и 9,5 Мбайт, соответственно. Процессор Core i5-12600K больше не имеет поддержки Turbo 3.0, но частота Boost и базовая довольно близки к Core i7-12700K(F). Планка Turbo снижена до 150 Вт.
Большим сюрпризом стало энергопотребление процессора. Между PL1 и PL2 уже нет различий. Напомним, что PL1 ранее означал уровень продолжительной нагрузки процессора. А PL2 срабатывал на протяжении 28 или 56 с. В случае Alder Lake уровни PL1 и PL2 идентичны. Процессор Core i9-12900K может потреблять 241 Вт на постоянной основе, если позволяет система питания материнской платы и охлаждение. Процессор откатывается на TDP 125 Вт в том случае, если не хватает питания или охлаждение недостаточное. Периода Tau для PL2 уже не предусмотрено.
В свежих версиях UEFI материнских плат Z690 это уже отражено. Пока сложно сказать, сможет ли Core i9-12900K потреблять на постоянной основе 241 Вт от сокета, здесь все же стоит дождаться результатов тестов. Intel может пойти на подобный уровень в настольном сегменте, но в случае ноутбуков уже вряд ли.
Доступность со следующей недели
Все шесть процессоров Alder Lake будут доступны в продаже с 4 ноября. Если верить Intel, в этом году планируется произвести многие тысячи процессоров. А к концу первого квартала 2022 — уже два миллиона. Здесь Intel подчеркивает текущие глобальные проблемы полупроводникового производства, компания будет им противодействовать.
Цена Alder Lake-S начинается с $264 (18.800 ₽) за Core i5-12600KF. Цен в рублях пока нет, причем долларовые цены Intel традиционно указывает для партии в 1.000 штук. Вариант с интегрированной графикой стоит $289 (20.600 ₽). Процессор Core i7-12700KF можно будет приобрести за $384 (27.300 ₽), с iGPU — $409 (29.100 ₽). Флагманская модель Core i9-12900K будет стоить $589 (41.800 ₽), а версия KF — $564 (40.100 ₽). Так что по официальным ценам Intel позиционирует новые процессоры чуть выше предшественников. 16-ядерные процессоры Intel стоят дешевле 16-ядерных AMD (Ryzen 9 5950X). То же самое касается и других процессоров при сравнении с конкурентами. Однако здесь стоит дождаться результатов тестов.
Кроме шести моделей Alder Lake, Intel также представила чипсет Z690. Конечно, последуют и другие модели чипсетов, но Intel пока их не объявила.
Процессоры Intel 12-го поколения – характеристики и производительность Alder Lake-S
Премьера процессоров Intel Alder Lake-S состоялась, пора прощаться с техпроцессом 14 нм. Intel Rocket Lake-S не принесла революции – многие пользователи ожидали этого в Intel Core 12-го поколения. Что предлагает новая архитектура? Позволит ли преемник серии Rocket Lake-S ощутить давно анонсированную революцию?
Вот основные характеристики и возможности процессоров Intel Alder Lake-S .
Коротко об Intel Alder Lake-S – характеристики
- Архитектура: Golden Cove (большие ядра) и Gracemont (маленькие ядра)
- Технологический процесс: Intel 7 (10 нм Enhanced SuperFin)
- Максимальное количество ядер: 8 ядер производительности + 8 эффективных ядер (16 ядер и 24 потока)
- iGPU: Intel UHD Graphics 770 (Xe Gen 12.2)
- Разъём: LGA 1700
- Материнская плата: чипсет Intel 600 и выше
- Поддержка оперативной памяти: DDR5-4800 и DDR4-3200
- PCI-Express: 5.0 (16 полос; обратная совместимость)
Intel Alder Lake-S – привет 10-нм техпроцессу
Наконец-то! Прошло 7 лет с тех пор, как Intel реализовала архитектуру, разработанную в технологическом измерении 14 нанометров. Первыми потребительскими процессорами в «синем» предложении, представленном в этой литографии, были Intel Broadwell 2014 года, сыгравшие очень незначительную роль на рынке процессоров для настольных ПК. Лишь менее чем через год системы, основанные на архитектуре Intel Skylake, стали использоваться в потребительских ПК.
Таким образом, за последние шесть лет они предлагали того же самое в новом «хрустящем» покрытии (если предположить, что чем более хрустящее, тем лучше). Наконец, 2021 год принёс долгожданные изменения.
Intel Alder Lake-S использует все преимущества низкой 10-нм литографии. Всё началось с Intel 7, усовершенствованного процесса, известного по энергосберегающим процессорам Intel Tiger Lake, предназначенным для ноутбуков (процессоры на основе этой архитектуры позже перешли на миниатюрные настольные компьютеры NUC).
Intel 7 вместо 10 нм Enhanced SuperFin – изменение названия технологического процесса
Процессоры Intel Alder Lake-S основаны на архитектуре, созданной в технологическом процессе Intel 7. «Синие» излишне путают с номенклатурой их литографий и, вопреки внешнему виду, семь не означает 7 нм. Это 10-нм Enhanced SuperFin, который обеспечивает повышение эффективности на 10-15% по сравнению с 10-нм SuperFin, известным по новому Tiger Lake-H/U.
Intel Alder Lake-S – конструкция процессора и максимальное количество ядер
Процессоры Intel Alder Lake-S имеют гибридную структуру, аналогичную архитектуре, известной из систем ARM, – LITTLE, которая широко используется в смартфонах. Что это значит? Новые процессоры состоят из ядер, основанных на двух разных архитектурах: высокопроизводительном Core (Golden Cove) и энергосберегающем Atom (Gracemont).
Самый мощный блок из серии Intel Alder Lake-S имеет 16 ядер (8 P-Core и 8 E-Core) и 24 потока (логические ядра). Почему не 32? Ядра Gracemont не поддерживают многопоточность (Intel HT – Hyper-Threading). Intel назвала эффективные ядра Performance Core (Golden Cove), а энергоэффективные – Efficient Core (Gracemont). Максимальная емкость неисключающего кэша составляет 30 МБ.
Ядра P обладают очень высокой производительностью, особенно в однопоточных задачах, и используются таких процессах, как игры. С другой стороны, небольшие ядра E оптимизированы для многозадачности и поддерживают работу в многопоточных приложениях. Они также работают с фоновыми процессами, такими как Discord и Защитник Windows, поэтому игрок не испытывает никаких падений производительности во время игры.
Intel Thread Director – что это такое и как работает?
Ядра контролируются технологией Intel Thread Director, встроенной в процессоры Intel Alder Lake-S, которая отвечает за максимальную производительность. Он назначает соответствующие задачи отдельным ядрам ЦП и управляет их нагрузкой. Эта функция работает с Windows 11 , которая в полной мере использует возможности платформы Intel Alder Lake-S.
Технические характеристики Intel Alder Lake-S
Ранее я упоминал, сколько ядер у настольных процессоров Intel Alder Lake-S. Какова же полная спецификация Core i9, Core i7, Core i5 и Core i3? На данный момент официальные спецификации ограничены (наиболее) эффективными моделями: Intel Core i9-12900K, Intel Core i7-12700K и Intel Core i5-12600K и версиями без встроенного графического чипа (KF).
Intel Core i9-12900K (F) – технические характеристики
- Количество ядер: 16 ядер и 24 потока (8 P-Core и 8 E-Core)
- Базовая частота: 3,2 ГГц (P-Core); 2,4 ГГц (E-Core)
- Турбо частота: до 5,1 ГГц (P-Core); до 3,9 ГГц (E-Core)
- Turbo Boost Max 3.0: до 5,2 ГГц
- Кэш L3 (Intel Smart Cache): 30 МБ (24 + 6)
- Кэш L2: 14 МБ
- TDP: 125 Вт (PL1), 241 Вт (макс. энергопотребление в режиме Turbo)
Intel Core i7-12700K (F) – технические характеристики
- Количество ядер: 12 ядер и 20 потоков (8 P-Core и 4 E-Core)
- Базовая частота: 3,6 ГГц (P-Core); 2,7 ГГц (E-Core)
- Турбо частота: до 4,9 ГГц (P-Core); до 3,8 ГГц (E-Core)
- Turbo Boost Max 3.0: до 5,0 ГГц
- Кэш L3 (Intel Smart Cache): 25 МБ (22 + 3)
- Кэш L2: 12 МБ
- TDP: 125 Вт (PL1), 190 Вт (макс. энергопотребление в режиме Turbo)
Intel Core i5-12600K (F) – технические характеристики
- Количество ядер: 10 ядер и 16 потоков (6 P-Core и 4 E-Core)
- Базовая частота: 3,7 ГГц (P-Core); 2,8 ГГц (E-Core)
- Турбо частота: до 4,9 ГГц (P-Core); до 3,6 ГГц (E-Core)
- Turbo Boost Max 3.0: не поддерживается
- Кэш L3 (Intel Smart Cache): 20 МБ (16,5 + 3)
- Кэш L2: 9,5 МБ
- TDP: 125 Вт (PL1), 150 Вт (макс. энергопотребление в режиме Turbo)
Процессор без разблокированного множителя и с более низкими тактовыми частотами, а также энергосберегающие варианты с TDP 35 Вт (серия T) появятся позже. Их спецификация не будет слишком сильно отличаться от версии, отмеченной K . Разница будет ограничиваться только тактовой частотой и энергопотреблением. Однако, вам придётся дождаться официального подтверждения от Intel.
Какой прирост производительности обеспечивает Intel Alder Lake-S
Процессоры Intel Alder Lake – это прощание «синих» с 14 нм техпроцессом. Неудивительно, что ожидания относительно вычислительной мощности новых процессоров были высокими. В однопоточном режиме можно ожидать увеличения на 20% по сравнению с Intel Rocket Lake-S, а в многопоточном – удвоения. IPC Intel Alder Lake-S (один такт) увеличился по сравнению с серией Intel Rocket Lake-S на 19%.
Intel объявила во время Intel Architecture Day 2021, что одно эффективное ядро имеет производительность до 40% выше, чем ядро Skylake. Различия могут быть даже вдвое больше. Intel сравнила четыре ядра Efficient Core (без HT) с двумя ядрами Skylake с поддержкой HT. Первый набор оказался на 80% быстрее в многопоточном тесте с гораздо большей энергоэффективностью (на 80% ниже энергопотребление).
Процессоры Intel Alder Lake также вносят улучшения в вычисления, связанные с искусственным интеллектом (AI), и улучшенные функции безопасности.
Производительность Intel Alder Lake-S в тестах
Intel раскрыла некоторые секреты. Intel Core i9-12900K работает лучше, чем процессор Intel предыдущего поколения, в отдельных тестах и приложениях для редактирования фото и видео, 2D и 3D моделирования. Отличия достигают десятка или даже нескольких десятков процентов в зависимости от программного обеспечения.
Производительность Alder Lake-S в играх
Игровая производительность процессоров Intel Alder Lake-S была тщательно охраняемым секретом. Даже предпремьерные утечки ничего не показали. Даже производительность инженерного сэмпла в Dota 2 мало что показала. Согласно опубликованным графикам для таких игр как Age of Empires 4, Far Cry 6 или Hitman 3, Intel Core i9-12900K быстрее Ryzen 9 5950X на несколько процентов.
В крайних случаях производительность между этими процессорами сопоставима (Shadow of the Tomb Raider и Crysis Remastered), с другой стороны, разница достигает 20-30% в пользу процессора Intel Alder Lake-S (Grid 2019 и Troy: A Total War Saga).
Intel Core i9-12900K также работает лучше, чем Intel Core i9-11900K. Различия в производительности в отдельных играх колеблются от 17% до 28%.
Какие материнские платы и охлаждение для Intel Alder Lake-S
Для процессоров Intel Alder Lake-S требуются материнские платы с чипсетом серии 600 (Z690, H670, B660, H610) и новым сокетом – LGA 1700. Однако, на этом изменения не заканчиваются – ведь новые процессоры поддерживают DDR5 и PCI-Express 5.0.
Но, будьте спокойны – новая платформа также совместима с DDR4-3200. Новый тип памяти поддерживается топовыми материнскими платами Intel Z690. Пока не известно, как это будет выглядеть для других раскладок.
Что немаловажно, поддержка сокета LGA 1700 не прекратится после запуска Alder Lakes. Для процессоров Intel Core 13-го поколения, Intel Raptor Lake-S, вам не понадобится другой сокет или новый набор микросхем. Однако, LGA 1700 требует либо другого типа охлаждения, либо модификации существующей конструкции из-за измененных размеров (37,5 мм x 45 мм), которые связаны с прямоугольной формой процессора (он также немного тоньше).
Intel, а также AMD отказались от комплектного охлаждения для более высоких моделей в последней серии. В случае Intel Alder Lake-S это не исключение. Так как в случае топовых процессоров потребители обычно покупают отдельную систему охлаждения (всё чаще водяное).
Есть ли на материнских платах для Intel Alder Lake-S разъём ATX12VO
Согласно утечкам, Intel пыталась заставить производителей материнских плат и блоков питания использовать в своих разработках новый стандарт питания ATX12VO, который снижает энергопотребление в режиме ожидания на 27%. Однако, компаниям потребуется 4-5 месяцев, чтобы внедрить его. Новый тип разъёма откажется от линий 3,3 В и 5 В, оставив только 12 В. Совместимая материнская плата заменит 24-контактный на 10-контактный разъём.
Однако, возможно, это песня будущего. Ведь материнские платы Intel Z690 имеют традиционный разъём. Большинство производителей решили отказаться от перехода на новый стандарт блоков питания ATX12VO. Планы Intel предполагали, что, по крайней мере, одна материнская плата будет оснащена новым 10-контактным разъемом, для которого также потребуется совместимый блок питания.
Совместим ли Intel Alder Lake-S со старыми системами охлаждения?
Noctua официально объявила, что старые версии систем охлаждения ЦП будут совместимы с новой платформой Intel Alder Lake-S. Производитель бесплатно предоставит соответствующий монтажный комплект, который позволит использовать охлаждение на LGA1700 (требуется подтверждение покупки, в том числе для процессора и материнской платы). Это означает, что совместимость со старыми системами будет зависеть от решения компании.
К премьере Intel Core 12-го поколения производители, естественно, подготовили набор новых систем охлаждения специально для платформы Intel Alder Lake-S.
Intel Alder Lake-S – цена процессоров 12-го поколения
Цены на процессоры Intel Core 12-го поколения оказались немного выше, чем на Intel Rocket Lake-S. Самый дорогой представитель 11-го поколения Intel Core i9-11900K в день премьеры стоил 539 долларов, а самый дешёвый Core i5-11400F – 157 долларов. Поэтому старшая модель из новой серии дороже на 50 долларов аналога предыдущего поколения.
Объясняем, почему Intel Alder Lake — главный процессор этой осени
В этом году Intel ® развернула небывалую активность. Кажется, до сих пор не случалось такого, чтоб нам пришлось анализировать два последовательных дизайна клиентских процессоров в течение всего нескольких месяцев. Но всё когда-то бывает в первый раз, и сегодня – вполне подходящий момент, чтобы предварительно познакомиться с процессорами Alder Lake, хотя предыдущее поколение Rocket Lake всё ещё остаётся недавней новинкой.
В действительности до выхода Alder Lake пока ещё есть немного времени. Процессоры этого семейства, по всей видимости, будут анонсированы на специальном мероприятии Intel Innovation 27-28 октября, то есть через месяц. Однако предстоящий анонс представляется слишком грандиозным событием, чтобы не подготовиться к нему заранее. Ведь на этот раз выход новых процессоров будет означать и смену платформы, и смену микроархитектуры, и даже в каком-то смысле смену всей концепции многопоточных вычислений. Именно поэтому мы решили собрать и систематизировать всю имеющуюся информацию, касающуюся Alder Lake, заранее, с тем чтобы по прошествии месяца встречать эти процессоры во всеоружии, обладая всем набором необходимых теоретических знаний.
К счастью, Intel уже раскрыла довольно много подробностей о строении и внутреннем устройстве Alder Lake во время презентаций Intel Accelerated и Intel Architecture Day 2021. Благодаря этому сегодня мы в рамках партнёрского проекта с компанией Intel сможем поговорить о будущих потребительских процессорах, основываясь исключительно на проверенных данных из первых рук.
⇡#Alder Lake с высоты птичьего полёта
Выход процессоров Alder Lake вне зависимости от того, насколько они окажутся успешны, станет очень большим событием для всего процессорного рынка. Дело не только в том, что в них Intel серьёзно обновит микроархитектуру и добавит поддержку принципиально новых типов памяти и внешних интерфейсов, но ещё и в том, что они станут воплощением совершенно иной концепции многопоточных вычислений, прибегать к которой в массовых x86-процессорах пока ещё никто не пытался. Речь идёт о том, что Alder Lake получат гибридное строение и будут основываться на ядрах двух типов одновременно – производительных (P-ядрах) и эффективных (E-ядрах). Их объединение в одном вычислительном устройстве, по задумке разработчиков, должно позволить добиться недостижимой ранее гибкости как в смысле сферы применимости таких процессоров, так и с точки зрения соотношения производительности и энергоэффективности.
Гибридный подход big.LITTLE уже давно используется в процессорах с архитектурой ARM, и идея Intel, которая будет воплощена в Alder Lake, чем-то напоминает эту схему. По задумке Intel, большие производительные ядра следует бросать на решение высокоприоритетных задач переднего плана, требующих короткого времени реакции, в то время как маленькие и энергоэффективные ядра могут заняться фоновыми процессами. Кроме того, все типы ядер можно объединить для решения одной задачи, что позволит достичь максимального уровня быстродействия, по крайней мере в теории.
При этом оба типа ядер в Alder Lake получили новые микроархитектуры, с которыми мы до сих пор не сталкивались. Производительные ядра основаны на микроархитектуре Golden Cove, которая является дальнейшим развитием Cypress Cove (из Rocket Lake) и Willow Cove (из Tiger Lake). А эффективные ядра имеют микроархитектуру Gracemont, которая выросла из процессоров Atom и является дальнейшим развитием микроархитектуры Tremont, применявшейся как в экспериментальных процессорах Lakefield, так и в более понятных Pentium (Silver) и Celeron серий N и J с кодовыми именами Jasper Lake и Elkhart Lake.
Важной задачей, которую Intel ставила перед собой при разработке Alder Lake, было создание не только двух типов ядер, но и более широкого набора разнообразных конструкционных блоков, которые могли бы позволить легко собирать различные по назначению потребительские процессоры для разных рыночных сегментов и с различными характеристиками: как высокопроизводительные настольные, так и мобильные и даже ультрамобильные.
Несмотря на заложенную в дизайне модульность, в процессорах Alder Lake пока не применяется тайловая топология – аналог чиплетов в видении Intel. Такой способ сборки компания возьмёт на вооружение чуть позднее. Вместо этого различные варианты Alder Lake конструируются на одном монолитном полупроводниковом кристалле. Но для удобства разработчики специально подогнали размеры составных частей Alder Lake друг к другу, и, например, одно производительное P-ядро примерно соответствует по площади собранным в кластер четырём эффективным E-ядрам. Подобные пропорции выдерживаются и для других элементов процессора (для графического ядра, контроллера памяти, контроллера PCIe и проч.) – это как раз и обеспечивает многообразие и гибкость конфигураций.
Неотъемлемой частью будущих процессоров Alder Lake, как и раньше, осталось графическое ядро. Intel предусмотрела два варианта графики: GT1 с 32 исполнительными устройствами для настольных процессоров и GT2 c 96 устройствами для мобильных применений. Встроенные GPU базируются на графической архитектуре 12-го поколения, то есть они относятся к классу Xe LP и примерно соответствуют по возможностям графическому ядру процессоров Tiger Lake. В варианте GT2 встроенная графика, как ожидается, сможет обеспечить приемлемую игровую производительность в разрешении 1080p (с низкими настройками качества) и будет поддерживать 12-битный конвейер воспроизведения видео. Однако в десктопные процессоры попадёт лишь более простой вариант GPU.
Отсутствие кардинальных обновлений в графическом ядре должен скомпенсировать новый контроллер памяти с поддержкой сразу четырёх типов SDRAM. Он может работать как с новыми DDR5-4800 и LPDDR5-5200, так и со старой памятью DDR4-3200 и LPDDR4X-4266. Естественно, все четыре типа памяти будут поддерживаться не одновременно: выбор того или иного варианта будет происходить на этапе проектирования конкретной платформы. Логично ожидать, что поддержка DDR5 SDRAM в первую очередь появится в высокопроизводительных десктопах (условно говоря, основанных на чипсетах Z-серии), в то время как решения среднего уровня продолжат опираться на привычную DDR4- и LPDDR4X-память. И так будет продолжаться до тех пор, пока цена модулей DDR5 будет существенно превышать стоимость DDR4.
Блок интерфейса PCI Express, который инженеры Intel спроектировали для Alder Lake, также содержит серьёзные инновации. Впервые в потребительском сегменте он наделён поддержкой протокола PCIe 5.0, который обеспечивает очередное удвоение пропускной способности и позволяет обеспечить графическому слоту PCIe x16 полосу 64 Гбайт/с. В то же время для подключения NVMe-накопителей процессорный контроллер предлагает лишь интерфейс PCIe 4.0 x4, которого, впрочем, достаточно для любых представленных на рынке SSD. Кроме того, поддержка PCIe 5.0 будет присутствовать исключительно в настольных версиях Alder Lake. Процессоры, отнесённые к мобильному сегменту, получат иной контроллер PCIe, в котором возможности будут каким-то образом урезаны.
Но есть и обратные примеры: некоторые конструкционные блоки Alder Lake предназначаются исключительно для мобильных вариантов CPU. К их числу относятся, например, контроллер Thunderbolt 4 или сопроцессор обработки изображений IPU. Они встраиваться в настольные версии процессоров не будут.
Все элементы Alder Lake, включая разные ядра, графику и фрагменты L3-кеша, контроллеры памяти и PCIe, а также все прочие блоки, как и ранее, объединены в одно целое посредством двунаправленной кольцевой шины, которая в этой реализации имеет пропускную способность до 1000 Гбайт/с. Похожий вариант кольцевой шины уже использовался в мобильных Tiger Lake, однако в новых процессорах Intel пообещала дополнительные оптимизации, направленные на снижение задержек.
Ещё одно большое нововведение касается технологического процесса производства. Alder Lake станут первыми чипами Intel, которые будут выпускаться по техпроцессу Intel 7 – до недавнего переименования он фигурировал под названием 10 нм Enhanced SuperFin. Речь здесь идёт о втором этапе оптимизаций процесса с 10-нм нормами, который должен обеспечить улучшение удельной производительности на ватт на 10-15 % относительно прошлой версии техпроцесса 10 нм SuperFin. Хотя ранее техпроцесс Intel 7 считался 10-нм, по плотности размещения транзисторов на кристалле он либо сравним, либо превосходит 7-нм техпроцесс других производителей, что как раз и дало производителю моральное право переименовать технологию в Intel 7. Так, согласно данным WikiChip, бывший 10-нм техпроцесс Intel обеспечивает размещение 100,76 млн транзисторов на мм 2 , в то время как 7-нм процесс TSMC упаковывает на той же площади только 91,2 млн транзисторов.
Пользуясь данной производственной технологией, Intel собирается упаковывать в полупроводниковые кристаллы Alder Lake до восьми производительных и восьми эффективных ядер одновременно. Это значит, что максимальное число ядер в будущих процессорах достигает 16, но такие конфигурации будут предлагаться только для настольных платформ. Довольно непривычно, что максимальный 16-ядерный процессор сможет исполнять одновременно не 32, а только 24 потока, а объём его кеш-памяти третьего уровня составит 30 Мбайт.
Такое странное сочетание числа ядер и потоков обусловлено тем, что P-ядра обладают поддержкой технологии Hyper-Threading, в то время как E-ядра её лишены. Более того, они работают на разных тактовых частотах и обладают различными по объёму и организации кешами. Всё это значит, что паспортные характеристики разнообразных моделей Alder Lake могут многим показаться удивительными: в зависимости от количества тех или иных ядер конкретные CPU будут получать очень непривычные комбинации числа потоков и ядер, частот и объёма кеш-памяти.
На данный момент Intel раскрыла три базовые конструкции полупроводниковых кристаллов Alder Lake, нацеленные на три различных сегмента: высокопроизводительные настольные процессоры Alder Lake-S, которые будут устанавливаться в новое поколение материнских плат с процессорным разъёмом LGA1700; мобильные процессоры Alder Lake-P с тепловым пакетом от 12 до 35 Вт в исполнении BGA Type3; ультрамобильные Alder Lake-M в корпусе BGA Type4 HDI с тепловым пакетом от 7 до 15 Вт, предназначенные для ультрабуков. Кристалл процессоров Alder Lake-S содержит восемь P-ядер, восемь E-ядер и графику GT1. В Alder Lake-P число P-ядер ограничивается шестью, но зато используется производительная графика GT2. А в Alder Lake-M предусматривается лишь два P-ядра, но всё те же восемь E-ядер и GT2 GPU.
Судя по всему, первыми на рынок придут процессоры Alder Lake-S для настольных систем. Их модельный ряд будет возглавлять процессоры Core i9 с ядерной формулой 8 + 8, а также, по неподтверждённой пока информации, в него могут войти процессоры Core i7 с формулой 8 + 4, два варианта Core i5 с формулой 6 + 4 или 6 + 0, и, возможно, процессоры Core i3 со схемой ядер 4 + 0. Отдельно необходимо подчеркнуть, что такая запись числа ядер в виде суммы двух слагаемых используется непроста. Суммировать количество P- и E-ядер неправильно: Intel не собирается преподносить старшие Alder Lake в качестве 16-ядерных предложений, они скорее будут позиционироваться как продвинутые восьмиядерники с дополнительными энергоэффективными ядрами. Поэтому, например, не стоит удивляться составу серии Core i5, где одновременно будут представлены процессоры с 10 и с 6 ядрами: число E-ядер не считается определяющим фактором и может варьироваться у соседних моделей.
⇡#Как это всё работает: Intel Thread Director
Строго говоря, Alder Lake – не первые x86-процессоры, объединяющие ядра двух разных типов. Ранее Intel уже выпускала гибридные энергоэффективные процессоры Lakefield, где одно ядро Sunny Cove соседствовало с четырьмя ядрами Tremont. Однако они не получили заметного признания и, хотя были представлены только во втором квартале прошлого года, уже сняты с производства. Своей печальной участью они отчасти обязаны проблемам с их функционированием в Windows 10, которая не всегда правильно распределяла нагрузку по разнородным ядрам, что приводило к снижению производительности. Изначально предполагалось, что для устройств на базе Lakefield будет предназначена специальная операционная система Windows 10X, в которой будут заложены адаптированные алгоритмы, однако, к сожалению, её выпуск Microsoft отменила.
Эта история вызывает опасения, что подобное может произойти и с Alder Lake. Ведь совершенно очевидно, что для правильной работы гибридных процессоров планировщик операционной системы должен различать типы ядер и динамически отправлять требовательные нагрузки на ядра, способные предложить высокую производительность, попутно освобождая их от фоновых задач. Но на этот раз Intel всё предусмотрела. Чтобы помочь планировщику лучше разобраться в структуре процессора и добиться максимальной эффективности работы, в Alder Lake появилась аппаратная технология Intel Thread Director, которая будет отвечать за распределение нагрузки совместно с новой операционной системой Windows 11.
Суть Thread Director состоит в том, чтобы передать планировщику ОС подробные телеметрические данные о текущем состоянии всех ядер, благодаря которым он сможет принимать обоснованные решения о привязке потоков к конкретным ядрам. Данная технология, как обещает Intel, должна обходить все трудности, которые могут возникать при практической эксплуатации гибридных процессоров с ядрами разных типов. И самое главное, она совершенно прозрачна для программного обеспечения и не требует внесения каких-либо изменений в программный код.
Основной частью Intel Thread Director является встроенный в процессор микроконтроллер, который собирает подробные низкоуровневые данные о каждом ядре процессора, включая температуру, энергопотребление, загрузку и прочие параметры, и с минимальными задержками передаёт их планировщику операционной системы. Помимо этого, Thread Director непрерывно, с наносекундной дискретностью, отслеживает инструкции, которые исполняются каждым ядром, а также анализирует загрузку их исполнительных устройств. Базируясь на всей этой информации, планировщик получает возможность переключать потоки между ядрами полностью обоснованно и в соответствии с понятной стратегией, суть которой заключается в том, чтобы обеспечить задачам переднего плана и приложениям, чувствительным к задержкам, максимальную скорость выполнения. Например, более высокий приоритет при перемещении на производительные ядра получают потоки, которые оперируют векторными инструкциями, а потоки, работающие со скалярными инструкциями, с большей вероятностью отправляются на энергоэффективные ядра. Но в любом случае вся эта система динамична и переброс потоков с одних ядер на другие зависит от массы различных факторов, и в том числе от видов нагрузки, исполняемой на процессоре в каждый конкретный момент времени.
Intel привела несколько примеров того, как работает Thread Director в некоторых частных случаях. Например, когда все ядра свободны, единичный процесс всегда будет отправлен сразу на P-ядро, однако если в момент старта процесса все такие ядра заняты, он начнёт работу на E-ядре и переместится на P-ядро только тогда, когда Thread Director сочтёт такой перенос целесообразным. В другой ситуации, когда процессор загружается всё возрастающим числом равноправных потоков, они сначала отправляются по одному на каждое свободное P-ядро, затем по одному на каждое свободное E-ядро, а потом по одному на виртуальные ядра, существующие за счёт технологии Hyper-Threading.
Отдельно оговаривается и то, что привязка потоков к ядрам не постоянна, и они могут активно перемещаться с одного типа ядер на другой прямо в процессе работы. Это может происходить как из-за изменения характера нагрузки внутри вычислительного потока, так и в ситуациях, когда количество требовательных потоков начинает превышать число производительных ядер. В этой ситуации некоторые потоки будут перенесены на E-ядра с целью высвободить мощности под ту нагрузку, которая больше нуждается в вычислительных мощностях в каждый конкретный момент времени.
Существовавшие до сих пор процессоры и операционные системы не обменивались информацией, чтобы оптимизировать распределение вычислительных ресурсов: планировщик опирался исключительно на данные о приоритетах потоков, назначенных им либо самой операционной системой, либо разработчиками программы. Теперь же за счёт технологии Thread Director работа планировщика должна стать более самостоятельным, тонким и динамичным процессом. Такой симбиоз аппаратных и программных средств внушает надежду, что разнородные ядра гибридных процессоров Alder Lake будут задействованы именно так, как задумано Intel, – чтобы обеспечивать максимальный уровень быстродействия.
Вместе с тем внедрение Thread Director добавляет новые возможности и для разработчиков ПО. Доступные для процессоров Alder Lake расширения библиотек PowerThrottling API вводят для потоков дополнительные атрибуты качества обслуживания, благодаря которым авторы программ при желании смогут размечать создаваемые потоки. Кроме того, для потоков, которые заведомо способны работать на энергоэффективных ядрах и не нуждаются в высоких вычислительных мощностях, введена отдельная маркировка. Известно, что различные компоненты Windows 11, включая браузер Edge, будут использовать описанные расширения, что ещё раз отражает близкое сотрудничество Intel с Microsoft в вопросе создания и поддержки гибридной процессорной архитектуры.
К сожалению, Intel не стала делиться подробной информацией о работе Thread Director, поэтому пока нам придётся принять на веру тот факт, что благодаря этой технологии нужная нагрузка действительно будет отправляться на нужные ядра. Впрочем, процессоры Alder Lake позволят отключить E-ядра, если у пользователя возникнут сомнения в целесообразности их привлечения к работе.
Говоря о распределении потоков по ядрам гибридного процессора, Intel делает особый упор на новую операционную систему Windows 11 с оптимизированным планировщиком. Тем не менее Alder Lake должны приемлемо работать и без реализованного в этой операционной системе тесного взаимодействия между Alder Lake и планировщиком. Intel указывает, что и в старой операционной системе Windows 10 новые процессоры смогут работать вполне нормально. Хотя технология Thread Director в Windows 10 не поддерживается, эта операционная система опирается на механизм Intel Hardware Guided Scheduling, который тоже способен переключать потоки с учётом разнородности ядер, просто не настолько точно и с несколько более низкой частотой. Тем не менее, по утверждению Intel, заметить невооружённым глазом разницу в производительности Alder Lake в Windows 10 и Windows 11 будет довольно сложно.
⇡#Инцидент с AVX-512
О том, что энергоэффективные ядра Gracemont не имеют 512-битных регистров и не поддерживают набор инструкций AVX-512, известно довольно давно, и это кажется вполне естественным, если вспомнить, что реализация векторных операций требует как существенного транзисторного бюджета, так и заметных затрат энергии. Но тут же возникает закономерный вопрос о том, как в этом случае будет строиться работа с этими инструкциями в процессорах Alder Lake в целом? Ответ на этот вопрос оказался очень простым – никак. Хотя в производительных ядрах Willow Cove в составе Alder Lake регистры и исполнительные устройства с 512-битной размерностью заложены в микроархитектуре, исполнение инструкций AVX-512 в них заблокировано на аппаратном уровне, чтобы не вызывать лишних коллизий при диспетчеризации потоков, работающих с такими командами.
И это значит, что с появлением процессоров Alder Lake в поддерживаемых потребительскими CPU расширениях набора инструкций произошёл откат назад. Несмотря на то, что поддержка AVX-512 была реализована и в мобильных процессорах Tiger Lake, и в десктопных Rocket Lake, в новом поколении процессоров её снова не будет.
В качестве некой компенсации Intel добавила в Alder Lake поддержку подмножества инструкций VNNI для решения задач, связанных с нейронными сетями. И эти инструкции, как ни странно, могут исполняться как на производительных, так и на энергоэффективных ядрах. Однако это вовсе не те инструкции VNNI, которые ранее считались частью набора AVX-512 и оперировали 512-битными регистрами. Поскольку в Alder Lake эти регистры заблокированы, инструкции VNNI в них оперируют 256-битными регистрами и как бы существуют в рамках подмножества команд AVX2. Иными словами, набор инструкций AVX2-VNNI, который реализован в Alder Lake, отличается по разрядности от введённого ранее набора AVX-512 VNNI и требует специальной поддержки со стороны ПО. По этой причине рассчитывать на то, что введённые в Alder Lake уникальные инструкции VNNI станут активно использоваться в программных продуктах, не приходится.
⇡#Производительные ядра в подробностях
Наиболее важная часть процессоров Alder Lake – новые P-ядра Golden Cove. Они не только занимают на полупроводниковом кристалле самую значительную часть площади, но и несут львиную долю ответственности за производительность процессора, так как берут на себя выполнение ресурсоёмких задач переднего плана. Поэтому совершенно неудивительно, что перед разработчиками микроархитектуры Golden Cove была поставлена задача не просто создать самое быстрое из всех существующих x86-ядро, а добиться явного превосходства в удельной производительности над предшественниками. Однако речь не шла о победе любой ценой: процессоры на базе ядер Golden Cove должны иметь возможность работы в широком ассортименте устройств, начиная от ноутбуков и заканчивая серверами, а значит, помимо высокой производительности огромное значение имеет и возможность масштабирования характеристик. Например, в случае интересующих нас в первую очередь потребительских процессоров Alder Lake важную роль играет оптимизация микроархитектуры как под однопоточные нагрузки, так и под многопоточные ресурсоёмкие приложения для работы с цифровым контентом.
Intel долгое время опиралась на ядро Skylake и взялась за серьёзную переделку своей самой успешной и самой долгоживущей микроархитектуры сравнительно недавно. Но, начав с вышедшей в 2019 году микроархитектуры Sunny Cove, компания принялась проводить различные улучшения непривычно бодро. Она сразу же сформулировала принцип «шире, глубже, умнее» и в соответствии с ним стала последовательно перекраивать старое ядро Skylake. Микроархитектура Golden Cove, таким образом, уже вторая итерация улучшений. И в ней мы снова видим более глубокие буферы переупорядочивания, большее количество физических регистров, более широкое окно выборки инструкций и возросшее количество исполнительных портов. К этому списку прилагается также улучшение предсказания ветвлений, что снижает простои исполнительных устройств из-за неправильного прогнозирования переходов.
Сама Intel оценивает результативность внесённых в микроархитектуру изменений очень высоко. Согласно данным компании, средняя удельная производительность ядра Golden Cove (на одинаковой частоте) выше производительности ядра Cypress Cove, применяющегося в процессорах Rocket Lake, на 19 %. При этом в некоторых задачах прирост в пределах одной смены поколений может быть намного выше и достигать величины до 60 %. И всё это звучит очень многообещающе, ведь благодаря новой производственной технологии Intel 7 процессоры Alder Lake не должны отставать от предшественников и по тактовым частотам.
Более того, прирост удельной производительности в каждой новой версии микроархитектуры на 19 % стал для Intel, похоже, неким стандартом. Такой же шаг вперёд был сделан при переходе от Skylake к Cypress Cove, и это значит, что показатель IPC (удельная производительность на такт) ядра Golden Cove выше, чем у Skylake, где-то на 40-45 %. В результате от Golden Cove вполне можно ожидать заметного превосходства и над конкурирующими архитектурами, в частности над Zen 3.
Заметные изменения в микроархитектуре Golden Cove начинают прослеживаться уже во входной части исполнительного конвейера. В первую очередь стоит отметить увеличение числа декодеров — с 4 до 6 , что даёт возможность ядру декодировать по 6 инструкций за такт. Для того чтобы декодеры не простаивали без работы, в Golden Cove с 16 до 32 байт увеличился объём выборки кода. Кроме этого, Intel поработала и в направлении повышения эффективности кеша микроопераций, где хранятся уже декодированные инструкции. Если сравнивать с Cypress Cove, то его объём увеличился с 2,25 до 4 тыс. записей, а пропускная способность выросла до 8 микроопераций за такт вместо 6. Всё это позволяет насыщать последующие после декодирования этапы исполнительного конвейера – диспетчер и планировщик – с заметно более высокой интенсивностью.
Для улучшения возможности работы со сложным кодом Intel удвоила число записей, относящихся к 4K-страницам, в iTLB, а также улучшила предсказание переходов, увеличив максимальную размерность буфера целей ветвлений с 5 до 12 тысяч записей. Кроме того, этот буфер получил дополнительную интеллектуальность – основанный на машинном обучении алгоритм, способный подстраивать его вместимость под текущую нагрузку для оптимизации производительности и энергопотребления.
Диспетчер, занимающийся приёмом и размещением микроопераций, а также переименованием регистров, получил возросшую ширину – в него теперь входит 6, а не 5, как раньше, равноправных блоков. Механизм внеочередного исполнения стал эффективнее за счёт увеличения соответствующего буфера с 352 до 512 записей. И в сумме всего этого оказалось вполне достаточно для загрузки работой возросшего числа исполнительных устройств, которые сгруппированы в Golden Cove в 12 портов (против 10 портов у Cypress Cove). Кроме того, Intel упомянула ещё один новый механизм, благодаря которому некоторые инструкции могут быть выполнены ещё на этапе переименования регистров, что должно дополнительно разгрузить исполнительный домен.
Один из добавленных в Golden Cove исполнительных портов отдан под работу с командами ALU и LEA. Таким образом, новое ядро располагает сразу пятью целочисленными устройствами, способными исполнять по одной команде за такт.
Кроме того, отдельно здесь же появились два дополнительных устройства для быстрого векторного сложения (FADD).
Улучшения коснулись и L1D-кеша, который получил три порта загрузки вместо двух, имевшихся ранее, а также более вместительные буферы загрузки и выгрузки. Попутно Intel на 50 % увеличила вместимость L1 TLB. Изменения в алгоритме работы L1D затронули и предварительную выборку данных, в которой теперь используется четыре анализатора вместо двух, что должно дать эффект при работе в многопоточной среде. При этом объём L1D кеша в ядре Golden Cove останется на уровне 48 Кбайт – как и в Sunny Cove.
Что касается кеш-памяти второго уровня, то в Alder Lake на каждое P-ядро будет полагаться L2-кеш объёмом 1,25 Мбайт с низкой латентностью и возможностью расширения в перспективе до 2 Мбайт. Как и в случае L1D, Intel обещает для него улучшенную предвыборку данных, основанную на выявлении шаблонов запросов к памяти.
Подводя итог всему перечисленному, можно констатировать, что по сравнению с прошлым поколением микроархитектуры у ядра Golden Cove на 50 % расширился декодер, на 25 % — стадия подготовки микроопераций и на 45 % – буфер внеочередного исполнения. Плюс всё это приправлено существенными улучшениями в механизме предсказания переходов. Как перечисленные усовершенствования выглядят в численном выражении, можно посмотреть в приведённой таблице.
Skylake | Sunny Cove | Golden Cove | |
---|---|---|---|
Кеш микроопераций, объём | 1,5К | 2,25K | 4,0K |
Кеш микроопераций, операций/такт | 6 | 6 | 8 |
Декодеры | 4 | 4 | 6 |
Буфер переупорядочивания, объём | 224 | 352 | 512 |
Исполнительные порты | 8 | 10 | 12 |
Целочисленные ALU | 4 | 4 | 5 |
Загрузка данных | 2 × 256 | 2 × 512 | 2 × 512 или 3 × 256 |
Кеш L1D, Кбайт | 32 | 48 | 48 |
Кеш L2, Кбайт | 256 | 512 | 1280 |
Остаётся лишь добавить, что в ядрах Golden Cove появился ещё один любопытный элемент – дополнительный и полностью самостоятельный микроконтроллер для управления питанием, который обеспечивает сбор телеметрии с микросекундной дискретностью, что на несколько порядков улучшает точность всего мониторинга по сравнению со старой схемой. По словам Intel, повышенная точность позволяет управлять энергопотреблением и производительностью CPU с меньшими задержками, что в конечном итоге повышает средние частоты ядра под нагрузкой без ущерба для энергопотребления и тепловыделения. Встроенный микроконтроллер для управления питанием в Golden Cove применяется впервые – подобных решений в ядрах Intel ранее не было. И он пришёлся в Alder Lake как нельзя более кстати – тот же микроконтроллер активно задействуется и в работе технологии Thread Director.
⇡#Энергоэффективные ядра в подробностях
Энергоэффективные ядра в Alder Lake играют роль аккомпанемента для ядер Golden Cove. Они не исполняют сольных партий, но зато вместе с ними P-ядра, образно выражаясь, должны зазвучать более убедительно. E-ядра основываются на микроархитектуре Gracemont и представляют собой дальнейшее развитие процессоров Atom, хотя и ушли от них довольно далеко. Тем не менее концепция осталось той же: на первом месте в них стоит компактность и экономичность. Но при этом, по утверждению Intel, разработчикам удалось спроектировать ядра Gracemont такими, что с точки зрения удельной производительности на ватт они заметно превосходят Skylake, занимая на кристалле в четыре раза меньше места, чем P-ядра, и к тому же отличаются высокой энергоэффективностью.
Согласно собственным данным Intel, полученным при однопоточной целочисленной нагрузке, в случае уравнивания энергопотребления Gracemont оказывается производительнее Skylake на 40 %, а в случае равенства производительности – потребляют на 40 % меньше.
Другой показатель, который приводят разработчики, касается четырёхпоточной производительности: два ядра Skylake с поддержкой Hyper-Threading проигрывают четырём ядрам Gracemont в производительности порядка 80 % при равном потреблении, а при одинаковом быстродействии потребляют на 80 % больше энергии.
Впрочем, приведённые сравнения вовсе не означают, что E-ядра процессоров Alder Lake лучше Skylake во всех отношениях. В действительности в приводимых Intel сравнениях сделано несколько допущений. Во-первых, производительность ядер сравнивается исключительно при простой целочисленной нагрузке, именно под которую, очевидно, оптимизированы ядра Gracemont. Во-вторых, в случае четырёхпоточного теста одиночным ядрам Skylake противопоставляются пары ядер Gracemont, которые Hyper-Threading не поддерживают. Но тем не менее явная сильная сторона Gracemont заключается в том, что их по производительности всё-таки можно сопоставлять с Skylake, несмотря на то, что они в разы меньше по площади.
Достигнуто это за счёт глубокой переработки прошлых энергоэффективных микроархитектур Intel. В последних двух поколениях, Tremont и Gracemont, кардинально видоизменилась и стала глубже и шире входная часть исполнительного конвейера, плюс значительно выросло число исполнительных портов. Более того, в Gracemont даже добавились 256-битные регистры и исполнительные устройства для реализации наборов команд AVX2 и AVX2-VNNI. То есть E-ядра ушли от предшественников с микроархитектурой Goldmont очень далеко: не только принципиально увеличилась производительность, но и по возможностям E-ядра подтянулись к «большим» собратьям.
Сдвоенный шестивходовый декодер, который способен декодировать два потока с темпом по три x86-инструкции за такт, появился ещё в ядре Tremont. Он хорошо зарекомендовал себя там, и Intel перенесла его и в Gracemont. Но в новом поколении микроархитектуры он дополнен более вместительным L1I-кешем инструкций объёмом 64 Кбайт, который даже превосходит по объёму L1I-кеш производительного ядра Golden Cove. Рост объёма кеша произошёл одновременно с увеличением до 5000 записей буфера целей ветвлений, который работает более эффективно тогда, когда цели ветвлений находятся в кеше, – это привело к повышению результативности предсказания переходов. Кроме того, на базе L1I-кеша работает ещё один механизм – «декодирование по запросу», который отчасти заменяет отсутствующий в Gracemont кеш микроопераций и частично сохраняет историю предыдущих декодирований, позволяя при ошибках в предсказании переходов избегать повторного декодирования некоторых фрагментов однажды обработанного потока инструкций.
Далее, в микроархитектуре Gracemont предусмотрен пятивходовый блок размещения инструкций и восьмипортовый блок их отставки, которые работают с выросшим до 256 записей буфером переупорядочивания инструкций. А затем в конвейере находится 17 исполнительных портов – поистине гигантский по ширине исполнительный домен. И хотя все порты в данном случае заметно проще, чем в «больших» ядрах, на целочисленных инструкциях этот массив действительно может обеспечивать более высокий показатель IPC, нежели восемь портов ядра Skylake. Однако нужно понимать, что, несмотря на его ширину, одновременно в исполнительный домен Gracemont можно загружать не более пяти микроопераций за такт, и именно это ограничивает темп исполнения программного кода.
В исполнительном домене Gracemont предусмотрено четыре независимых целочисленных устройства общего назначения, и два из них умеют исполнять операции умножения и деления. Кроме того, ядро имеет необходимые ресурсы, чтобы брать два перехода за такт. Для работы с векторными инструкциями и числами с плавающей точкой в Gracemont выделено три порта, два из которых способны обрабатывать операции умножения и деления. В целом конструкция исполнительного домена энергоэффективного ядра предполагает использование большого числа узкоспециализированных исполнительных портов, в то время как в производительных ядрах концепция иная. Там портов меньше, но они более универсальны и ориентированы на более разнородные операции.
При работе с кеш-памятью ядро Gracemont может инициировать две операции загрузки и две операции выгрузки данных за такт, однако, в отличие от P-ядер, здесь эти операции 128-битные. Объём L1D-кеша при этом тоже меньше – всего 32 Кбайт. Отличается и организация кеш-памяти второго уровня. Её объём достигает 2 Мбайт, но он разделяется на расположенные рядом и скомпонованные в единый кластер четыре ядра. Связь L2-кеша с каждым из ядер в этой схеме осуществляется собственным 512-битным каналом. Для совместной работы ядер с L2-кешем в микроархитектуре предусмотрен специальный диспетчер, причём алгоритм его работы настроен на равномерное распределение ресурсов по ядрам, а не на обеспечение низкой латентности для каких-то отдельных потоков. И это отражает, что конструкция E-ядер в первую очередь заточена под многопоточные нагрузки.
Микроархитектура Gracemont предполагает, что такие ядра компонуются в четырёхъядерные кластеры, которые занимают на полупроводниковом кристалле Alder Lake примерно столько же места, сколько одно производительное ядро Golden Cove. Это даёт возможность добавлять в современные процессоры большое количество сравнительно простых вычислителей, которые к тому же обладают очень хорошей энергоэффективностью. Для того чтобы максимально развить эту идею, Intel понизила кластерам E-ядер напряжение питания, и поэтому ядра Gracemont в составе Alder Lake будут работать на сравнительно невысокой частоте. Однако предполагается, что при необходимости их производительность можно масштабировать в широких пределах – они должны хорошо переносить повышение напряжения и отвечать на него ростом верхней границы допустимой частоты.
⇡#Настольные процессоры Alder Lake-S и платформа LGA1700
До прихода на рынок семейства процессоров Alder Lake-S, нацеленного на применение в производительных десктопах, остаётся всего несколько недель, и представить себе, как будет выглядеть соответствующий модельный ряд, можно уже сейчас. Стратегия Intel по выводу Alder Lake-S на рынок предполагает выпуск в первую очередь платформы и процессоров для энтузиастов, в то время как более массовые и доступные модификации появятся позднее. Это значит, что на рынок сначала придут настольные процессоры старших серий Core i9, Core i7 и Core i5, а также единственный флагманский чипсет Z690.
Для использования в первой очереди десктопных процессоров Intel подготовила полупроводниковый кристалл с 8 ядрами Golden Cove, двумя четырёхъядерными кластерами Gracemont и графикой GT1 с 32 исполнительными устройствами. Но полностью этот арсенал будет пущен в ход исключительно в процессорах серии Core i9. Представители младших серий получат меньшее число ядер, причём разница между Core i9 и Core i7 будет определяться числом E-ядер, а в серии Core i5 будут частично отключены как P-ядра, так и E-ядра.
Образцы Alder Lake-S. Источник: Expreview.com
Тактовые частоты P-ядер в Alder Lake-S, предположительно, окажутся на обычном для процессоров Intel уровне: в турборежиме они смогут брать высоту около 4,9-5,3 ГГц при однопоточной нагрузке и 4,5-5,0 ГГц – при многопоточной. Что касается E-ядер, то целевые частоты для них ожидаются в интервале 3,4-3,9 ГГц. Тепловой пакет новых процессоров также вряд ли кого-то удивит: 125 Вт – для моделей с разблокированными множителями и 65 Вт – для обычных.
Зато заметно вырастет в объёме L3-кеш. В процессорах поколений Rocket Lake и Comet Lake на каждое ядро приходился блок L3-кеша объёмом 2 Мбайт. В Alder Lake объём таких блоков, примыкающих к P-ядрам, увеличился до 3 Мбайт. Также 3-Мбайт блоками оснащены и четырёхъядерные кластеры E-ядер, поэтому максимальный объём L3-кеша у старших моделей Alder Lake достигнет 30 Мбайт. Сам кеш при этом неинклюзивный, то есть в нём не дублируется содержимое вышестоящей кеш-памяти.
Отдельно следует сказать про цены. В целом Intel не планирует как-то заметно менять свою ценовую политику. И это означает, что представители серии Core i9 получат рекомендованную стоимость примерно $500-$600, процессоры Core i7 можно будет купить за $350-$450, а Core i5 будут продаваться за $200-$300. Иными словами, компания не считает, что внедрение гибридной архитектуры и добавление E-ядер заслуживает какой-то заметной наценки.
Предполагаемые характеристики первых представителей серии приведены в таблице, но стоит иметь в виду, что эти данные – неофициальные и предварительные.
P-ядра + E-ядра | Число потоков | Частота P-ядер, базовая/ турбо, ГГц | Частота E-ядер, ГГц | L3-кеш, Мбайт | TDP, Вт | |
---|---|---|---|---|---|---|
Core i9-12900K | 8 + 8 | 24 | 3,2-5,3 | До 3,9 | 30 | 125 |
Core i9-12900 | 8 + 8 | 24 | 3,2-5,2 | н/д | 30 | 65 |
Core i7-12700K | 8 + 4 | 20 | 3,6-5,0 | До 3,8 | 25 | 125 |
Core i7-12700 | 8 + 4 | 20 | 3,6-4,9 | н/д | 25 | 65 |
Core i5-12600K | 6 + 4 | 16 | 3,7-4,9 | До 3,6 | 20 | 125 |
Core i5-12600 | 6 + 0 | 12 | 3,7-4,8 | н/д | 18 | 65 |
Core i5-12400 | 6 + 0 | 12 | н/д | н/д | 18 | 65 |
Настольные процессоры семейства Alder Lake-S рассчитаны на использование в материнских платах с новым разъёмом LGA1700, который отличается от актуального LGA1200 не только увеличенным количеством контактов, но и прямоугольной, а не квадратной формой и слегка выросшими геометрическими размерами. Изменения в первую очередь обусловлены появлением поддержки новых типов памяти и интерфейса PCIe 5.0, а во вторую – усложнившейся схемой подвода питания, поскольку P-ядра и E-ядра работают от разных напряжений.
Процессорное гнездо LGA1700. Источник: bilibili.com
К тому же меняется и высота процессора вместе с процессорным гнездом – Alder Lake-S будет примерно на миллиметр меньше возвышаться над материнской платой, нежели предшественники. Это потребует использования для теплоотвода систем охлаждения с другими креплениями, и поэтому крепёжные отверстия в LGA1700-платах будут расположены немного иным образом – квадратом 78 × 78 мм вместо 75 × 75 мм. Таким образом, большинство кулеров от старых компьютеров для Alder Lake-S не подойдёт, по крайней мере без замены крепёжных деталей.
Ввиду того, что контроллер памяти Alder Lake-S поддерживает как DDR4, так и DDR5 SDRAM, материнские платы для этих процессоров будут выпускаться со слотами DIMM либо под ту, либо под другую память. Первое время платы с поддержкой DDR5 SDRAM будут, очевидно, представлены лишь дорогими моделями, поскольку такие модули после их появления в продаже будут стоить заметно дороже, чем DDR4. Однако энтузиасты могут всё равно предпочесть платы с DDR5 DIMM, так как новая память способна обеспечить вдвое более высокую пропускную способность.
Образец Alder Lake-S. Источник: pcinq.com
Для десктопных платформ на базе Alder Lake-S компанией Intel готовится новое семейство наборов логики 600-й серии. В нём будут реализованы существенно расширенные возможности для подключения внешних устройств. Так, старший из будущих чипсетов, Z690, который придёт на рынок первым, сможет предложить даже собственные линии PCIe 4.0.
В дополнение к 16 линиям PCIe 5.0 (для видеокарты) и 4 линиям PCIe 4.0 (для накопителя), за которые отвечает процессор, в системах на основе Z690 добавится 12 чипсетных линий PCIe 4.0, что в конечном итоге позволит установить в систему до четырёх самых современных NVMe-накопителей. Кроме того, в Z690 также заложена и поддержка 16 линий PCIe 3.0, то есть в общей сложности чипсет располагает 28 линиями PCIe, а платформа целиком – 48 линиями. Ещё одно важное изменение, напрямую связанное с появлением в чипсете PCIe 4.0, – перевод соединения между процессором и чипсетом на интерфейс DMI 4.0 x8 с удвоенной полосой пропускания. Это позволит обеспечить достаточную пропускную способность для работы всего набора чипсетных линий PCIe.
Набор системной логики Intel Z690. Источник: pcinq.com
Среди прочих улучшений Z690 также можно отметить увеличение числа 20-гигабитных портов USB 3.2 Gen 2×2 и появление (пока только в теории) поддержки модулей Wi-Fi 7 через интерфейс CNVi.
Intel Z690 | Intel Z590 | |
---|---|---|
Шина DMI 3.0 | DMI 4.0 x8 | DMI 3.0 x8 |
Разгон процессора | Есть | Есть |
Разгон памяти | Есть | Есть |
CPU PCIe | 16 линий PCIe 5.0 4 линии PCIe 4.0 |
20 линий PCIe 4.0 |
Линии PCIe 4.0 | 12 | 0 |
Линии PCIe 3.0 | 16 | 24 |
Порты SATA 6 Гбит/с | 6 | 6 |
Поддержка RAID | Есть | Есть |
USB 3.2 Gen 2×2 (20 Гбит/с) | 4 | 3 |
USB 3.2 Gen 2 (10 Гбит/с) | 10 | 10 |
USB 3.2 Gen 1 (5 Гбит/с) | 10 | 10 |
Ethernet MAC | 5 Гбит/с | 2,5 Гбит/с |
Wi-Fi | Wi-Fi 6E/7 | Wi-Fi 6 |
Представить, какой уровень производительности смогут в конечном итоге предложить процессоры Alder Lake-S, сейчас довольно сложно. Никаких утечек информации на этот счёт, которым действительно можно было бы доверять, пока не было, а оценки удельной производительности микроархитектур, сделанные самим производителем, не дают конкретных ориентиров.
С уверенностью можно говорить лишь об одном: Alder Lake-S будут определённо (и существенно) быстрее предшественников. Отвечают за это производительные ядра Golden Cove, и они наверняка не подведут, поскольку в них заложен целый комплекс улучшений, прямо увеличивающий производительность. Число таких ядер будет не меньше, чем в Rocket Lake, не снизятся и тактовые частоты. Однако не стоит забывать, что с ядрами Golden Cove в будущих процессорах соседствуют и энергоэффективные ядра Gracemont, которые тоже выглядят довольно неплохо, но как будет вести себя в реальности гибридная архитектура, спрогнозировать довольно сложно. Intel уверяет, что современные операционные системы в состоянии разобраться с разнотипными ядрами, но на деле всё это нуждается в доскональной проверке.
Кроме того, коррективы в производительность платформы может внести и DDR5 SDRAM. Часто переход на новые типы памяти с более высокой пропускной способностью оборачивается серьёзным увеличением задержек, и переход от DDR4 к DDR5 – как раз такой случай. Поэтому пока мы воздержимся от каких-либо прогнозов и будем с нетерпением ждать конца октября, когда Intel должна раскрыть дополнительные подробности о перспективном семействе CPU.
Главный же вывод, который нужно сделать сегодня, – качественный: Intel вышла из многолетней спячки и запустила процесс интенсификации инноваций. Прогресс, достигнутый в настольном сегменте, не может не впечатлить. Семейство чипов Rocket Lake, в котором нашли применение ядра Cypress Cove, пришло на рынок всего шесть месяцев тому назад, но сегодня мы уже говорим об их последователях – ядрах Golden Cove и принципиально новых процессорах Alder Lake-S.
И более того, теперь компания уже не собирается останавливаться. Уже в конце следующего года она планирует представить последующее большое обновление потребительской платформы вместе с процессорами Meteor Lake, где число нововведений будет точно не меньшим, чем в Alder Lake. В нём Intel начнёт применять тайловую (многочиповую) топологию, полупроводниковые кристаллы, выпущенные по технологии Intel 4, и новые итерации процессорных микроархитектур. Так что посвящённые новым процессорным дизайнам статьи, подобные этой, будут теперь выходить на нашем сайте заметно чаще.