Новейшие процессоры Intel для десктопов сбоят из-за ошибок на уровне кремния и микрокода. Непоправимо ломаются почти все модели семейства Raptor Lake
«Виновник» найден
Intel установила причину нестабильной работы флагманских моделей фирменных десктопных процессоров семейства Raptor Lake.
Возникновением проблемы, известной как “Vmin Shift”, CPU Intel к дефекту контура тактового дерева схемы производительных вычислительных ядер (IA) процессора (гарантирует синхронное получение тактового сигнала всеми компонентами микросхемы). Эта часть микросхемы, как выяснила Intel, особенно уязвима и быстро и необратимо деградирует под влиянием высоких напряжения и температуры, в результате чего нарушается рабочий цикл процессора.
Под Vmin в Intel подразумевают минимальное значение напряжения, подаваемого на контакты процессора, которое необходимо для обеспечения на 100% стабильной работы микросхемы. CPU сам следит за тем, чтобы текущее напряжение не падало ниже этого порогового значения. Ситуация, в которой устройство по той или иной причине более не способно демонстрировать стабильную работу при Vmin называется «смещением Vmin», или “Vmin Shift”.
Четыре способа «заработать» Vmin Shift
Intel описывает в общей сложности четыре сценария эксплуатации процессора, способных приводить к “Vmin Shift”. Первый предполагает значения параметров питания CPU в BIOS материнской платы, превышающие рекомендованные Intel.
Второй сценарий возможен ввиду наличия ошибки в алгоритме eTVB, используемом в микрокоде процессоров Core i9 13 и 14 поколений. Эту ошибку устраняет обновление микрокоды 0x125.
Технология eTVB, используемая во флагманских чипах Intel, позволяет микросхеме повышать тактовую частоту одного или нескольких ядер с учетом температуры ее работы. Функция позволяет «выжимать максимум» из CPU в требовательных к ресурсам приложениях при его достаточном охлаждении. В результате ошибки алгоритма процессор мог «разгоняться» и работать на повышенной тактовой частоте даже при достижении высоких температур (70-90 градусов Цельсия), которое обусловлено обаятельным в таком случае повышением напряжения на CPU, тогда как в норме алгоритм предполагает снижение частоты и напряжения в подобной ситуации.
Еще одна ошибка алгоритма в микрокоде – на этот раз в интерфейсе взаимодействия процессора с системой питания материнской платы (SVID) – проводит к Vmin Shift. В результате ошибки алгоритм запрашивает более высокие напряжение и частоту на длительные периоды времени, что также приводит к перегреву и деградации уязвимых компонентов микросхемы. Для ее исправления предназначено обновление микрокода 0x129.
Наконец, в последнем, четвертом сценарии микрокод и BIOS запрашивают подачу повышенного напряжения на ядро, в частности, в периоды простоя или незначительной нагрузки в системе. Митигация проблемы осуществляется установкой последнего обновления микрокода 0x12B.
Из опубликованных Intel материалов ясно, что проблеме Vmin Shift подвержены не только флагманы 13 и 14 поколений – исключительно для них характерен только второй описанный сценарий, но и все остальные десктопные представители расширенного семейства Raptor Lake с TDP от 65 Вт и выше (параметр TDP – требования по теплоотводу).
В семейства Raptor Lake и Raptor Lake-R (13 и 14 поколение Intel Core) входит 28 моделей CPU. 22 из них могут быть уязвимы к Vmin Shift.
Больше полугода на поиск первоисточника проблемы
Жалобы на нестабильную работу Intel CPU Core i9 13 и 14 поколений, которая могла приводит к возникновению системных ошибок, начали поступать едва ли с самого начала 2024 г. Лишь в апреле 2024 г. Intel официально признала наличие проблем такого характера. Компания предпочла аккуратно переложить часть вины за их возникновение на производителей материнских плат – якобы предусмотренные ими профили заставляли процессоры работать на чрезмерно высоких частотах и под слишком высоким напряжением. Тогда же выяснилось, что Intel было известно о случаях нестабильной работы флагманов Raptor Lake по крайней мере с февраля 2024 г.
С тех пор Intel опубликовала четыре заявления, касающихся нестабильной работы настольных CPU 13 и 14 поколений, а также два обновления микрокода 0x125 и 0x129 для устранения проблемы, которые впоследствии были объединены в патч 0x12B, который также включает исправления.
Впрочем, эти обновления полезны только владельцам полностью «здоровых» CPU. Если процессор уже демонстрирует признаки нестабильности, существует ненулевая вероятность того, что он неисправен. В таком случае поможет только замена устройства на новое, а обновления микрокода/BIOS не спасут.