80 подписчиков

Конец спекуляции: процессоры будущего отказываются от угадывания

3 ноября 20253 ноя 2025

3 мин

Представьте себе: процессор, который не угадывает, а знает точно. Звучит как фантастика? А между тем, после трёх десятилетий господства спекулятивного выполнения в микропроцессорах, учёные наконец нашли серьёзную альтернативу. И это не просто теория — это уже запатентовано. Помните, как в 1990-х спекулятивное выполнение казалось чудом техники? Процессор угадывал результаты условных переходов и загрузок из памяти, продолжал работу впрёд, не дожидаясь подтверждения. Работает — экономит время, держит конвейер занятым. Но вот незадача: когда угадка ошибалась, конвейер приходилось очищать. Марать всю проделанную работу. И это случается постоянно. В современных нейросетевых и машинном обучении всё стало ещё хуже. Векторные операции, матричные вычисления, нерегулярные обращения к памяти — всё это превращает спекуляцию в решето. Процессор пытается угадать, ошибается, чистит конвейер. Результат: производительность скачет как на американских горках. Плюс уязвимости типа Spectre и Meltdown — вооб

Оглавление

Детерминированное выполнение — революция, которая приходит в CPU
Почему спекуляция исчерпала себя
Революционный подход: время вместо угадывания

Детерминированное выполнение — революция, которая приходит в CPU

Представьте себе: процессор, который не угадывает, а знает точно. Звучит как фантастика? А между тем, после трёх десятилетий господства спекулятивного выполнения в микропроцессорах, учёные наконец нашли серьёзную альтернативу. И это не просто теория — это уже запатентовано.

Почему спекуляция исчерпала себя

Помните, как в 1990-х спекулятивное выполнение казалось чудом техники? Процессор угадывал результаты условных переходов и загрузок из памяти, продолжал работу впрёд, не дожидаясь подтверждения. Работает — экономит время, держит конвейер занятым. Но вот незадача: когда угадка ошибалась, конвейер приходилось очищать. Марать всю проделанную работу. И это случается постоянно.

В современных нейросетевых и машинном обучении всё стало ещё хуже. Векторные операции, матричные вычисления, нерегулярные обращения к памяти — всё это превращает спекуляцию в решето. Процессор пытается угадать, ошибается, чистит конвейер. Результат: производительность скачет как на американских горках. Плюс уязвимости типа Spectre и Meltdown — вообще отдельная боль.

Тут и вспомнили давнюю идею Дэвида Паттерсона из 1980-го: чем проще дизайн — тем быстрее процессор. Вот и решили: а что если вместо угадывания просто спланировать всё заранее?

Революционный подход: время вместо угадывания

Новый метод, описанный в шести недавно выданных американских патентах, работает так: вместо спекулятивных прыжков в темноту, каждой инструкции назначается точный момент выполнения. Процессор использует простой временной счётчик — и всё становится предсказуемым.

Как это работает на практике:

Инструкция анализируется: когда будут готовы её операнды, какие ресурсы понадобятся
Ей назначается конкретный цикл выполнения — не раньше, не позже
Инструкция ждёт в очереди до своего момента
Когда приходит время — выполняется, без откатов и переделок

Звучит медленнее? На самом деле — нет. Потому что латентность (задержка) всё равно существует. Спекулятивный процессор просто пытается её скрыть угадыванием, а когда угадка неверна — теряет время на откат. Детерминированный подход эту латентность честно заполняет полезной работой. Никаких откатов, никаких потерь.

Матрицы, векторы и нейросети

Особенно интересно это работает для AI и HPC-задач. Архитектура поддерживает матричные операции (GEMM блоки размером от 8×8 до 64×64) с детерминированным планированием. Согласно анализам, масштабируемость сравнима с Google TPU, но при этом требует намного меньше энергии и дешевле обходится.

Вот суть: в обычном CPU спекулятивное выполнение создаёт непредсказуемость. Производительность зависит от того, насколько удачно процессор угадывает. В детерминированном дизайне всё строго по расписанию — предсказуемо, стабильно, без неожиданностей.

Для программистов это означает — буквально — конец проблемы с производительностью, которая прыгает в зависимости от входных данных. Код, оптимизированный для одного набора данных, одинаково хорошо работает на другом.

RISC-V совместимость: не революция, а эволюция

Важный момент: это не замена RISC-V, а расширение его. Код пишется обычный, компилируется обычно, но выполняется по новым правилам. Полная совместимость с существующими инструментами — GCC, LLVM, FreeRTOS, Zephyr.

Программист не должен ничего переучивать. Всё как было — сборка, высокоуровневые языки, стандартный набор инструкций. Разница только в том, что инструкции выполняются предсказуемо, без микроархитектурных сюрпризов.

Что дальше? Смена эпохи

Индустрия находится на развилке. GPU и TPU доминируют в AI благодаря параллелизму, но требуют чудовищного потребления энергии. Обычные CPU с их спекуляцией отстают и ненадёжны. А вот детерминированный подход — он как раз для такого момента.

Конечно, вопрос остаётся: вытеснит ли это спекуляцию в мейнстриме? Может быть, может и не вытеснит. Но с выданными патентами, доказанной новизной и растущим давлением AI-нагрузок — момент подходящий. И если спекуляция была революцией в 1990-х, то детерминированное выполнение может стать следующей.

Может быть, мы стоим в начале нового десятилетия CPU-архитектуры. А может быть, просто свидетели одного из тех редких моментов, когда фундаментальный принцип микропроцессорной техники меняется вместе с тем, что от неё требует индустрия.

Материал подготовлен на основе статьи Thanh Minh Tran, основателя и CTO Simplex Micro.

Детерминированное выполнение, RISC-V, оптимизация AI-нагрузок — темы, которые будут определять развитие процессорной архитектуры в ближайшие годы. Не пропустите важные новости и технические разборы!🔔 Чтобы узнать больше о детерминированных архитектурах, RISC-V и будущем процессоров, а также следить за новостями мира AI, подписывайтесь на мой канал «ProAI» в Telegram!