Октябрь 1994 года. Профессор математики Томас Найсли из колледжа Линчберг сидит за своим новеньким Pentium и считает простые числа. Он гоняет на машине сложнейшие расчёты уже несколько месяцев, но в последние дни что-то идёт не так. Результаты расходятся с эталонными. Найсли перепроверяет код — ошибки нет. Меняет компьютер — ошибка исчезает. Он сужает круг подозреваемых до процессора и 30 октября публикует в интернете короткое сообщение: «Похоже, Pentium ошибается при делении».
Это сообщение запустит цепную реакцию. Через месяц о баге напишут все крупные СМИ. Ещё через месяц Intel объявит о замене миллионов бракованных процессоров и спишет $475 миллионов. А индустрия навсегда усвоит урок: нельзя игнорировать пользователей, даже если ты — крупнейший производитель чипов в мире.
Математик, который не поверил своему процессору
Томас Найсли не был журналистом или конкурентом Intel. Он был скромным профессором, который занимался чистой математикой — искал простые числа. Его программа работала на Pentium и стабильно выдавала неверный результат. Проверив всё, что можно, он добрался до процессора.
Проблема была в блоке операций с плавающей точкой. Из 1066 строк кода, отвечавших за деление, пять содержали ошибку. При определённых комбинациях чисел процессор округлял результат не в ту сторону. Погрешность была крошечной — около 0,006%. Но для научных расчётов, банковских транзакций и инженерных симуляций этого хватало, чтобы результат стал неверным. Ошибка проявлялась не всегда, а только при специфических комбинациях чисел. Именно поэтому она не была обнаружена при тестировании.
Что именно пошло не так:
- 🔢 Таблица поиска. Процессор использовал предвычисленную таблицу для ускорения деления. Пять ячеек из 1066 были заполнены неверно из-за ошибки в скрипте, который генерировал эту таблицу.
- 👥 Человеческий фактор. Инженер, отвечавший за перенос таблицы в «кремний», попросту пропустил эти пять значений. Автоматической проверки целостности таблицы не было.
- 🧪 Тестирование. Intel тестировала процессор на стандартных задачах, которые не затрагивали проблемные ячейки. Специфические вычисления, которые делал Найсли, в тесты не попали.
Простыми словами:
Представьте калькулятор, в котором клавиша «5» иногда выдаёт «6». Вы складываете 2+2 — получается 4. Всё хорошо. Но когда вы считаете что-то сложное, результаты начинают врать. Вы вините себя, пока кто-то не замечает, что проблема в калькуляторе. Intel была уверена, что её калькулятор идеален. Математик Найсли доказал обратное.
Как Intel пыталась замять скандал — и сделала только хуже
Когда новость о баге разлетелась по интернету, Intel отреагировала самым неудачным из возможных способов. Вместо того чтобы признать ошибку и предложить замену, компания начала утверждать, что проблема несущественна. Пресс-релиз гласил: «Ошибка возникает настолько редко, что обычный пользователь столкнётся с ней раз в 27 000 лет».
Пользователи, особенно учёные и инженеры, были в ярости. «Я столкнулся с ней вчера!» — писал один из них в Usenet. CNN, The New York Times, Wall Street Journal подхватили историю. Журналисты обвиняли Intel в высокомерии и неуважении к покупателям. Компания, которая десятилетиями строила репутацию на надёжности, внезапно стала символом корпоративной лжи.
Ситуация обострилась, когда IBM объявила о приостановке продаж компьютеров с Pentium. Это был удар ниже пояса. Затем потребительские группы начали требовать бесплатной замены, а крупные корпоративные клиенты — возврата денег. К декабрю Intel оказалась в центре самого громкого скандала в истории полупроводниковой индустрии.
Случай из жизни:
Один из инженеров Intel позже вспоминал, как гендиректор Энди Гроув собрал руководство и сказал: «Мы облажались. Мы вели себя как бюрократы. А теперь мы должны вести себя как инженеры — признать ошибку и исправить её». Через два дня Intel объявила о полной замене всех бракованных процессоров. Счёт составил $475 миллионов — на тот момент крупнейший отзыв продукции в истории IT.
Урок, который спас Intel
Скандал с Pentium FDIV стал поворотным моментом. Intel извлекла из него три ключевых урока. Во-первых, прозрачность важнее гордости. Признать ошибку и заменить продукт — даже ценой огромных убытков — лучше, чем потерять доверие. Во-вторых, тестирование должно быть полным, а не выборочным. После этого случая Intel пересмотрела все процедуры верификации чипов. В-третьих, интернет изменил правила игры. Один математик с доступом в сеть может запустить скандал, который разрушит репутацию гиганта. Intel одной из первых корпораций усвоила этот урок.
Репутация компании в итоге не только восстановилась, но и укрепилась. Покупатели увидели, что Intel способна признавать ошибки и платить за них. А фраза «Intel Inside» продолжила появляться на миллионах компьютеров по всему миру.
Читайте также в «Синдроме Утёнка | IT»:
Процессор Intel Itanium: как лучшие умы создали архитектуру, которую никто не хотел
Кризис доткомов: как 1,5 триллиона долларов испарились за два года
Коротко:
Скандал с Pentium FDIV — это история о том, как ошибка в пяти строчках кода чуть не разрушила репутацию крупнейшей IT-компании мира. Математик-одиночка, Usenet и корпоративная гордыня — три ингредиента, которые обошлись Intel почти в полмиллиарда долларов. Но именно этот кризис научил компанию честности. И в итоге укрепил её позиции.В следующий раз, когда ваш компьютер выдаст странный результат, не спешите винить себя. Возможно, вы нашли новый баг в процессоре.
Понравился выпуск? Подписывайся на «Синдром Утёнка | IT» — тут мы препарируем великие провалы и рассказываем, как ошибки становились уроками.