20 подписчиков

ИИ нашёл дыры, которые «профессиональные сканеры» не видели годами

13 марта13 мар

2 мин

Есть такой привычный ритуал в мире разработки: запускаешь сканер безопасности, он находит что-то страшно звучащее, ты ставишь галочку «проверено» — и все довольны. Удобно, привычно, и иногда даже полезно. Проблема в том, что классические сканеры работают как рамка металлоискателя на входе: ищут то, что уже знают. Нож найдут. Керамический пистолет — нет. И не потому что плохо настроили. Просто так устроены. В феврале Anthropic, а через две недели OpenAI почти синхронно выпустили бесплатные инструменты, которые проверяют код иначе — не по шаблонам, а с попыткой понять логику. Что автор хотел сделать. Что реально произойдёт, если данные пойдут вот так. Разрыв в две недели выглядел как вежливое корпоративное «мы тоже умеем». Получилось довольно громко. Anthropic заявила: их модель обнаружила больше пятисот ранее неизвестных серьёзных уязвимостей в популярных открытых проектах — тех, которые годами проверяли профессиональные аудиторы. Один показательный пример: в популярной библиотеке для р

Оглавление

Две лаборатории за две недели
Что нашли — и почему это неудобный вопрос
Но красивым цифрам верить рано

Проблема в том, что классические сканеры работают как рамка металлоискателя на входе: ищут то, что уже знают. Нож найдут. Керамический пистолет — нет. И не потому что плохо настроили. Просто так устроены.

Две лаборатории за две недели

В феврале Anthropic, а через две недели OpenAI почти синхронно выпустили бесплатные инструменты, которые проверяют код иначе — не по шаблонам, а с попыткой понять логику. Что автор хотел сделать. Что реально произойдёт, если данные пойдут вот так.

Разрыв в две недели выглядел как вежливое корпоративное «мы тоже умеем». Получилось довольно громко.

Что нашли — и почему это неудобный вопрос

Anthropic заявила: их модель обнаружила больше пятисот ранее неизвестных серьёзных уязвимостей в популярных открытых проектах — тех, которые годами проверяли профессиональные аудиторы.

Один показательный пример: в популярной библиотеке для работы с изображениями ИИ нашёл ошибку в алгоритме сжатия — рассуждая о логике кода, а не сканируя по шаблону. Стандартные инструменты с полным покрытием тестами это не поймали.

И тут хочется неловко спросить: если даже при полном покрытии можно не зацепить целый класс ошибок — что мы вообще измеряли все эти годы?

OpenAI пошла дальше по масштабу: их инструмент прогнал больше миллиона версий кода в открытых репозиториях и нашёл уязвимости в нескольких крупных проектах, которыми пользуются сотни миллионов людей. Часть находок получила официальные номера угроз и ушла на исправление.

Но красивым цифрам верить рано

Независимые исследователи проверили инструмент Anthropic на реальных проектах — и картина получилась честнее. В одном случае из восьми найденных проблем реальными оказались две. Остальные — ложная тревога.

ИИ в роли ревьюера — штука вероятностная. Иногда гениальный аналитик. Иногда стажёр, который уверенно кивает и пишет в отчёт ерунду. Причём сам не всегда понимает разницу.

Ни один из инструментов пока не прошёл независимый аудит заявленных цифр. Так что «пятьсот уязвимостей» — скорее «похоже на правду», чем железобетонный факт.

Почему это важно даже если ты не пишешь код

Есть неприятная симметрия в этой истории. Если ИИ умеет находить такие дыры — значит, тот, кто хочет их использовать, тоже может попросить ИИ об этом. С теми же инструментами, с тем же API.

Окно между «нашли уязвимость» и «кто-то её использовал» становится короче. Это уже не абстрактная угроза из новостей про корпорации — это меняет скорость, с которой нужно реагировать всем, кто хранит данные или принимает платежи.

Что реально меняется

Раньше главный вопрос звучал так: как нам лучше находить уязвимости? Теперь вопрос другой: как успевать чинить то, что стало находиться в разы быстрее?

Классические платные сканеры, которые делали примерно то же самое по шаблонам — внезапно оказываются в неловкой позиции. Бесплатный инструмент от топ-лаборатории находит то, что они пропускали годами.

Получается знакомая картинка: инструменты стали умнее, а процессы вокруг них — пока нет. Как если бы тебе выдали профессиональный медицинский сканер, а очередь на приём к врачу всё равно три недели.