Иногда в мире технологий появляется идея, которая на первый взгляд кажется неочевидной: «взять действительно нетривиальную задачу и свести её к обычному ранжированию документов». Именно об этом рассуждает автор блога noperator, предлагая свежий взгляд на некоторые сложные проблемы в области ИБ (информационной безопасности) и тестирования. Ранжирование документов — классическая задача в сфере информационного поиска (IR - Information Retrieval). Мы пытаемся упорядочить набор «документов» по релевантности к «запросу». Веб-поисковики именно так работают с нашими поисковыми запросами, сортируя миллионы страниц. Но если вместо веб-страниц взять патч-диффы (Patch diffs) - кусочки кода с изменениями), а «запросом» сделать описание уязвимости — оказывается, что LLM (Large Language Model) вполне может прикинуться «поисковиком» и показывать, где конкретно спрятано решение проблемы. Автор доказывает, что: Это означает, что вместо глубокой экспертизы в бинарных файлах, дизассемблировании и анализе
Когда «сложная проблема» превращается в задачу ранжирования документов
26 февраля 202526 фев 2025
3
4 мин