Когда инженеры говорят о поиске по коду, большинство представляет себе что-то на уровне grep -R или встроенный поиск IDE. Но в мире, где репозитории легко достигают миллионов строк, а компания имеет тысячи Git-проектов, эти инструменты становятся узким горлышком. И здесь появляется Zoekt — минималистичный, но очень инженерный проект от Sourcegraph, который делает одну вещь исключительно хорошо: очень быстрый поиск по исходному коду. Его архитектура показывает удивительную вещь: правильно выбранный базовый алгоритм способен конкурировать с куда более «навороченными» ML-решениями там, где важна скорость и предсказуемость, а не семантика. 🔍 Почему обычный поиск по коду не справляется Наивный поиск по тексту работает плохо в двух типичных ситуациях: 💥 когда кодовая база огромная (монорепы, петабайты истории, множество веток); 🧩 когда совпадения требуют строгой структурности (символы, регулярки, логические запросы). И дело тут не только в скорости. Классические инструменты: не умеют эфф
Zoekt: триграммный ускоритель по коду и почему старый добрый поиск внезапно стал высокотехнологичным
5 декабря 20255 дек 2025
1
3 мин