На связи Павел Михайлов, основатель агентства PMD.
Клиенты все чаще спрашивают: нужен ли им этот llms.txt – везде пишут, что без него теперь никуда. Неудобная правда: большинство ИИ-гигантов этот файл попросту игнорируют, и роста трафика от его появления не происходит. Но если бизнес – SaaS или B2B, ответ будет другим.
Наш Head of SEO Кирилл Кузнецов разобрал тему до основания: серверные логи, позиции игроков, статистика по 300 000+ доменам. Делюсь выжимкой.
Llms.txt – что это такое и как работает стандарт
Поисковый бот Google читает HTML без труда – натренирован на это десятки лет. ИИ-парсеры получают ту же страницу, но половина залеплена рекламными блоками, треть – навигацией, и где-то между ними – сам контент.
Для решения этой проблемы в сентябре 2024 года появился стандарт llms.txt. Это чистый Markdown-файл в корне сайта, который показывает ИИ структуру ресурса без шума. Только суть – что где лежит и что важно. Именно это влияет на то, попадет ли сайт в генеративный поиск или нет.
К маю 2026 года более 3,3 миллиона сайтов внедрили данный файл. Но здесь и возникает пропасть между энтузиазмом SEO-специалистов и реальной поддержкой со стороны ИИ-систем.
В чем разница между llms.txt и llms-full.txt
Два файла – две разные задачи, и путают их постоянно.
llms.txt – оглавление
Структура сайта и ключевые ссылки. ИИ-агент читает, понимает что где лежит, и при необходимости идет за деталями по конкретным URL. Карта города.
llms-full.txt – весь текст сайта в одном файле
Модель загружает его за один запрос и получает полную картину без переходов. Аудиогид, который все рассказал сразу.
Разница в применении:
- llms.txt – для крупных порталов и e-commerce, где выгружать все сразу нецелесообразно
- llms-full.txt – для технической документации, SaaS-продуктов и B2B-блогов, где важен целостный контекст
Кто из ИИ реально читает эти файлы
Кирилл проанализировал логи серверов и позиции всех ключевых игроков. Картина неоднозначная.
Anthropic (Claude) – единственный, кто поддерживает полностью
Краулеры Anthropic целенаправленно ищут и читают эти файлы, особенно при работе с технической документацией. Из всех крупных игроков именно Claude-агенты реально используют их при работе с контентом.
Google (Gemini) – официальный отказ
Джон Мюллер, глава команды Google Поиска по взаимодействию с веб-мастерами, сравнил llms.txt с мета-тегом keywords из девяностых. Аргумент Google: файл легко заспамить и скрыть в нем негативные данные. Парсинг HTML остается приоритетом, менять подход не планируют.
Яндекс (Алиса, YandexGPT) – молчаливое игнорирование
Официальной поддержки нет. Анализ трафика от alice.yandex.ru: наличие файла не влияет на попадание в ответы Алисы или YandexGPT. Классические алгоритмы, классический парсинг.
OpenAI (ChatGPT) – двойные стандарты
OpenAI сама разместила оба файла в документации для разработчиков. Но GPTBot и OAI-SearchBot на чужих сайтах их практически не ищут. ChatGPT прочитает llms.txt только если пользователь явно попросит, но автоматически нет.
Microsoft (Bing, Copilot) – скрытая ловушка
Bing официально не поддерживает стандарт. Но важный момент: ChatGPT при веб-поиске использует индекс Bing. Блокировка Bingbot = потеря видимости в ChatGPT, даже если GPTBot разрешен.
Все остальные – не сигнал ранжирования
Perplexity, Grok, Mistral, DeepSeek – исследование 300 000+ доменов не выявило корреляции между наличием llms.txt и частотой цитирования.
Однако Сбер официально признал стандарт на уровне корпоративной документации и добавил llms.txt и llms-full.txt в официальную документацию для разработчиков API GigaChat в октябре 2025.
Главная ошибка, из-за которой сайты пропадают из ответов ИИ
Пока все обсуждают llms.txt, многие компании режут себе видимость в нейросетях через неправильно настроенный robots.txt для ИИ-краулеров.
Два типа ботов, которые постоянно путают:
- Поисковые боты (OAI-SearchBot, PerplexityBot, Claude-SearchBot) – формируют ответы со ссылками на источник. Блокировать нельзя – сайт исчезает из ответов ИИ и перестает цитироваться.
- Обучающие боты (GPTBot, ClaudeBot, Google-Extended) – собирают данные для тренировки моделей. Можно закрыть, чтобы снизить нагрузку на сервер.
Путаница между ними стоит компаниям присутствия в ответах ИИ – владельцы не понимают, почему сайт не попадает в рекомендации нейросетей.
Кому внедрять прямо сейчас, а кому подождать
- Внедрять обязательно – SaaS, B2B-порталы, техническая документация. Для этих сегментов GEO оптимизация под агентные сценарии начинается именно с llms.txt и llms-full.txt. Claude-агенты реально используют эти файлы уже сегодня.
- Можно не торопиться – информационные сайты, интернет-магазины, новостные ресурсы. Прямого влияния на трафик пока нет, данные это подтверждают.
Создать файл стоит дешево и делается один раз. В PMD Agency мы внедряем его клиентам заблаговременно, чтобы когда OpenAI или Google включат рубильник, сайты были готовы.
Три шага, которые стоит сделать прямо сейчас:
- Проверить robots.txt – нет ли случайно заблокированных поисковых ИИ-ботов и Bingbot.
- Добавить JSON-LD разметку – ее понимают все системы без исключения.
- SaaS и B2B – внедрить оба файла уже сегодня.
Коротко, что в итоге
llms.txt не вернет трафик чудом – Google и Яндекс его не поддерживают, OpenAI не использует автоматически. Но для SaaS и B2B это уже рабочий инструмент: Claude его читает, а цена ошибки низкая.
Внедрить файл стоит один раз, потом можно забыть. Главная опасность сейчас – не llms.txt, а заблокированные поисковые ИИ-боты в robots.txt. Проверьте это и будете видны нейросетям, даже если стандарт не взлетит.
Полную версию исследования Кирилла с рекомендациями по настройке robots.txt читайте в Блоге PMD Agency.
Обнял 🤝