Нейросети читают ваш сайт – но понимают через раз. Файл llms.txt это меняет (или нет?)

2 дня назад2 дня назад

4 мин

На связи Павел Михайлов, основатель агентства PMD. Клиенты все чаще спрашивают: нужен ли им этот llms.txt – везде пишут, что без него теперь никуда. Неудобная правда: большинство ИИ-гигантов этот файл попросту игнорируют, и роста трафика от его появления не происходит. Но если бизнес – SaaS или B2B, ответ будет другим. Наш Head of SEO Кирилл Кузнецов разобрал тему до основания: серверные логи, позиции игроков, статистика по 300 000+ доменам. Делюсь выжимкой. Поисковый бот Google читает HTML без труда – натренирован на это десятки лет. ИИ-парсеры получают ту же страницу, но половина залеплена рекламными блоками, треть – навигацией, и где-то между ними – сам контент. Для решения этой проблемы в сентябре 2024 года появился стандарт llms.txt. Это чистый Markdown-файл в корне сайта, который показывает ИИ структуру ресурса без шума. Только суть – что где лежит и что важно. Именно это влияет на то, попадет ли сайт в генеративный поиск или нет. К маю 2026 года более 3,3 миллиона сайтов внедрил

Оглавление

Llms.txt – что это такое и как работает стандарт
В чем разница между llms.txt и llms-full.txt
llms.txt – оглавление

На связи Павел Михайлов, основатель агентства PMD.

Клиенты все чаще спрашивают: нужен ли им этот llms.txt – везде пишут, что без него теперь никуда. Неудобная правда: большинство ИИ-гигантов этот файл попросту игнорируют, и роста трафика от его появления не происходит. Но если бизнес – SaaS или B2B, ответ будет другим.

Наш Head of SEO Кирилл Кузнецов разобрал тему до основания: серверные логи, позиции игроков, статистика по 300 000+ доменам. Делюсь выжимкой.

Llms.txt – что это такое и как работает стандарт

Поисковый бот Google читает HTML без труда – натренирован на это десятки лет. ИИ-парсеры получают ту же страницу, но половина залеплена рекламными блоками, треть – навигацией, и где-то между ними – сам контент.

Для решения этой проблемы в сентябре 2024 года появился стандарт llms.txt. Это чистый Markdown-файл в корне сайта, который показывает ИИ структуру ресурса без шума. Только суть – что где лежит и что важно. Именно это влияет на то, попадет ли сайт в генеративный поиск или нет.

К маю 2026 года более 3,3 миллиона сайтов внедрили данный файл. Но здесь и возникает пропасть между энтузиазмом SEO-специалистов и реальной поддержкой со стороны ИИ-систем.

В чем разница между llms.txt и llms-full.txt

Два файла – две разные задачи, и путают их постоянно.

llms.txt – оглавление

Структура сайта и ключевые ссылки. ИИ-агент читает, понимает что где лежит, и при необходимости идет за деталями по конкретным URL. Карта города.

llms-full.txt – весь текст сайта в одном файле

Модель загружает его за один запрос и получает полную картину без переходов. Аудиогид, который все рассказал сразу.

Разница в применении:

llms.txt – для крупных порталов и e-commerce, где выгружать все сразу нецелесообразно
llms-full.txt – для технической документации, SaaS-продуктов и B2B-блогов, где важен целостный контекст

Кто из ИИ реально читает эти файлы

Кирилл проанализировал логи серверов и позиции всех ключевых игроков. Картина неоднозначная.

Anthropic (Claude) – единственный, кто поддерживает полностью

Краулеры Anthropic целенаправленно ищут и читают эти файлы, особенно при работе с технической документацией. Из всех крупных игроков именно Claude-агенты реально используют их при работе с контентом.

Google (Gemini) – официальный отказ

Джон Мюллер, глава команды Google Поиска по взаимодействию с веб-мастерами, сравнил llms.txt с мета-тегом keywords из девяностых. Аргумент Google: файл легко заспамить и скрыть в нем негативные данные. Парсинг HTML остается приоритетом, менять подход не планируют.

Яндекс (Алиса, YandexGPT) – молчаливое игнорирование

Официальной поддержки нет. Анализ трафика от alice.yandex.ru: наличие файла не влияет на попадание в ответы Алисы или YandexGPT. Классические алгоритмы, классический парсинг.

OpenAI (ChatGPT) – двойные стандарты

OpenAI сама разместила оба файла в документации для разработчиков. Но GPTBot и OAI-SearchBot на чужих сайтах их практически не ищут. ChatGPT прочитает llms.txt только если пользователь явно попросит, но автоматически нет.

Microsoft (Bing, Copilot) – скрытая ловушка

Bing официально не поддерживает стандарт. Но важный момент: ChatGPT при веб-поиске использует индекс Bing. Блокировка Bingbot = потеря видимости в ChatGPT, даже если GPTBot разрешен.

Все остальные – не сигнал ранжирования

Perplexity, Grok, Mistral, DeepSeek – исследование 300 000+ доменов не выявило корреляции между наличием llms.txt и частотой цитирования.

Однако Сбер официально признал стандарт на уровне корпоративной документации и добавил llms.txt и llms-full.txt в официальную документацию для разработчиков API GigaChat в октябре 2025.

Главная ошибка, из-за которой сайты пропадают из ответов ИИ

Пока все обсуждают llms.txt, многие компании режут себе видимость в нейросетях через неправильно настроенный robots.txt для ИИ-краулеров.

Два типа ботов, которые постоянно путают:

Поисковые боты (OAI-SearchBot, PerplexityBot, Claude-SearchBot) – формируют ответы со ссылками на источник. Блокировать нельзя – сайт исчезает из ответов ИИ и перестает цитироваться.
Обучающие боты (GPTBot, ClaudeBot, Google-Extended) – собирают данные для тренировки моделей. Можно закрыть, чтобы снизить нагрузку на сервер.

Путаница между ними стоит компаниям присутствия в ответах ИИ – владельцы не понимают, почему сайт не попадает в рекомендации нейросетей.

Кому внедрять прямо сейчас, а кому подождать

Внедрять обязательно – SaaS, B2B-порталы, техническая документация. Для этих сегментов GEO оптимизация под агентные сценарии начинается именно с llms.txt и llms-full.txt. Claude-агенты реально используют эти файлы уже сегодня.
Можно не торопиться – информационные сайты, интернет-магазины, новостные ресурсы. Прямого влияния на трафик пока нет, данные это подтверждают.

Создать файл стоит дешево и делается один раз. В PMD Agency мы внедряем его клиентам заблаговременно, чтобы когда OpenAI или Google включат рубильник, сайты были готовы.

Три шага, которые стоит сделать прямо сейчас:

Проверить robots.txt – нет ли случайно заблокированных поисковых ИИ-ботов и Bingbot.
Добавить JSON-LD разметку – ее понимают все системы без исключения.
SaaS и B2B – внедрить оба файла уже сегодня.

Коротко, что в итоге

llms.txt не вернет трафик чудом – Google и Яндекс его не поддерживают, OpenAI не использует автоматически. Но для SaaS и B2B это уже рабочий инструмент: Claude его читает, а цена ошибки низкая.

Внедрить файл стоит один раз, потом можно забыть. Главная опасность сейчас – не llms.txt, а заблокированные поисковые ИИ-боты в robots.txt. Проверьте это и будете видны нейросетям, даже если стандарт не взлетит.

Полную версию исследования Кирилла с рекомендациями по настройке robots.txt читайте в Блоге PMD Agency.

Обнял 🤝