Технические требования

Экспорт данных для размещения заголовков и аннотаций новостей на сервисе осуществляется в XML-based формате RSS 2.0. Кодировка указывается в экспортном файле.

Для лучшего понимания вы можете ознакомиться с примером экспортного файла.

Механизм экспорта данных

Чтобы передавать информацию о новостных сообщениях, разместите RSS-файл на сервере вашего сайта и обновляйте его с необходимой периодичностью (например, файл может пополняться в течение дня и перезаписываться утром). Робот скачивает файл от двух до пяти минут.

Ограничение

Файл должен быть доступен по протоколу HTTP или HTTPS. Экспортный файл, который не удалось полностью загрузить за 10 секунд, считается недоступным. Размер файла не должен превышать 10 МБ.

Чтобы робот Дзена (Yandex или YandexNews) проиндексировал данные, откройте для него (или, по крайней мере, не закрывайте) доступ к RSS-файлу и страницам сайта, ссылки на которые в файле передаются. Прописывать отдельно доступ к каждой странице сайта не нужно. Достаточно, чтобы доступ к разделу с этими страницами либо к URL с определенным паттерном не был запрещен.

Вы также можете задать параметры индексирования данных, указав поддерживаемые роботом Дзена директивы в файле robots.txt.

User-agent: YandexNews
Allow: путь до экспортного файла без имени хоста (например,/file.rss) 
... 
#последняя строка должна быть пустой

Проверить корректность добавления строк можно в Яндекс Вебмастере.

Если вы используете в robots.txt директиву Crawl-delay, укажите ее для робота YandexNews отдельно.

User-agent: YandexNews 
Allow: /file.rss Crawl-delay: 0.1 ...
#последняя строка должна быть пустой 

Описание элементов RSS 2.0

Корневым элементом RSS-файла является rss, атрибут version которого должен иметь значение 2.0.

<rss 
  xmlns:yandex="http://news.yandex.ru" 
  xmlns:media="http://search.yahoo.com/mrss/" 
  version="2.0"> 
  ... 
</rss>

Внутри элемента rss содержится элемент channel, который включает информацию об источнике и его содержание.

Элементы, из которых состоит экспортный файл, подробно описаны ниже.

Информация о сайте-источнике

Сведения передаются в элементе channel. Обязательные элементы отмечены значком .

Элемент

Описание

title

Название RSS-канала.

Если экспортируется содержание целого сайта, укажите название сайта.

<title>Российские новости</title>

Если экспортируются раздел сайта, укажите название сайта и раздела через двоеточие.

<title>Российские новости: технологии</title>

Примечание

На главной странице название RSS-канала не показывается, экспортируемые данные маркируются тем названием источника, которое было указано в анкете при подключении к сервису Новости в Дзене.

link

Домен сайта, данные которого транслируются.

<link>http://www.example.com</link>

description

Описание канала одним предложением. Не используйте HTML-разметку.

<description>Ежедневная газета</description>

language

Язык статьи по стандарту ISO 639-1.

<language>ru</language>

item

Информация о странице и ее содержимом.

Каждый item описывает только одно новостное сообщение. В channel может содержаться любое количество элементов item.

Для передачи новостных сообщений в item указываются следующие обязательные элементы:

  • title  — заголовок сообщения;

  • link  — URL сообщения;

  • pubDate  — время публикации сообщения на сайте источника;

  • yandex:full-text  — полный текст сообщения.

<item>
  <title>Заголовок сообщения</title>
  <link>http://www.example.com/page.html</link>
  <pubDate>Sun, 29 Sep 2023 19:59:01 +0300</pubDate>
  <yandex:full-text>Полный текст сообщения</yandex:full-text>
</item>

Информация о сообщении

Данные передаются в элементе item. Обязательные элементы отмечены значком .

Элемент

Описание

title

Заголовок сообщения.

<title>Яндекс ищет на сайте Минприроды</title>

Элемент title должен содержать актуальный вариант заголовка сообщения, такого же, как на странице с новостью на сайте.

Максимальная длина заголовка — 200 символов. Но чтобы заголовки имели возможность возглавить сюжет, они должны быть не более 80 символов с учётом пробелов.

Запрещено:

  • передавать заголовок сообщения, написанный полностью прописными буквами;

  • ставить точку в конце заголовка;

  • указывать в заголовке название источника, дату или время сообщения;

  • включать в заголовок служебные примечания (например, «обновлено», «дополнено», «фоторепортаж», «видео») и неинформативные обороты, которые не являются неотъемлемой частью заголовка (например, «Срочно!» или «Сенсация»).

link

URL страницы-источника.

<link>http://www.example.com/page1.html</link>

Требования:

  • Ссылка должна содержать схему HTTP или HTTPS.

  • Домен, указанный в ссылке, должен соответствовать домену сайта-источника.

  • Максимальная длина URL — 243 ASCII-символа.

  • По одному URL должна быть доступна одна статья.

  • URL не должны повторяться или различаться только адресом после символа # или !#. Например, http://www.some-host.ru/news.html#2545 и http://www.some-host.ru/news.html#5794. Такие ссылки считаются идентичными и не допускаются к передаче внутри одного элемента item.

  • При переходе с заголовка, размещенного в Новостях в Дзене, должна открываться страница, содержащая только одно сообщение, соответствующее заголовку. При этом заголовок и начало текста должны быть видны на первом экране при разрешении:

    • 1024 × 768 на компьютере;

    • 360 × 640 на мобильном устройстве.

pubDate

Время публикации сообщения на сайте источника. Передается в формате RFC-822.

<pubDate>Tue, 21 Apr 2023 14:15:00 +0300</pubDate> 
<!-- Значение «+0300» определяет часовой пояс. 
Запись означает, что новость датирована 21 апреля 2023 г., 
14:15 московского времени. -->

Время, указанное в экспортном файле, должно совпадать с фактическим временем публикации на сайте. Актуальными считаются сообщения за последние 8 дней. Остальные проиндексированы не будут.

author

Автор сообщения.

<author>Иван Петров</author>

yandex:full-text

Текст новости.

Элемент yandex:full-text должен содержать полный актуальный текст новости. Он используется для индексирования поисковым роботом, на главной странице текст не размещается. Если текст новости на сайте был изменен после публикации, его необходимо обновить и в yandex:full-text.

<yandex:full-text>полный текст новости</yandex:full-text>

В элементе yandex:full-text запрещено передавать:

  • название источника;

  • автора статьи;

  • автора фото;

  • подписи к фото;

  • ссылки на социальные сети;

  • данные для блока «Читайте также»;

  • дату или время сообщения;

  • контактную информацию;

  • ссылки на изображения и видеофайлы (для этих ссылок нужно формировать отдельные теги enclosure, media:group).

pdalink

Ссылка на версию сообщения, адаптированную для мобильных устройств.

Чтобы в Новостях в Дзене была доступна мобильная версия сообщения, передайте в элементе pdalink ссылку на соответствующее сообщение в мобильной версии сайта источника.

<pdalink>http://www.m.rossiyskie-novosti.ru/page.html</pdalink>

amplink

Ссылка на AMP-версию сообщения.

Ссылки на страницы в формате AMP, если они присутствуют в вашем экспортном файле, будут использоваться в версии Новостей в Дзене для устройств с тачскрином вместо ссылок на обыкновенные мобильные и адаптивные страницы.

Чтобы передавать AMP-версии новостей, укажите в элементе amplink ссылку на AMP-версию страницы с соответствующим сообщением.

<amplink>http://amp.vesti.ru/doc.html?id=27</amplink>

description

Краткое описание сообщения (аннотация, лид).

Продукт Яndex.Site установлен на сайте Минприроды
</description> ``` |

category

Рубрика (раздел, категория).

Указывается оригинальное (как в издании) название рубрики, в которой опубликовано сообщение. Одному сообщению может соответствовать только одна рубрика.

<category>Технологии</category>

Внимание

Об изменении рубрикации издания или о добавлении в экспортный файл материалов новых рубрик необходимо сообщать по адресу info-news@dzen.ru. Иначе сообщения, относящиеся к ранее не существовавшим или переименованным рубрикам издания, проиндексированы не будут.

enclosure

Иллюстрации, аудио и видеофайлы.

В одном элементе указывается ссылка на одну иллюстрацию, аудио или видеофайл. Если в сообщении содержится несколько иллюстраций, или иллюстрация и видеофайл, используйте несколько элементов enclosure.

Требования к иллюстрациям:

  • Ширина не менее 400 пикселей, длина не менее 800 пикселей. Иллюстрации меньшего размера не индексируются. Если есть несколько вариантов одной иллюстрации, отличающихся размером, в enclosure должен быть указан URL изображения наибольшего размера.

  • Иллюстрации должны быть разрешены к индексированию в файле robots.txt.

Для изображений параметр type должен совпадать с тем, что отдается по указанному URL. Значение url обязательно. Значение type крайне рекомендуемо, а если невозможно определить тип контента по расширению файла, то обязательно.

<enclosure
  url="http://www.rossiyskie-novosti.ru/01.jpg"
  type="image/jpeg"/> 

media:group

Группа связанных медиаобъектов.

Можно указать любое количество элементов media:group. Вложенные группы не допускаются. Атрибутов у элемента нет.

Элемент media:group применяется в следующих случаях:

  • Для объединения двух видео, отличающихся форматами. Различные по содержанию видео объединять не рекомендуется.

  • Для объединения плеера и тумбнейла. Ширина тумбнейла должна быть не меньше 400 пикселей, длина — не меньше 800 пикселей. Видео, сопровождающееся тумбнейлом размером менее 800 х 400 пикселей, проиндексировано не будет.

  • Для группировки видео и аудио, если аудиофайл является звуковой дорожкой к видео.

  • Для более качественного индексирования видеофайлов, сопровождающих сообщение, вместе с элементом enclosure или вместо него.

В media:group могут быть следующие вложенные элементы:

  • Один или несколько элементов media:content, в одном из которых может быть проставлен атрибут isDefault.

  • Только один элемент media:player. Если в группе содержится media:player, вместо прямой ссылки на файл укажите ссылку на плеер.

  • Один или несколько элементов media:thumbnail, их следует указывать в порядке убывания приоритета.

Внимание

Элемент media:group обязательно должен содержать media:thumbnail, а также хотя бы один элемент media:content либо media:player. Использовать все три элемента не требуется.

<media:group>
  <media:content
    url="ссылка на видеофайл в формате .mp4 на вашем сайте"/> 
  <media:player
    type="video/mp4"/>
  <media:thumbnail
    url="ссылка на иллюстрацию, которая должна быть 
    использована в качестве preview"/>
</media:group>

yandex:theme_tags

Признак сообщения, относящегося к теме на сайте партнера.

В качестве значения должен быть указан произвольный идентификатор события, продублированный в JSON-файле с темами.

<yandex:theme_tags>story-301</yandex:theme_tags>

Официальный комментарий

Данные передаются в элементе item.

Элемент

Описание

yandex:official-comment

Официальный комментарий.

Разметку официального комментария необходимо сделать в основном экспортном файле для Новостей в Дзене.

Длина комментария не должна быть больше 300 знаков с пробелами, можно использовать сокращения вида ... или <...>, не нужно оформлять комментарий как прямую речь или брать в кавычки.

Текст комментария обязательно должен присутствовать на вашем сайте в новости.

  • yandex:comment-text — разместите внутри тега текст опровержения без разметки, только plain text.

    • Обязательный атрибут:

      origin — текст цитаты на официальном сайте (обязательный атрибут для государственных органов).

      Чтобы комментарий попал в сюжет, на официальном сайте государственного органа или компании должен быть размещен дословный текст.

    • Допустимые атрибуты:

      • origin-name — автор цитаты (например, Роскомнадзор);

      • logo — логотип компании источника цитаты, минимальные размеры: 128 x 128 пикселей (необязательный атрибут);

      • anchor — «якорь» для случаев, когда комментарий размещается внутри новости.

        Пример
        anchor="pressrelease"
        для ссылки https://ura.news/news/1052446942?pressrelease=1#pressrelease)
        
  • yandex:bind-to — указывает на новость, к которой предоставлен комментарий. Если новость опубликовало несколько СМИ, нужно поставить ссылку на свою новость, содержащую полный текст официального комментария, и на новости других СМИ из раздела «Эта новость в СМИ» в этом же сюжете (при этом необходимо удалить все UTM-метки). По этим ссылкам мы сможем показать официальный комментарий в нужном сюжете.

<yandex:official-comment>
  <yandex:comment-text
    origin="https://www.gov.spb.ru/press/disproof/21/"
    origin-name="Администрация Санкт-Петербурга"
    logo="https://www.gov.spb.ru/static/_g/img/logo/53.b84ea0fc65af.png"
    anchor="comment">
    Более 4,4 тысяч медиков уже получили выплаты из городского бюджета.
    Передачу документов на получение федеральных страховых выплат ускорят
    по поручению губернатора Олега Эргашева.
  </yandex:comment-text>
  <yandex:bind-to>
  http://www.sobaka.ru/city/city/113469
  </yandex:bind-to>
  <yandex:bind-to>
  https://www.fontanka.ru/2020/08/O6/694072O3/
  </yandex:bind-to>
  <yandex:bind-to>
  https://topspb.tv/news/2021/02/16/peterburg-stoit-v-vosmiballnyh-probkah/
  </yandex:bind-to>
  <yandex:bind-to>
  https://spb.aif.ru/society/na_dorogah_peterburga_anomalnye_probki
  </yandex:bind-to>
</yandex:official-comment>

Видео в сюжетах

Чтобы показывать видео в сюжетах, добавьте ссылки на видеоролики в формате mp4 в экспортный файл для Новостей в Дзене. Если у вас нет возможности передавать ссылки на mp4-файлы, видео можно загрузить на ваш канал в Дзене и указать в экспортном файле ссылки на плеер с загруженными роликами.

См. требования к содержанию видео.

Разместите ссылки на видео к новостям в вашем экспортном файле для Новостей в Дзене, указав их в элементах media:content внутри элемента media:group. Ссылки должны вести на видеофайлы в формате mp4, а не на страницы с ними и не на плеер. Если в ссылке нет явно указанного расширения файла, используйте атрибут type и пропишите тип файла в нем.

<media:group> 
  <media:content 
    url="ссылка на видеофайл в формате .mp4" 
    type="video/mp4"/> 
  <media:thumbnail 
    url="ссылка на иллюстрацию для preview не менее 800 × 400 пикселей"/> 
</media:group> 
  1. Создайте канал в Дзене.

  2. Загрузите видео на канал. Убедитесь, что видео загружено.

  3. Используйте код вставки вида https://dzen.ru/embed в теге media:player внутри элементов media:group.

  <media:group>
    <media:player
      url="ссылка вида https://dzen.ru/embed.....">
    </media:player>
    <media:thumbnail
      url="ссылка на иллюстрацию для preview не менее 800 × 400 пикселей">
    </media:thumbnail>
  </media:group>

Символы и кодировки

В экспортном файле укажите кодировку, отдаваемую вашим сервером. Наиболее часто используются: UTF-8, Windows-1251, KOI8-R.

Во всех элементах channel и item необходимо кодировать следующие символы:

Символ Название Код замены
& Амперсанд &amp;
> Правая угловая скобка &gt;
< Левая угловая скобка &lt;
" Знак кавычек &quot;
' Апостроф &apos;

Например, ссылка http://some.host.ru/?id=1&page=10 должна быть приведена к виду http://some.host.ru/?id=1&amp;page=10.

Если RSS-файл передается в KOI8-R, необходимо также заменить встречающиеся в тексте символы кодировки Windows-1251 на аналоги из KOI8-R:

Символ Название Код замены
... Многоточие 133
Короткое тире (en-dash) 150
Длинное тире (em-dash) 151
' ' «Сглаженные» апострофы 145 и 146
" " «Сглаженные» кавычки — «лапки» 147 и 148
«» Кавычки «ёлочки» 171 и 187
Номер 185

Пример экспортного файла

<?xml version="1.0" encoding="windows-1251"?> 
  <rss 
    xmlns:yandex="http://news.yandex.ru" 
    xmlns:media="http://search.yahoo.com/mrss/" 
    version="2.0">
    <channel> 
      <title>Российские новости</title>
      <link>http://www.rossiyskie-novosti.ru/</link> 
      <description>Ежедневная московская газета</description> 
      <item> 
        <title>Яндекс ищет на сайте Минприроды</title>
        <link>http://www.rossiyskie-novosti.ru/2023/03/25/yandex.html</link>
        <pdalink>http://www.m.rossiyskie-novosti.ru/2023/03/25/yandex.html</pdalink>
        <description>Яндекс.Site установлен на сайте Минприроды</description> 
        <author>Иван Петров</author> 
        <category>Технологии</category> 
        <enclosure 
          url="http://www.rossiyskie-novosti.ru/2023/03/25/yandex.jpg" 
          type="_images/jpeg"/> 
        <media:group>
          <media:content 
            url="ссылка на видеофайл в формате .mp4 на вашем сайте" 
            type="video/mp4"/>
          <media:thumbnail 
            url="ссылка на иллюстрацию для preview не менее 800 × 400 пикселей"/>
        </media:group> 
        <pubDate>Sun, 29 Sep 2023 19:59:01 +0300</pubDate>
        <yandex:full-text>
          Для поиска по сайту www.mnr.gov.ru выбрана программа Яндекс.Site. 
          Этот программный продукт был исследован провайдером 
          сайта Минприроды — Федеральным агентством правительственной связи и
          информации. ФАПСИ сочло возможным использование поисковой системы 
          &lt;Яндекса&gt; на www.mnr.gov.ru. По результатам исследования 
          программа была скомпилирована, протестирована и установлена на сайт.
        </yandex:full-text> 
      </item> 
    </channel> 
  </rss>
Написать в службу поддержки