Найти в Дзене
Sputnik Казахстан

"Яндекс" настолько популярен в Казахстане, что нейросеть YandexGPT "заговорит" на казахском

Большинство пользователей "Яндекс" – говорящие на казахском языке, уверяют в компании. В "Яндексе" рассказали о планах внедрить свою нейросеть во все сервисы. Так, компания планирует внедрять свою нейросеть во все сервисы, где есть текст. Уже сейчас YandexGPT есть в "Яндекс Маркете", "Авто.ру", "Картах" и "Практикуме", рассказал РИА Новости директор по развитию технологий искусственного интеллекта "Яндекса" Александр Крайнов. "Самый простой (и наверняка правильный) ответ – нейросеть YandexGPT будет использоваться везде. Уже сейчас она используется в "Маркете", в "Авто.ру", в "Картах", в "Практикуме" и других сервисах. Там, где есть хоть какой текст – там рано или поздно найдется полезное применение больших языковых моделей", - сказал Крайнов. Компания постоянно совершенствует нейросеть, и ее обучение происходит в два этапа, рассказал эксперт. Сначала языковая модель получает знания через большой датасет, а потом ее "дообучают" на "датасете идеальных примеров". "На этих примерах модель
Логотип компании "Яндекс", архивное фото
Логотип компании "Яндекс", архивное фото

Большинство пользователей "Яндекс" – говорящие на казахском языке, уверяют в компании.

В "Яндексе" рассказали о планах внедрить свою нейросеть во все сервисы. Так, компания планирует внедрять свою нейросеть во все сервисы, где есть текст.

Уже сейчас YandexGPT есть в "Яндекс Маркете", "Авто.ру", "Картах" и "Практикуме", рассказал РИА Новости директор по развитию технологий искусственного интеллекта "Яндекса" Александр Крайнов.

"Самый простой (и наверняка правильный) ответ – нейросеть YandexGPT будет использоваться везде. Уже сейчас она используется в "Маркете", в "Авто.ру", в "Картах", в "Практикуме" и других сервисах. Там, где есть хоть какой текст – там рано или поздно найдется полезное применение больших языковых моделей", - сказал Крайнов.

Компания постоянно совершенствует нейросеть, и ее обучение происходит в два этапа, рассказал эксперт. Сначала языковая модель получает знания через большой датасет, а потом ее "дообучают" на "датасете идеальных примеров".

"На этих примерах модель "понимает", что от нее требуется, когда пользователь отправляет текстовый запрос. Для второго этапа тексты должны быть идеальны: полезны, информативны, этичны, понятны", - добавил Крайнов.

Для того, чтобы обучить универсальную нейросеть, специалистам нужны разнообразные данные, в том числе энциклопедии, различные тесты и экзамены, инструкции, форумы – то есть все, где есть полезный информационный сигнал.

А обучать нейросеть различным языкам, в числе которых редкие и локальные, – это необходимо для задач перевода, поиска информации и ответов на другом языке.

"Пока мы отдаем предпочтение тем языкам, на которых говорит большинство наших пользователей. Например, уже идет активная работа над обучением нейросети YandexGPT на казахском языке", - отметил Крайнов.