614,2K подписчиков

Российские разработчики создали AI-детектор GigaCheck для определения текстов, написанных нейросетью

На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices представили GigaCheck — детектор для определения авторства русскоязычных текстов. Решение предоставляется по API и встраивается в любые сторонние приложения.

GigaCheck позволяет с высокой точностью устанавливать, кем был написан текст — человеком или ИИ. За последний месяц с помощью детекторы специалисты выявили 6% из 220 000 статей на новостных ресурсах, которые были написаны генеративными нейросетями.

На данный момент точность работы GigaCheck составляет 94,7%. Показатель ближайшего конкурента — не более 85%. Так что на сегодняшний день российский инструмент — самый достоверный детектор подобного рода.

Сейчас GigaCheck дает обобщенную оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время детектор научится определять, какие именно фрагменты текста были сгенерированы LLM.

Работу детектора текстов оценят эксперты, занимающиеся проверкой подлинности научных публикаций, диссертаций и дипломов. Владельцы пабликов в соцсетях с помощью детектора смогут быстро обнаруживать созданные генеративными моделями комментарии и посты. Редакторы и все, принимающие работу копирайтеров, также получат эффективный инструмент для ее проверки и оценки.

«До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую. Для разработки такого сервиса требуются серьезные ресурсы и большие объемы данных. Но даже неограниченных ресурсов может оказаться недостаточно. Например, компания OpenAI, один из признанных лидеров в области разработки систем искусственного интеллекта, в начале 2023 года анонсировала свой детектор для англоязычных текстов, но со временем была вынуждена закрыть доступ к нему из-за невысокой точности. Тем важнее достижение нашей команды, которой, несмотря на все сложности, удалось разработать собственную эффективную технологию», - отмечает Сергей Марков, управляющий директор Управления экспериментальных систем машинного обучения SberDevices.

Сейчас протестировать возможности разработки можно в свободном доступе на сайте и через бота в Telegram. Для коммерческого использования бизнес может оставить заявку, чтобы получить доступ к детектору.

Технологии

Больше по теме