3 подписчика
OpenAI выпустит новоый веб-краулера для усовершенствования технологии ИИ
Компания OpenAI анонсировала веб-краулера GPTBot для расширения своей базы данных, которая будет использоваться для обучения следующего поколения систем ИИ. Отмечается, что компания зарегистрировала торговую марку "GPT-5". Пользователи получат информацию о том, как исключить свой контент из обширной базы данных компании.
Веб-краулер будет собирать общедоступную информацию с сайтов, аналогично другим поисковым системам, таким как Google, Bing и Yandex, GPTBot по умолчанию будет считать доступную информацию свободной для использования. Чтобы запретить веб-краулеру OpenAI загружать контент с сайта, его владелец должен добавить правило "disallow" в стандартный файл на сервере. Однако некоторые специалисты в области этики технологий отмечают, что такой подход вносит вопросы касательно согласия на использование данных.
Релиз GPTBot последовал после критики, что OpenAI заимствовал данные без разрешения для обучения таких моделей, как ChatGPT. Чтобы устранить такие опасения, компания обновила свою политику конфиденциальности в апреле.
Тем временем поданный запрос на регистрацию товарной марки GPT-5 косвенно подтверждает, что OpenAI готовит новую модель для будущего запуска.
Однако, существует открытая альтернатива LLM от социального медиа-гиганта Meta, который предоставляет свою модель бесплатно при определенных условиях и позволяет пользователям настроить модель с использованием собственных наборов данных.
Цель OpenAI состоит в создании прибыльной экосистемы вокруг своих инструментов ИИ, в то время как Meta стремится построить бизнес вокруг владения данными и партнерских сделок.
Веб-краулер OpenAI, возможно, улучшит способности его моделей, однако вместе с этим возникают этические вопросы, касающиеся авторских прав и согласия на использование данных. Будет сложно сбалансировать между транспарентностью, этикой и возможностями усовершенствования ИИ.
1 минута
13 августа 2023