196 подписчиков

Нейросети - время идет, прогресс не очевиден.

14 октября14 окт

3 мин

Периодические мои попытки работы с нейросетями, по генерации программного кода или обработке картинок, навевают на грустные размышления. Время идет, все кричат, что нейросети захватят мир, вот-вот, еще чуть-чуть, пару-тройку лет..., НО! Как всегда есть большое "НО". Приведу пару примеров, которые показывают, что нейросети все еще глупы, даже на вроде бы простых задачах. То есть их еще надо дорабатывать и дорабатывать, чтобы результат их "творчества" соответствовал поставленной задаче, а не создавался просто ВАУ-эффект (когда результат слишком поражает своими эффектами, хоть и не соответствует заданию). Широко распиаренный мессенджер MAX, обзавелся GigaChat ботом еще несколько месяцев назад. Ах да, пару слов про МАХ, поставил его себе на комп, чтобы посмотреть, как он работает и какие возможности по созданию ботов имеет. И вот уже длительное время, на запрос создания бота, он мне отвечает: И тут у меня вопрос, к владельцам или создателям: функционал мессенджера зависит от статуса пользо

Приведу пару примеров, которые показывают, что нейросети все еще глупы, даже на вроде бы простых задачах. То есть их еще надо дорабатывать и дорабатывать, чтобы результат их "творчества" соответствовал поставленной задаче, а не создавался просто ВАУ-эффект (когда результат слишком поражает своими эффектами, хоть и не соответствует заданию).

Широко распиаренный мессенджер MAX, обзавелся GigaChat ботом еще несколько месяцев назад.

Ах да, пару слов про МАХ, поставил его себе на комп, чтобы посмотреть, как он работает и какие возможности по созданию ботов имеет.

И вот уже длительное время, на запрос создания бота, он мне отвечает:

И тут у меня вопрос, к владельцам или создателям: функционал мессенджера зависит от статуса пользователя? Есть определенные пользователи, которые имеют возможность создавать ботов, а об этом свидетельствует реклама, когда говорят определенные известные комментаторы, что их можно теперь читать на Махе. Им значит разрешили зарегистрировать бота, чтобы с его помощью создать канал, ну а мне предлагают "попробовать позже" ... и позже... и позже...

вопрос открытый, может кто-то знает причину такого разделения пользователей на своих, и каких-то других?

Но вернемся к нейросети. В некоторых ситуациях, при программировании, я обращаюcь к нейросетям, причем стараюсь давать им небольшие задачи. Если ответ одной сети меня не в полной мере устраивает, то обращаюсь к другой. И зачастую ответы нейросеток бывают очень разные, ответы по уровню отличаются. Ну, что-то вроде, одна сеть написала код как Джун, а вторая как Сеньор. Можно было бы списать это на некорректность промпта/запроса, но в том то и дело, что запрос одинаковый.

Ладно, посмотрим простой запрос на написание кода, к боту GigaChat:

А вот результат отображаемый в браузере, после загрузки кода на сервер:

Звезда? Ну, с натяжкой наверное 🤩.

Уточним задачу:

Бот написал, что задачу он понял верно, но вот результат:

А результат скорее всего уровня Джун, т.к. звезда не вписана в окружность, нижние углы вылезают за границы окружности. То есть, помимо двух итераций запроса, понадобится еще и вникать в код, вносить корректировки вручную, чтобы привести результат к требуемому.

Получается, что бот просто поставщик некоторого близкого решения, которое требуется дорабатывать под задачу. Раньше лазил за шаблонными решения на Stack Overflow, которые потом корректировал и адаптировал под себя, теперь эту функцию выполняет бот. На мой взгляд, ситуация ухудшилась, нет комментариев других разработчиков, их замечаний и других вариантов решений. Бот самоуверенно утверждает, что "код с идеально симметрично расположенной звездой", и ведь кто-то ему поверит 😲. Снова утверждается нереальная реальность!

И еще, совсем недавно в бот GigaChat пришло сообщение:

собщение бота о возможности рисовать картинки

Радость то какая, удобно наверное, все под рукой, в мессенджере то бишь.

У моего приятеля день рождения, и я решил его порадовать сгенерированной в боте картинкой. Сделал запрос и получил неплохую картинку:

Текст поздравления конечно вызвал некоторое недоумение (см. слова "бедь счастьи..."). Немного подумав, попросил бота заменить слова на придуманные мной. И вот тут начались чудесатые чудеса:

диалог с ботом, уточнение для картинки по тексту

Сначала бот отказался рисовать, то что его попросили. А затем выдал совершенно другую картинку с исковерканным текстом. Причем опять самоуверенно утверждая, что выдал то, что у него просили. 🤮

А вот и заключительная часть нашего диалога с ботом, после которой стала понятна вся его бестолковость:

заключительная часть диалога с ботом по картинке

Что могу сказать, после такого - теперь совсем по-другому смотрю на результаты творчества нейросетей демонстрируемые на различных Дзен-каналах. Авторы выкладывают красивые получившиеся картинки (а в последнее время и анимации), но это просто так получилось у нейросети и понравилось пользователю/автору. Так и природа может узоры рисовать, к примеру ледяные на окне, которые красивы сами по себе, но не имеют практического смысла:

картинка из свободных источников сети Интернет

Как только встает задача нарисовать что-то конкретное, так у нейросети сразу начинаются проблемы тупизны. И не факт, что за пару-тройку лет эту тупизну разработчики преодолеют, финансирование этого направления уже под вопросом.

Ну, а что с поздравительной картинкой моему приятелю? Конечно я ее поправил ручками в редакторе: