Вчера я опять баловалась с нейросетями. И в процессе моего баловства, мне пришла интересная ассоциация с героиней Милы Йовович из фильма Люка Бессона "Пятый элемент". Там тоже Лилу поглощала информацию из всемирной паутины очень быстро, но пока не смогла прочувствовать на себе, что же прекрасного есть в людях, не хотела защищать человечество.
А началось вчерашнее моё баловство с простого человеческого интереса - "Скоро ли нейросети избавятся он своих галлюцинаций?" Ведь мы уже привыкли к их проблемам непонимания человеческой физиологии, не знания истории и много с чем другим.
Могу сказать однозначно, что чат-боты уже научились писать более-менее правдоподобные тексты и почти никогда не ошибаются, хоть иногда и не отвечают на поставленный вопрос.
А что же с графикой и видео? Тут дело обстоит ещё хуже.
Вчера вечером, ведя диалог в мессенджере, я захотела отправить собеседнику нейросетевую картинку - фото мамонта с человеком. Диалог не важен. Важны изображения, которые мне предоставила нейросеть leonardo ai. Промт: «photo of a man with a mammoth» (фотография человека с мамонтом). Подумав, иностранная нейросеть выдала мне четыре картинки, на трёх из которых мамонт был в тропическом лесу вместе с человеком. Хотя «средняя климатическая ниша» мамонта характеризуется температурой самого холодного месяца –30,3°C, температура самого теплого месяца +14,5°C. А на четвёртом снимке, где всё же лежит лёд, у мамонта оказалось почему-то снова пять конечностей. Про лицо человека промолчу лучше.
Ладно, с палеонтологией и зоологией не заладилось у нас. Решила я посмотреть, как обстоят дела хотя бы с фольклором в виде сказок и мультфильмов. Естественно, в промтах я не стала писать таких героев как Чебурашка, Баба-Яга, Кот Матроскин и т.п. Решила узнать, как видит эта нейросеть ёжика в тумане с лошадью (классика нашей мультипликации в повсеместном доступе). Промт: «Ежик в тумане и лошадь». Вот вам результат:
Но, вообще-то, миленькая такая Лож (симбиоз лошади и ежа), но что с ней делать?
Я решила создавать запросы, которые должны быть понятны любой нейросети, даже изъясняющейся на английском. И решила сравнить иностранную нейросеть Leonardo ai и нашу российскую Кандинский 3.1. Результатом с удовольствием поделюсь в галереях. Сначала изображения в них от иностранной нейросети, потом от российской. Для правдивости своих слов, российскую нейросеть я сохраняла скрином вместе с промтом. Итак.
Промт: «Три поросёнка и серый волк».
Умилила меня версия импортной нейросети о нежной любви волков и свиней. И снова, довольно симпатичное существо "свинолк". Но что же с российской то нейросетью? Где волк? Может его съел поросёнок, который подмигивает? Недаром у него что-то торчит из пасти. Страшные свиньи в России! Гордимся.
Думаете куда меня понесла фантазия? Правильно. Промт: «Волк и семеро козлят».
Ух, какой брутальный мужчина среди двух "козлолков", двух волков с тремя ушами и одного самого маленького волчонка. И опять, нежная дружба волков с козликами. Не хотите мужчину - вот вам девушка. И опять, с одним волком из её окружения проблемы. Волк-кентавр какой-то, то ли сидит, то ли стоит. Но опять российская нейросеть побила рекорд. И у волка, и у козлика явно наблюдаются проблемы с психикой, как то раздвоение личности.
Ладно. Со сказками не заладилось. А как насчёт просто детской литературы?Промт: «Незнайка на Луне».
Ладно, Незнайка по их мнению - это некто (человек-невидимка). Но почему на Луну падают по версии обеих нейросетей другие Луны? Лично мне не понятно. Опять вспомнила кинофильм с Брюсом Уиллисом "Армагеддон", где он спасает Землю от астероида. Здесь, по мнению нейросети, срочно нужна момощь нашему спутнику.
Галлюцинировать нейросети могут не только в изображениях, но и в видео.
Ну а теперь немного о том, когда же это может прекратиться?
Одной из актуальных проблем современных нейросетей так и остаются их "галлюцинации", то есть информация, не соответствующая действительности, которую нейросети генерируют наряду с правдивыми данными. «Даже самые современные модели склонны к ложным выводам — они склонны изобретать факты в моменты неопределённости. Эти галлюцинации особенно критичны в областях, требующих многоступенчатого рассуждения, поскольку одной логической ошибки достаточно, чтобы весь результат оказался неверным», — пишут исследователи OpenAI в отчёте.
Компания OpenAI сообщила в 2023 году о разработке нового метода обучения моделей искусственного интеллекта, который поможет минимизировать количество таких "галлюцинаций".
Суть нового подхода заключалась в изменении системы мотивации для ИИ. Вместо того чтобы вознаграждать нейросеть только за правильный финальный ответ, предполагалось награждать её за каждый корректный шаг в рассуждениях. Это, по мнению разработчиков, позволит улучшить точность нейросети и повысить качество проверки фактов.
Исследователи считают, что распознавание и устранение логических ошибок модели, или "галлюцинаций", представляет собой ключевой этап на пути к созданию согласованного искусственного интеллекта общего назначения (AGI), — отметил математик компании OpenAI Карл Коббе.
При этом проблема пока далека от решения, а специалисты говорят, что компания пока не открыла всю информацию по этому исследованию. Таким образом, проблема «галлюцинаций» ИИ пока остаётся актуальной.
Вывод: нейросеть ещё не хочет спасать человечество, как Лилу, и не является "пятым элементом". Она ещё пока как мамонтёнок, который ищёт маму, но может быть найдёт. Не так уж всё бывает и плохо.
Если вам понравилась статья, то ставьте лайк. Подписывайтесь на канал. Всего вам доброго и безопасного.