124 подписчика

Нейросети научились переводить мысли в картинки

6 марта 20236 мар 2023

1 мин

Группа японских исследователей из Осаки использовала нейросеть Stable Diffusion для создания изображений с помощью МРТ-сканирования при вводе данных. Полученные результаты просто рвут шаблоны.

Исследовательская группа представила испытуемым набор изображений и провела фМРТ (функциональную магнитно-резонансную томографию) сканирование мозга испытуемых, пока они концентрировались на изображении.

Конечное изображение представляет собой кульминацию множества частей, включая уже существовавший вывод изображений фМРТ и семантический декодер.

Однако добавление Stable Diffusion, как видно на фото, делает генерируемые изображения более соответствующими исходным.

Крайнее левое изображение - исходный источник, а крайнее правое - результат работы нейросети Stable Diffusion, семантического декодера и формирования изображений фМРТ. Колонка z представляет «латентный вектор», полученный из визуализации, а c - «кондиционирующий вход», полученный из текста.

Несмотря на то, что статья еще не прошла рецензирование, в ней уже есть некоторые дыры. По крайней мере, один человек указал на то, что использование семантического декодирования делает основную работу. Они также подразумевают, что использование текста в качестве части подсказки подрывает подлинность конечного результата.

Семантическое декодирование существует по крайней мере с 2016 года. Поэтому остается открытым вопрос подлинности данного «открытия». Вполне возможно, это продолжение развития давно известных технологий.

Подробности:

Источник 1, Источник 2