Инженер Бьорн Карманн (Bjørn Karmann) из Нидерландов разработал прототип камеры, которой не нужен объектив для съемки!
Paragraphica — это камера, преобразующая контекст в изображение, которая использует данные о местоположении и искусственный интеллект для визуализации «фотографии» определенного места и момента. Камера существует как в виде физического прототипа, так и в виде виртуальной камеры, которую вы можете попробовать, скачав приложение.
В видоискателе в реальном времени отображается описание вашего текущего местоположения, и при нажатии на кнопку камера создаст сцинтиграфическое представление описания.
На камере есть три физических диска, которые позволяют вам управлять данными и параметрами ИИ, чтобы влиять на изображение, аналогично тому, как работает традиционная камера.
Камера работает, собирая данные о своем местоположении с помощью открытых API. Используя адрес, погоду, время суток и близлежащие места. Собрав все эти точки данных, Paragraphica составляет абзац, в котором подробно описывается текущее место и момент.
Используя искусственный интеллект для преобразования текста в изображение, камера преобразует абзац в «фотографию».
Полученная «фотография» — это не просто снимок, а сложное и детализированное отражение местоположения, в котором вы находитесь, и, возможно, того, как модель ИИ «видит» это место.
Крот-звездонос, живущий и охотящийся под землей, считает свет бесполезным. Следовательно, он эволюционировал, чтобы воспринимать мир через свои пальцеобразные антенны, что дает ему необычный и разумный способ «видения».
Это удивительное животное стало идеальной метафорой и источником вдохновения для понимания того, как сочувствие другим разумным существам и то, как они воспринимают мир, почти невозможно представить с человеческой точки зрения.
Поскольку языковые модели ИИ становятся все более осознанными, у нас тоже будет ограниченное представление о том, как они будут видеть мир.
Камера предлагает способ познания окружающего мира, который не ограничивается только визуальным восприятием. Благодаря данным о местоположении и синтезу изображений с помощью искусственного интеллекта Paragraphica обеспечивает более глубокое понимание сути момента с точки зрения других интеллектов.
Первый диск ведет себя аналогично фокусному расстоянию оптического объектива, но вместо этого управляет радиусом (в метрах) области, в которой камера ищет места и данные. Второй циферблат сравним с зернистостью пленки, поскольку значение от 0,1 до 1 создает начальный шум для процесса рассеивания изображения AI.
Третий диск управляет шкалой наведения. Увеличение руководства заставляет ИИ более внимательно следить за абзацем. По аналогии с традиционной камерой, чем выше значение, тем «четче», а чем ниже, тем «размытое» фото, таким образом представляя фокус.
Выше приведен снимок экрана из Noodl , который я использовал для создания веб-приложения, которое обменивается данными между камерой и несколькими API-интерфейсами для создания запроса на основе местоположения и самого изображения, — говорит создатель камеры Бьорн Карманн.
Аппаратное обеспечение:
Raspberry Pi 4, 15-дюймовый сенсорный экран, напечатанный на 3D-принтере корпус, нестандартная электроника
Программное обеспечение:
Noodl, код pyhton, Stable Diffusion API
Бьорн Карманн (@BjoernKarmann) 30 мая 2023 г.