Google DeepMind выпустил D4RT — модель компьютерного зрения, которая превращает обычное видео в полную 4D-картину мира. Система не просто видит, что происходит на экране, а понимает пространственную структуру сцены и отслеживает движение каждого объекта во времени. Даже если он скрылся за углом три секунды назад. Вычисляет сразу3️⃣вещи: 3D-облако точек, траектории движения и позицию камеры. Без отдельных алгоритмов для каждой задачи. Зачем это нужно? 🚖Автопилоты смогут лучше предсказывать траекторию пешеходов 🤖 Роботы станут реже врезаться в движущиеся предметы 🎥Режиссеры смогут автоматически превращать архивные съемки в 3D-модели для спецэффектов 😉: На сайте проекта результаты можно покрутить прямо в браузере. 🐈⬛Приобрести пакеты в нашем Магазине ✨Присоединиться к сообществу
🫢Что остается за кадром? Свежее исследование от Google
24 января24 янв
~1 мин