Большинство современных моделей искусственного интеллекта, таких как LLM (Large Language Models), блестяще справляются с обработкой текста. Однако стоит поместить их в трехмерное пространство, и они начинают испытывать трудности. Это похоже на то, как если бы эти ИИ всю жизнь проводили за книгами и веб-сайтами, никогда не сталкиваясь с физическим миром.
Но что, если создать модель ИИ, которая будет мыслить как архитектор? То есть воспринимать мир не просто как набор слов, а как совокупность реальных объектов. Это открывает перспективы в таких областях, как проектирование зданий, оптимизация логистики или даже медицинская диагностика.
Эту идею развивает новый стартап World Labs, основанный Фе-Фей Ли, широко известной как «крестная мать ИИ». В недавнем раунде финансирования компания привлекла $230 млн. Интерес Ли к «пространственному интеллекту» начался еще в 2009 году, когда она создала ImageNet — крупнейшую базу данных изображений, ставшую основой для обучения первых нейронных сетей, способных распознавать визуальные объекты.
Сегодня же задача усложнилась: современные модели, которые используются, например, в роботах или автономных транспортных средствах, всё ещё не до конца понимают физическую структуру и динамику окружающего мира. Ли объясняет, что World Labs намерен исправить это упущение, сделав визуальные модели критически мыслящими в рамках пространства и времени.
Еще больше интересной и полезной информации на нашем телеграм канале: Ai Сознание
В планах стартапа — создание виртуальных миров, где ИИ сможет обучаться в максимально приближенных к реальности условиях. Поддерживаемая такими гигантами, как a16z и Nvidia, компания намерена выйти на более сложные проекты. Например, на создание роботов, способных самостоятельно выполнять различные задачи.
Обсуждение: Как вы думаете, сможет ли ИИ с «пространственным мышлением» кардинально изменить нашу жизнь и какие области будут наиболее выигрышными от таких технологий?