Главным прорывом последних лет стали системы, способные одновременно понимать текст, изображение и звук. Выход GPT-4o и сопоставимых моделей Google Gemini показал, что единая архитектура может распознавать речь в реальном времени, описывать видео и писать код практически без задержки, а при этом работать быстрее и дешевле предыдущих версий. AlphaFold от DeepMind научился предсказывать пространственную структуру почти всех известных белков и сразу открыл публичную базу, что радикально ускорило биохимию. На основе этих данных стартап Isomorphic Labs уже переводит первые полностью сгенерированные ИИ-молекулы в клинические испытания, открывая дорогу лекарствам, созданным «с нуля» алгоритмами. От текстов и музыки технологии перешли к фотореалистичным изображениям и видео. Нативно мультимодальные модели создают иллюстрации, куда встроены перспективы, тени и физика материала, что раньше требовало профессионального дизайнера. Робомобили Waymo и других компаний прошли десятки миллионов миль бе
Достижения, ограничения и перспективы искуственного интеллекта
21 июля 202521 июл 2025
5
3 мин