Найти в Дзене
131 подписчик

Microsoft представила Kosmos-1, мультимодальную модель искусственного интеллекта (ИИ), которая может анализировать изображения на предмет содержания, решать визуальные головоломки, выполнять визуальное распознавание текста, проходить визуальные тесты IQ и понимать инструкции на естественном языке


Исследователи считают, что мультимодальный ИИ, который объединяет различные способы ввода данных, такие как текст, аудио, изображения и видео, является ключевым шагом к созданию искусственного интеллекта общего назначения, способного выполнять задачи на уровне человека
Около минуты