Компания Microsoft представила Kosmos-1 — особую ИИ-модель, которая может анализировать содержание изображений, решать головоломки, проходить визуальные тесты на IQ и даже понимать команды на разговорном языке. По мнению специалистов, создание ИИ-системы, способной работать в текстовом, аудио- и графическом режиме (включая видеоматериалы) является ключевым шагом на пути формирования так называемого «общего искусственного интеллекта». Такому ИИ предстоит заниматься решением задач самого широкого профиля. Принципы работы Kosmos-1 описаны в статье Language Is Not All You Need: Aligning Perception with Language Models. В данном материале исследователи детально описывают, как новая ИИ-система от Microsoft анализирует изображения, отвечает на любые вопросы о них, распознаёт и читает текст с любых картинок, проходит визуальный тест на IQ и подписывает иллюстрации. Создание «общего искусственного интеллекта» примечательно тем, что (в теории) позволяет полностью заменить людей при выполнении лю
Microsoft представила ИИ-модель Kosmos-1, умеющую анализировать содержание картинок, решать головоломки и проходить тест на IQ
2 марта 20232 мар 2023
10
2 мин