Microsoft представила новую ИИ-модель под названием Kosmos-1. Компания считает, что алгоритм, объединяющий различные режимы ввода, открывает путь для создания искусственного интеллекта, способного выполнять общие задачи на уровне человека. По словам разработчиков, Kosmos-1 может анализировать содержание изображений и делать подписи к ним, решать головоломки, выполнять визуальное распознавание текста, проходить тесты IQ (пока с точностью от 22 до 26%) и понимать инструкции на естественном языке. Этот проект Microsoft разработала без участия OpenAI. В его основе лежит отработка естественного языка LLM. Прежде чем ИИ-модель сможет прочитать изображение, исследователям необходимо перевести его в специальную серию токенов. Для обучения Kosmos-1 использовались данные интернета, включая выдержки из The Pile и Common Crawl. Разработчики оценили способности модели по нескольким тестам, включая понимание и генерацию языка, классификацию текста без оптического распознавания символов, создание суб