Найти тему
948 подписчиков

ИИ сингулярность приближается, не успеваю новости постить. ☄️


Google выкатили модель с гигантским контекстным окном на 1 млн (❗️) токенов.

Но эта новость меркнет на фоне выхода open-source модели с таким же контекстным окном.‼️

Модель скромно назвали "Large World Model".

Large World Model имеет 2 варианта: обычный и мультимодальный, то есть кроме текста она принимает и изображения и видео. В основе лежит дообученная Llama-2 7B.

Из особенностей, о которых говорят разработчики:

- LWM может ответить на вопросы о видео на YouTube продолжительностью более 1 часа.

- LWM обеспечивает высокую точность в контекстном окне 1M и превосходит GPT-4V и Gemini Pro.

- LWM генерирует изображения на основе текстовых подсказок в режиме авторегрессии.

- LWM генерирует видео на основе текстовых подсказок в авторегрессионном режиме.

- LWM может ответить на вопросы об изображениях.

Для желающих запустить и протестировать модель у себя локально, основная модель, а также ее вариации на 32, 128, 256 и 512 тысяч токенов доступны на HuggingFace

П.С. Я начинаю беспокоиться за Google 😂


ИИ сингулярность приближается, не успеваю новости постить. ☄️  Google выкатили модель с гигантским контекстным окном на 1 млн (❗️) токенов.
Около минуты