948 подписчиков
ИИ сингулярность приближается, не успеваю новости постить. ☄️
Google выкатили модель с гигантским контекстным окном на 1 млн (❗️) токенов.
Модель скромно назвали "Large World Model".
Large World Model имеет 2 варианта: обычный и мультимодальный, то есть кроме текста она принимает и изображения и видео. В основе лежит дообученная Llama-2 7B.
Из особенностей, о которых говорят разработчики:
- LWM может ответить на вопросы о видео на YouTube продолжительностью более 1 часа.
- LWM обеспечивает высокую точность в контекстном окне 1M и превосходит GPT-4V и Gemini Pro.
- LWM генерирует изображения на основе текстовых подсказок в режиме авторегрессии.
- LWM генерирует видео на основе текстовых подсказок в авторегрессионном режиме.
- LWM может ответить на вопросы об изображениях.
Для желающих запустить и протестировать модель у себя локально, основная модель, а также ее вариации на 32, 128, 256 и 512 тысяч токенов доступны на HuggingFace
П.С. Я начинаю беспокоиться за Google 😂
Около минуты
19 февраля