Найти в Дзене
🚀 Alibaba сократила использование GPU на 82% с новой системой Aegaeon
🚀 Alibaba сократила использование GPU на 82% с новой системой Aegaeon 🤯 Alibaba представила Aegaeon - революционную систему пуллинга GPU, которая делает обслуживание LLM-моделей в облаке в восемь раз эффективнее. ⚙️ Результаты впечатляют: - Минус 82% использования Nvidia GPU при работе моделей. - В 3-месячной бете на Alibaba Cloud: с 1 192 до 213 H20 GPU при поддержке десятков моделей до 72B параметров. 🔥 Как это работает: Обычно GPU простаивают, обслуживая «холодные» модели (17.7% GPU выполняли лишь 1...
1 час назад
📄 DeepSeek-OCR - модель для распознавания текста
📄 DeepSeek-OCR - модель для распознавания текста 🔍 DeepSeek выпустили мощную OCR-модель, способную преобразовывать изображения документов прямо в Markdown или текст. Что умеет: - Распознаёт текст на изображениях и в PDF - Работает с документами, таблицами и сложными макетами - Поддерживает разные режимы: Tiny, Small, Base, Large - Оптимизирована под GPU (PyTorch + CUDA 11.8) - MIT-лицензия — можно свободно использовать и модифицировать DeepSeek-OCR достигает высокой точности и эффективности за счёт компрессии визуальных токенов...
1 час назад
Главные новости ии
Главные новости ии. ✔️ Андрей Карпаты: “ИИ лишит человечество возможности принимать решения” В новом интервью Андрей Карпаты рассказал, почему современные языковые модели не учатся как люди - и почему нас ждёт медленная, но неизбежная потеря контроля. Он считает, что обучение с подкреплением и это тупиковый путь: модели не думают, а просто копируют и повторяют. «Reinforcement learning ужасен. Просто всё, что было до него, ещё хуже.» Андрей отмечает, что люди учатся, создавая собственные данные - размышляя, связывая новое со старым, делая выводы. LLM этого не умеют, они просто запоминают. Главное, по его словам, впереди - не сингулярность, а тихое делегирование мышления алгоритмам...
2 дня назад
⚡️ Omni-Embed-Nemotron - новая единая модель от NVIDIA для поиска по тексту, изображениям, аудио и видео
⚡️ Omni-Embed-Nemotron - новая единая модель от NVIDIA для поиска по тексту, изображениям, аудио и видео Модель обучена на разнообразных мультимодальных данных и может объединять разные типы входных сигналов в общее векторное представление. - Поддержка всех типов данных: текст, изображение, аудио, видео. - Основана на архитектуре Qwen Omni (Thinker-модуль, без генерации текста). - Контекст - до 32 768 токенов, размер embedding — 2048. - Оптимизирована под GPU, поддерживает FlashAttention 2...
3 дня назад
🧬Gemma C2S-Scale 27B помогла учёным найти новый способ борьбы с раком
🧬Gemma C2S-Scale 27B помогла учёным найти новый способ борьбы с раком Исследователи из Google Research и Calico применили эту модель, чтобы анализировать активность генов в клетках и искать вещества, усиливающие иммунный отклик против опухолей. В чем сложность: многие опухоли остаются «холодными» - иммунная система их «не замечает». Чтобы обратить это, нужно вызвать экспрессию антигенов (antigen presentation), но делать это точно, только там, где уже есть слабый иммунный сигнал, но не всем клеткам подряд...
4 дня назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала