Найти тему
Gemma3, новая опенсорсная модель от Google, уже доступна в Ollama
Модель Gemma 3 мультимодальная, то есть может обрабатывать текст и изображения, и имеет окно контекста размером 128 тысяч токенов с поддержкой более 140 языков. В Ollama она доступна в четырех вариантах с 1, 4, 12 и 27 миллиардами параметров и превосходно справляется с такими задачами, как ответы на вопросы, резюмирование и логическое мышление, в то время как их компактный дизайн позволяет развертывание на устройствах с ограниченными ресурсами...
5 дней назад
Мощная рассуждающая языковая модель с открытым исходным кодом QwQ-32B теперь доступна в Ollama.
Это среднеразмерная модель с 32.5 миллиардами параметров из серии Qwen разработана для выполнения сложных задач и демонстрирует конкурентоспособное качество по сравнению с другими reasoning моделями, такими как DeepSeek-R1. QwQ-32B обладает точностью ответах, в некоторых тестах достигающей 90%, что на 21% выше, чем в тестах Llama 70B. При этом модель вдвое меньше Llama 70B и в 20 раз меньше DeepSeek R1 при сравнимой производительности. Это делает QwQ-32B...
1 неделю назад
Новая уязвимость EntrySign в процессорах AMD
Исследователи Google обнаружили серьёзную уязвимость в процессорах AMD с архитектурой Zen 1 до Zen 4. Проблема позволяет пользователям с правами администратора изменять микрокод, что может привести к изменениям в работе процессора...
1 неделю назад
Что нового в OpenWebUI версий 0.5.x
Еще в прошлом году, 25 декабря, OpenWebUI обновился до версии 0.5.0, и один из лучших интерфейсов для работы с моделями в Ollama начал новый этап своей жизни. Давайте рассмотрим, что нового появилось за 1.5 месяца от релиза и что теперь он предлагает в версии 0.5.12. AI-платформа: предустановленные языковые LLM-модели на высокопроизводительных серверах с GPU-картами Арендуйте высокопроизводительный сервер с GPU картой с предустановленными лучшими LLM-моделями: DeepSeek-r1-14b, Gemma-2-27b-it, Llama-3...
1 месяц назад
Четыре Radeon RX 7900, нейросеть и настольная игра
Языковые нейросетевые модели как только не тестировали: от решения олимпиадных задач до создания шедевров мировой литературы. У нас же родилась идея протестировать их на более прикладном уровне. А именно, сможет ли нейросеть играть по правилам в настольную игру, которая сложнее, чем крестики-нолики, и заодно посмотреть, как поведет себя в работе с LLM связка из четырех видеокарт Radeon RX 7900 XTX с 24 гигабайтами видеопамяти. У нас в HOSTKEY есть GPU серверы на основе решений от NVIDIA на любой вкус: от VPS на 1080 до выделенных серверов с H100 или нескольких RTX 4090...
1 месяц назад
Президент Дональд Трамп представил амбициозный проект Stargate с 500 миллиардов долларов финансирования
Президент США Дональд Трамп объявил о запуске проекта «Stargate», масштабной инициативы, направленной на вывод США в лидеры разработки искусственного интеллекта (AI). Объявив об обязательствах профинансировать его не менее чем на $500 миллиардов, Трамп обещает, что этот проект реорганизует американскую экономику и принесет глобальные экономические выгоды. Первоначальный этап Stargate будет включать немедленное предоставление $100 миллиардов для начала строительства инфраструктуры под него в Техасе с потенциалом для расширения по всей стране...
1 месяц назад
Grafana Labs опубликовала обзор самых ярких примеров использования Grafana сообществом в 2024 году
Grafana Labs опубликовала обзор самых ярких примеров использования Grafana сообществом в 2024 году. Вот некоторые из них: 1. Оптимизация поездок на работу: SRE-инженер создал дашборд с использованием Grafana Cloud и Prometheus для планирования маршрута на работу, интегрируя данные о погоде, трафике и расписании общественного транспорта. Это позволило ему находить оптимальные способы передвижения каждое утро...
1 месяц назад
Огромные скидки на выделенные серверы с процессорами AMD EPYC
Воспользуйтесь скидкой до 47% на мощные выделенные серверы с одним или двумя процессорами AMD EPYC, в том числе на модели 7451, 7551, 7702, 7542 и 7742. Благодаря поддержке до 128 ядер эти серверы обеспечивают высочайшую производительность и подходят для самых ресурсоемких задач. Например сервер 2xEPYC 7451 48...
1 месяц назад
Qualcomm переманила разработчика Xeon у Intel
Qualcomm назначила Сайлеша Коттапалли, бывшего члена команды по разработке серверных процессоров в Intel, старшим вице-президентом для руководства своими усилиями в области ЦОД. У Коттапалли за плечами 28 лет работы в Intel, в том числе работа над процессорами Xeon и проектами на основе x86 и Itanium. Его назначение происходит на фоне подготовки...
1 месяц назад
На CES 2025 SK hynix представила SDD объемом 122 Тб
На выставке CES 2025 компания SK hynix представила набор передовых решений памяти (high bandwidth memory, HBM)) и хранения с акцентом на ускорение обработки AI. SK hynix продемонстрировала образцы 16-слойного HBM3E, разработанного с использованием процессов MR-MUF для улучшения теплоотвода и снижения деформации чипов. Модули...
2 месяца назад
В Ollama появилась новая модель Phi-4
Phi-4 — новая открытая модель, разработанная Microsoft и уже доступная в Ollama. Эта модель предназначена для улучшения исследований в области моделирования языка, а также может служить основой для AI-решений. Модель содержит 14 миллиардов параметров и при своих размерах сравнима по тестам с моделями с гораздо большим числом параметров. Для ее запуска без GPU Offload необходимо 16+ Гб видеопамяти...
2 месяца назад
Больше аптайма и меньше даунтайма!
2 месяца назад