Найти в Дзене
Закреплено автором
RockAPI.ru
Как развернуть DeepSeek-R1 локально и совершенно бесплатно
1412 · 7 месяцев назад
DeepSeek открывает исходный код библиотеки универсального матричного умножения, 300 строк кода ускоряют V3, R1, R2, как сообщается, появится
Подходит для обычных моделей ИИ и MoE. Открытая неделя DeepSeek уже идет третий день (отчеты за первые два дня см. в "Связанном чтении" в конце). Сегодняшний проект с открытым исходным кодом называется DeepGEMM, это библиотека FP8 GEMM, поддерживающая плотные и экспертные смешанные (MoE) GEMM, которая обеспечивает поддержку обучения и вывода V3/R1, достигая вычислительной производительности 1350+ FP8 TFLOPS на GPU Hopper. Конкретно, DeepGEMM - это библиотека, направленная на реализацию лаконичного...
7 месяцев назад
Только что DeepSeek представил библиотеку коммуникации DeepEP для обучения и вывода MoE — это действительно открытый подход! #OpenSourceWeek
В прошлую пятницу DeepSeek объявил в Twitter, что эта неделя будет неделей открытого исходного кода (OpenSourceWeek), в рамках которой компания последовательно опубликует пять программных библиотек. Вчера они представили первую библиотеку — FlashMLA. Это эффективное ядро декодирования MLA для GPU Hopper, которое за 24 часа набрало почти 8 тысяч звезд (подробнее см. статью «Только что DeepSeek представил FlashMLA, ключевую технологию ускорения вывода, число звезд стремительно растет»). Сегодня DeepSeek...
7 месяцев назад
Первая в мире модель гибридного мышления: Claude 3.7 Sonnet выходит на сцену, превосходя всех конкурентов в реальном программировании
Вчера вечером информация о новой модели от Anthropic начала активно распространяться в AI-сообществе, однако речь шла не об ожидаемой Claude 4.0, а о версии 3.7 Sonnet. Источник изображения: https://x.com/btibor91/status/1893970824484581825 Сегодня рано утром новая флагманская модель Anthropic была представлена согласно плану. Официально выпущена самая интеллектуальная модель компании на сегодняшний день и первая в мире модель гибридного мышления — Claude 3.7 Sonnet. Claude 3.7 Sonnet может генерировать...
7 месяцев назад
DeepSeek открывает исходный код эффективного декодирующего ядра MLA: FlashMLA #OpenSourceWeek #Day1
Александр — сооснователь RockAPI, эксперт в области ИИ и разработки API. RockAPI предоставляет неограниченный доступ к передовым моделям ИИ, таким как DeepSeek, GPT-4o, Claude и Gemini, с простой интеграцией и гибкими способами оплаты. Зарегистрируйтесь на https://www.rockapi.ru/ и получите бесплатный стартовый кредит для новых пользователей — начните свое путешествие в мир ИИ уже сегодня! В прошлую пятницу DeepSeek объявил в Twitter, что эта неделя будет неделей открытого исходного кода (OpenSourceWeek), в течение которой компания последовательно откроет исходный код пяти библиотек...
7 месяцев назад
DeepSeek R1 vs OpenAI: Кто ВЫИГРАЛ битву ИИ? Шокирующие результаты 8 ключевых тестов!
После серии тестов — от творческого письма до сложных обучающих задач — комплексные возможности DeepSeek-R1 полностью могут конкурировать с платными «элитными» моделями OpenAI. Оказывается, при правильном подходе стратегия доступности тоже может покорить арену ИИ! Китайская компания DeepSeek запустила свою модель рассуждений R1 с открытыми весами, которая, по сообщениям, конкурирует с передовыми моделями o1 от OpenAI, несмотря на значительно меньшие затраты на обучение. Американские компании в...
7 месяцев назад
Как развернуть DeepSeek-R1 локально и совершенно бесплатно
В сегодняшней статье мы расскажем, как развернуть DeepSeek локально без каких-либо затрат. Но сначала давайте кратко рассмотрим, почему вообще стоит рассматривать локальное развертывание. DeepSeek-R1, хотя, возможно, уже не самая мощная модель рассуждений, но определенно остается одной из самых популярных моделей рассуждений. Поэтому, если вы используете официальный сайт или другие хостинговые сервисы, вы часто можете столкнуться со следующей неприятной ситуацией: Локальное развертывание модели может эффективно предотвратить такие ситуации...
1412 читали · 7 месяцев назад