Найти в Дзене
DeepSeek открывает исходный код библиотеки универсального матричного умножения, 300 строк кода ускоряют V3, R1, R2, как сообщается, появится
Подходит для обычных моделей ИИ и MoE. Открытая неделя DeepSeek уже идет третий день (отчеты за первые два дня см. в "Связанном чтении" в конце). Сегодняшний проект с открытым исходным кодом называется DeepGEMM, это библиотека FP8 GEMM, поддерживающая плотные и экспертные смешанные (MoE) GEMM, которая обеспечивает поддержку обучения и вывода V3/R1, достигая вычислительной производительности 1350+ FP8 TFLOPS на GPU Hopper. Конкретно, DeepGEMM - это библиотека, направленная на реализацию лаконичного...
7 месяцев назад
Только что DeepSeek представил библиотеку коммуникации DeepEP для обучения и вывода MoE — это действительно открытый подход! #OpenSourceWeek
В прошлую пятницу DeepSeek объявил в Twitter, что эта неделя будет неделей открытого исходного кода (OpenSourceWeek), в рамках которой компания последовательно опубликует пять программных библиотек. Вчера они представили первую библиотеку — FlashMLA. Это эффективное ядро декодирования MLA для GPU Hopper, которое за 24 часа набрало почти 8 тысяч звезд (подробнее см. статью «Только что DeepSeek представил FlashMLA, ключевую технологию ускорения вывода, число звезд стремительно растет»). Сегодня DeepSeek...
7 месяцев назад
Первая в мире модель гибридного мышления: Claude 3.7 Sonnet выходит на сцену, превосходя всех конкурентов в реальном программировании
Вчера вечером информация о новой модели от Anthropic начала активно распространяться в AI-сообществе, однако речь шла не об ожидаемой Claude 4.0, а о версии 3.7 Sonnet. Источник изображения: https://x.com/btibor91/status/1893970824484581825 Сегодня рано утром новая флагманская модель Anthropic была представлена согласно плану. Официально выпущена самая интеллектуальная модель компании на сегодняшний день и первая в мире модель гибридного мышления — Claude 3.7 Sonnet. Claude 3.7 Sonnet может генерировать...
7 месяцев назад
DeepSeek открывает исходный код эффективного декодирующего ядра MLA: FlashMLA #OpenSourceWeek #Day1
Александр — сооснователь RockAPI, эксперт в области ИИ и разработки API. RockAPI предоставляет неограниченный доступ к передовым моделям ИИ, таким как DeepSeek, GPT-4o, Claude и Gemini, с простой интеграцией и гибкими способами оплаты. Зарегистрируйтесь на https://www.rockapi.ru/ и получите бесплатный стартовый кредит для новых пользователей — начните свое путешествие в мир ИИ уже сегодня! В прошлую пятницу DeepSeek объявил в Twitter, что эта неделя будет неделей открытого исходного кода (OpenSourceWeek), в течение которой компания последовательно откроет исходный код пяти библиотек...
7 месяцев назад
DeepSeek R1 vs OpenAI: Кто ВЫИГРАЛ битву ИИ? Шокирующие результаты 8 ключевых тестов!
После серии тестов — от творческого письма до сложных обучающих задач — комплексные возможности DeepSeek-R1 полностью могут конкурировать с платными «элитными» моделями OpenAI. Оказывается, при правильном подходе стратегия доступности тоже может покорить арену ИИ! Китайская компания DeepSeek запустила свою модель рассуждений R1 с открытыми весами, которая, по сообщениям, конкурирует с передовыми моделями o1 от OpenAI, несмотря на значительно меньшие затраты на обучение. Американские компании в...
7 месяцев назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала