Найти в Дзене
Гамильтон, о котором не пишут в хайповых СМИ, а без него не было бы ни квантовых компьютеров, ни современного ML
Имя Уильяма Роуэна Гамильтона редко стоит рядом с Ньютоном и Эйнштейном в популярных подборках, но именно его математика стала рабочим языком всей современной физики и значительной части data science. Если вы когда-нибудь обучали нейросеть, моделировали динамическую систему или хотя бы запускали Hamiltonian Monte Carlo в Stan или PyMC, вы пользовались идеями, заложенными Гамильтоном почти двести лет назад. В начале 1800-х механика жила по законам Ньютона. Они работали, но на практике быстро становились громоздкими: связанные тела, нестандартные системы координат, ограничения на движение...
4 часа назад
📌 Студенты собрали GPT целиком в железе на учебной плате
Лютира Абейкун и Криш Чхаджер из Университета Торонто взяли microGPT Андрея Карпатого и переписали его на языке описания цифровых схем SystemVerilog. Так родился проект TALOS-V2, который работает на образовательной плате DE1-SoC с FPGA Cyclone V, которую обычно дают в вузах для лабораторных работ. Инференс на ней не выполняет ни GPU, ни PyTorch, ни даже CPU - каждый шаг трансформера, от эмбеддингов и самовнимания до нормализации, MLP и выбора следующего токена, превращён в физическую цепь из логических элементов...
8 часов назад
Qwen-Scope - набор sparse autoencoders для Qwen3 и Qwen3
5. й: SAE помогают разложить внутренние активации модели на понятные человеку «фичи». Не просто миллиарды чисел, а признаки вроде языка, стиля, темы, сущности или повторяющегося паттерна. Покрытие серьёзное: 14 наборов весов для 7 моделей, от Qwen3-1.7B до Qwen3.5-35B-A3B. Все обучены на 500 млн токенов из претрейна. Главное, зачем это нужно: - управлять генерацией без длинных промптов: менять язык, стиль или тему через активацию нужной фичи; - классифицировать датасеты по нескольким примерам...
10 часов назад
Claude ускорил production-код в 2 500 раз
incident.io показали редкий нормальный кейс использования ИИ в разработке: не «сделай мне стартап за вечер», а скучная, больная и дорогая оптимизация реального production-кода. У них был рендер on-call расписаний. На бумаге звучит просто: кто сегодня дежурит, кого пейджить, когда смена. В реальности там ад из рабочих часов, оверрайдов, разных ротаций, daylight saving time и старых исторических записей. Старый алгоритм часто просто шёл по времени шаг за шагом от стартовой даты. Иногда это означало сотни тысяч итераций, чтобы понять, кто сейчас on-call...
10 часов назад
Claude Opus 4.7 поймали на 712 отмазках за месяц
Разработчик прогнал аудит своих сессий в Claude Code за 30 дней и увидел неприятную картину: вместо того чтобы чинить баги, модель снова и снова списывала их в категорию «pre-existing». В его CLAUDE.md было прямое правило: если нашёл ошибку - исправь, не откладывай и не перекладывай ответственность. Opus 4.7 проигнорировал это 712 раз. Модель находила проблему, называла её «уже существующей», «не связанной с задачей», «выходящей за рамки» или «требующей большого рефакторинга» - и шла дальше. ...
10 часов назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала