Найти в Дзене
Компания Taiwan Semiconductor Manufacturing Company, ведущий мировой производитель передовых процессоров, сообщила Nvidia и Broadcom, что не
может удовлетворить их запросы в полном объеме на увеличение производственных мощностей по выпуску чипов, сообщает The Information во вторник. Это заявление подчеркивает беспрецедентную нагрузку на глобальные цепочки поставок чипов, поскольку спрос на искусственный интеллект продолжает опережать доступные производственные мощности.Broadcom добивается дополнительных мощностей специально для тензорных процессоров, разрабатываемых для Google, говорится в отчете...
2 дня назад
https://huabinoliver.substack.com/p/china-to-get-ready-for-war-with-the
3 дня назад
Аналогично, обучение языковых моделей через предсказание следующего токена — это процесс сжатия данных в веса модели.А что если продолжить
это обучение уже во время тестирования — на предоставленном контексте?Так появляется Test-Time Training (TTT). Мы обнаружили, что этот подход становится особенно эффективным, если дополнить его мета-обучением на этапе инициализации модели. Так рождается TTT‑E2E:внутренний цикл напрямую оптимизирует потерю предсказания токена (в отличие от предыдущих подходов, таких как Titans),внешний цикл оптимизирует итоговую потерю после выполнения TTT.Какую роль сохранит RAG?TTT похож на «обновление мозга», а методы поиска с извлечением (RAG) — на ведение записной книжки. Блокнот полезен, когда важны детали, например при составлении длинного списка покупок...
3 дня назад
Вот полный перевод вашего текста на русский язык с сохранением структуры оригинала и технических терминов:Главная
РАЗРАБОТЧИК Присоединиться Технический блог Поиск по блогу Agentic AI / Generative AIEnglish Переосмысление памяти LLM: использование контекста как обучающих данных открывает модели, которые учатся во время тестированияДекоративное изображение 9 января 2026 Авторы: Ю Сун и Ейджин Чой+26 Нравится Обсудить (0) LTFREAI-сводкаМы всё чаще слышим о LLM с расширенным контекстным окном — разработчики обещают, что эти модели смогут удерживать в памяти целые истории диалогов, тома книг или несколько крупных кодовых баз одновременно. Однако на практике они продолжают допускать одни и те же ошибки. Нам всё...
3 дня назад
https://developer.nvidia.com/blog/reimagining-llm-memory-using-context-as-training-data-unlocks-models-that-learn-at-test-time/
3 дня назад
Разработчики в технологической индустрии столкнулись с неожиданным эмоциональным потрясением после того, как Claude Code в паре с моделью
Opus 4.5 от Anthropic продемонстрировала способность выполнять недельную работу за считанные минуты во время праздничных каникул — что вызвало массовые экзистенциальные вопросы о ценности экспертизы в программировании.Реакция была поразительно искренней. «Навык, на совершенствование которого я потратил десятки тысяч часов. Программирование... чрезвычайно быстро превращается в полный коммодити», — написал Эндрю Д., основатель Awaken Tax, выразив настроение, которое отозвалось эхом в сообществах разработчиков...
4 дня назад
Острый су-вид курдюк без кожи (500 г)Нежный бараньий курдюк, приготовленный методом су-вид при 65°C, с мощной острой обсыпкой из чили и
специй, плюс финишное копчение пистолетом. Идеальная закуска — жир тает, острота жжет, дымный аромат дополняет. На 1–2 порции, время активно ~30 мин + 24 ч выдержки.ИнгредиентыДля су-вида:Курдюк без кожи — 500 г (кусок целиком или 2–3 части по 150–200 г)Соль — 1 ст. л.Для засолки:Соль крупная — 1,5–2 ст. л. (40–50 г)Чеснок свежий — 4–5 зубчиков (натереть)Для острой обсыпки специями:Паприка копчёная — 1 ст. л.Паприка острая/чили cayenne молотая — 1,5–2 ст. л.Приправа для баранины (зира, кориандр, сушёный чеснок) — 1 ст. л.Чили свежий/халапеньо (мелко рубленный, без семян) — 1 шт. (или 1 ч. л. пасты чили)Чёрный перец свежемолотый — 1 ч...
5 дней назад