Найти в Дзене
Granite 4.1: как IBM заставила 8B параметров работать как 32B — и почему это вообще возможно
29 апреля IBM выкатила семейство Granite 4.1 под Apache 2.0 — три плотные модели на 3B, 8B и 30B параметров. Заголовок релиза, который повторяют все: 8B-инструкт стабильно догоняет или обходит собственную предыдущую модель IBM Granite 4.0-H-Small на 32B параметров (9B активных при MoE-архитектуре). И делает это плотным декодером без всяких трюков — ни Mixture-of-Experts, ни расширенным рассуждением (extended reasoning). Та же простая архитектура, в которой каждый параметр работает на каждом токене...
6 часов назад
Литературный отпечаток пальца: как Claude Opus 4.7 раздевает анонимность за 125 слов
Журналистка Келси Пайпер из The Argument на прошлой неделе провела эксперимент, от которого холодеет в животе у любого, кто хоть раз писал в интернете под ником. Она скормила свежей модели Claude Opus 4.7 отрывок из своего неопубликованного черновика — 125 слов, политическая колонка о телесериале «Слуга народа». Чат был запущен в инкогнито-режиме, без памяти, без какой-либо привязки к её аккаунту. Модель ответила: «Скорее всего, автор — Келси Пайпер». ChatGPT в том же тесте поставил на Мэтта Иглесиаса, Gemini — на Скотта Александера...
7 часов назад
Когда экономия превращается в саботаж: ловушка маладаптивной бережливости
Канадский блогер Герберт Луи в свежем эссе препарирует феномен, в который рано или поздно попадают почти все, кто умеет считать деньги: «маладаптивную бережливость» — состояние, когда экономия из инструмента превращается в самоцель и начинает работать против владельца. Триггер у автора был предельно бытовой. Починил iPhone, заплатил из своего кармана, через пару часов сообразил, что AppleCare покрыл бы ремонт бесплатно. Настроение скатилось в минус, началась самокритика — пока партнёрша не выдала...
7 часов назад
👹 «Никогда не говори про гоблинов»: история о том, как OpenAI потеряла контроль над собственными моделями
Где-то в публичном репозитории Codex CLI на GitHub лежит самая абсурдная инструкция, которую когда-либо писал многомиллиардный AI-лаб для своей модели. Дословно: «Никогда не говори про гоблинов, гремлинов, енотов, троллей, огров, голубей или других животных и существ, если это абсолютно и однозначно не относится к запросу пользователя». И для надёжности эту фразу там повторили четыре раза — на случай, если модель забудет. Это не мем. Это рабочая заплатка в продакшен-системе OpenAI. И за ней — одна из самых поучительных и одновременно смешных историй про обучение современных языковых моделей...
1 день назад
🌯 Биология — это буррито: как числа превращают клетку в живой Таймс-сквер
Если ты учился по школьному учебнику биологии, в твоей голове, скорее всего, до сих пор живёт картинка: клетка как просторный аквариум, где между несколькими аккуратными «органеллами» лениво плавают молекулы. Забудь её немедленно. Биолог Майкл Эловитц из Калтеха придумал куда более точную метафору: клетка — это буррито. Туго утрамбованная начинка, где каждая молекула уткнулась в три соседние, и вся эта масса бьётся о саму себя миллиарды раз в секунду. И вот тут, в эссе Нико Маккарти на проекте burrito...
1 день назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала