230 подписчиков

2025 год в LLM: 6 главных сдвигов

25 декабря 202525 дек 2025

1 мин

Андрей Карпатый опубликовал итоги года. Не про новые модели, а про смену парадигм.

1. RLVR: модели научились "думать" К стандартному стеку обучения добавился новый этап - обучение с подкреплением на проверяемых наградах. Модели спонтанно развивают стратегии рассуждения: разбивают задачу на шаги, пробуют разные подходы, исправляют ошибки. Весь прогресс 2025 - это не более крупные модели, а более длинные RL-прогоны. 2. Призраки vs Животные: рваный интеллект Мы не "выращиваем животных", мы "вызываем призраков". LLM оптимизированы для имитации текста и решения математики, а не для выживания в джунглях. Результат - jagged intelligence: модель одновременно гениальный эрудит и запутавшийся школьник. Доверие к бенчмаркам потеряно - лаборатории научились "выращивать шипы" под конкретные тесты. 3. Cursor: новый слой LLM-приложений Cursor показал, что такое "LLM-приложение" - инженерия контекста, оркестрация множества вызовов LLM, специфичный GUI и "слайдер автономности". LLM-лаборатории выпус

Андрей Карпатый опубликовал итоги года. Не про новые модели, а про смену парадигм.

Андрей Карпатый опубликовал итоги года. Не про новые модели, а про смену парадигм.

1. RLVR: модели научились "думать"

К стандартному стеку обучения добавился новый этап - обучение с подкреплением на проверяемых наградах. Модели спонтанно развивают стратегии рассуждения: разбивают задачу на шаги, пробуют разные подходы, исправляют ошибки. Весь прогресс 2025 - это не более крупные модели, а более длинные RL-прогоны.

2. Призраки vs Животные: рваный интеллект

Мы не "выращиваем животных", мы "вызываем призраков". LLM оптимизированы для имитации текста и решения математики, а не для выживания в джунглях. Результат - jagged intelligence: модель одновременно гениальный эрудит и запутавшийся школьник. Доверие к бенчмаркам потеряно - лаборатории научились "выращивать шипы" под конкретные тесты.

3. Cursor: новый слой LLM-приложений

Cursor показал, что такое "LLM-приложение" - инженерия контекста, оркестрация множества вызовов LLM, специфичный GUI и "слайдер автономности". LLM-лаборатории выпускают "способных студентов", а LLM-приложения превращают их в профессионалов в конкретных вертикалях.

4. Claude Code: ИИ живет на твоем компьютере

Первая убедительная демонстрация LLM-агента, который работает на твоем компьютере с твоим приватным окружением и данными. ИИ - это не сайт, куда ты заходишь как в Google, а маленький дух, который "живет" на твоем компьютере.

5. Vibe Coding: программирование на естественном языке

2025 - год, когда ИИ пересек порог для создания программ просто разговаривая с ним. Код стал бесплатным, эфемерным, одноразовым - профессионалы пишут намного больше софта, который иначе никогда не был бы написан.

6. Nano Banana: GUI для LLM

"Чат" с LLM - это как команды в консоли 1980х. LLM должны говорить с нами изображениями, инфографикой, слайдами, анимациями. Google Gemini Nano banana - первый намек на LLM GUI, где текст, изображения и знания о мире переплетены в весах модели.

LLM - новый вид интеллекта, одновременно умнее и глупее ожидаемого. Индустрия не реализовала и 10% их потенциала. Парадокс: мы увидим быстрый прогресс И при этом предстоит еще много работы.

@ReymerDigital

Бизнес и финансы

1,13 млн интересуются