Найти в Дзене
Andrey Vink

ИИ Ванга 2025

Хотел написать мощный пост, но времени нет, зато есть куча заметок, почти на каждую можно писать лонгрид с аргументацией, скидываю как есть.  —— В 2025 году ИИ агенты не взлетят. Главная проблема LLM моделей - ненадежность. Агент должен сам ставить себе процессные задачи, выполнять кучу работы в реальном мире с авто подтверждением и взаимодействовать с другими агентами, которые страдают такими же проблемами, а значит вероятность ошибки возводится в n степень. —- Коммерческие модели слишком дорогие для реального бизнеса, юнит экономика перестает сходиться, приходится повышать цены и терять конкурентность. Дешевые качественные модели откровенно демпингуют, нельзя из расчета их цен считать затраты для прогнозирования бизнес моделей, стоимость в любой момент может резко вырасти. Рассуждающие модели так вообще вне зоны добра и зла, «человеки» заметно выгоднее. —- Сейчас экономически выгодно внедрять малые локальные модели. Это опенсорс до 14В параметров, работающие на оперативной памяти (де

Хотел написать мощный пост, но времени нет, зато есть куча заметок, почти на каждую можно писать лонгрид с аргументацией, скидываю как есть. 

——

В 2025 году ИИ агенты не взлетят. Главная проблема LLM моделей - ненадежность. Агент должен сам ставить себе процессные задачи, выполнять кучу работы в реальном мире с авто подтверждением и взаимодействовать с другими агентами, которые страдают такими же проблемами, а значит вероятность ошибки возводится в n степень.

—-

Коммерческие модели слишком дорогие для реального бизнеса, юнит экономика перестает сходиться, приходится повышать цены и терять конкурентность. Дешевые качественные модели откровенно демпингуют, нельзя из расчета их цен считать затраты для прогнозирования бизнес моделей, стоимость в любой момент может резко вырасти. Рассуждающие модели так вообще вне зоны добра и зла, «человеки» заметно выгоднее.

—-

Сейчас экономически выгодно внедрять малые локальные модели. Это опенсорс до 14В параметров, работающие на оперативной памяти (дешевой и легко заменяемой). Стартует на ОЗУ 16Гб, для хорошей производительности нужно 32Гб и многоядерный процессор. Без vram. Это относительно бюджетная машина или сервер. Достойные модели из этого диапазона есть.

—-

LLM способны сильно повышать эффективность или вовсе заменять людей. В среде, где есть строгие алгоритмические методы проверки. Единственное, что приходит на ум, это программирование по методике Test-Driven Development (Разработка через тестирование), кому интересно, загуглите. А пока везде валидаторы - люди и это главный стоп-фактор для агентов.

—-

В ИИ помощниках кода хорошие результаты в JS (нативный, реакт и next) и в питоне без фреймворков. HTML верстка - подающий надежды кандидат на вхождение в этот список. Все остальные языки как будто специально не обучаются, качество генерации на них отвратительное и никто не пытается исправить ситуацию. Похоже это не изменится в 2025.

—-

Реально эффективное применение LLM сейчас (не ML, не путать, ранжирование с рекомендациями и классификацией рентген снимков не тут, это другая сфера):

  • Rag во всех его проявлениях (очень круто искать по векторам и обрабатывать результат через ИИ)
  • Суммаризация больших контекстов (запихнули в контекстное окно огромные таблички с текстами и просим с этим сделать всякие непотребства)
  • Повышение эффективности в копирайтинге, граф дизайне и программировании (на js и python)

Все реальные кейсы фактически гибрид вышеперечисленного с реальностью.

—-

Скорость развития ИИ резко упадет в первой половине года. Выйдет модель gpt5, к уровню которой все остальные подтянутся. Дальше начнется этап работы над рассуждающими моделями и алгоритмами, где нет тру практис и масштабирование мощностями не прокатывает