Крупные языковые модели становятся жертвами собственной универсальности. Google убрал пиксельную сегментацию изображений из Gemini, OpenAI прекратил поддержку GPT-3 и нескольких версий GPT-4, Anthropic закрыл Claude 2.0 и 2.1. Проблема в ограниченном бюджете на обучение. Когда ресурсы тратят на развитие способностей к рассуждению и программированию, страдают узкоспециализированные функции. Компании сознательно идут на этот компромисс, считая универсальность приоритетом. Особенно болезненно это сказывается на обработке документов. Точность OCR для нестандартных случаев падает — счета-фактуры, лабораторные отчёты, страховые заявления распознаются хуже, чем в предыдущих версиях. Разработчики корпоративных решений сталкиваются с неожиданными проблемами. Обновление модели может сломать работающий пайплайн, если он зависел от удалённой функции. Решение — узкоспециализированные модели. Они не умеют писать код или философствовать, зато идеально распознают конкретные типы документов. И делают э
Большие языковые модели теряют специализацию ради универсальности
10 марта10 мар
1 мин