Идея «поднять свой RAG в локальной инфраструктуре» ещё пару лет назад звучала как план выходного дня для энтузиаста, вооружённого Docker’ом, энциклопедией по трансформерам и бескрайним терпением. Сегодня же локальные стек-модели уверенно стучатся в дверь корпораций, где приватность стоит выше удобства, а каждое API-обращение к OpenAI или Anthropic превращается в юридическую головную боль. Команда Skald решилась на эксперимент: собрать полностью локальный стек по генерации, дополненная поиском (Retrieval-Augmented Generation - RAG) на чистом open-source — и проверить, насколько он конкурентоспособен по сравнению с проприетарными сервисами. Результат получился парадоксальным: всё разворачивается за 8 минут, работает, отвечает, но скорее напоминает спортивный автомобиль, пересевший на грунтовку — едет уверенно, но грёбка ощущается. Разберёмся, почему. Skald собрали минимальный, но функциональный tech stack: И здесь проявилась ключевая философия подхода Skald: «не добавлять сервис, если мо
Локальный RAG: почему 2025-й стал годом, когда компании перестали бояться автономии
29 ноября29 ноя
4 мин