Software Freedom Conservancy (SFC) выпустили довольно интересный документ с рекомендациями по использованию LLM в open-source проектах. Спойлер: не стоит использовать генеративный AI там, где важны происхождение кода, лицензирование и безопасность. ⚙️ В чём проблема? SFC отдельно разбирают, что LLM ломают базовые гарантии open-source supply chain. Когда разработчик вставляет сгенерированный код, он часто не знает: 🔹 откуда этот код появился 🔹 на какой лицензии он основан 🔹 не попал ли туда копипаст из GPL/AGPL 🔹 нет ли внутри старых CVE- паттернов 🔹 не повторяет ли модель insecure implementation По сути provenance кода исчезает. А вместе с ним ломается возможность проведения аудита, а при инцидентах становится сложнее понять источник уязвимости. 🧨 Паттерны LLM отлично генерируют рабочий код, но плохо генерируют механизмы защиты. Типичный паттерн, когда функция работает, но модель аудита упрощёна, проверка входных параметров поверхностная, управление секретами отсутствует