Наконец-то это случилось! Модель с открытым исходным кодом, прошедшая тонкую настройку, стала лучшей моделью Coding LLM, опередив GPT-4! Все, что вам нужно знать!
Новая версия, основанная на CodeLlama 70B
Что такое Code Llama?
30 января компания Meta объявила о выпуске Code Llama: "Code
Llama - это модель, ориентированная на программирование, разработанная
на платформе Llama 2. Ее основная цель - оптимизировать и ускорить
рабочие процессы разработчиков, а также облегчить обучение кодингу. Эта
модель способна создавать код, а также вести дискуссии вокруг кода на
естественном языке. Она совместима с широким спектром распространенных
сегодня языков программирования, таких как Python, C++, Java, PHP,
Typescript (Javascript), C#, Bash и др.".
Он поставляется в трех вариантах:
Code Llama - 70B,
CodeLlama-70B-Python,
CodeLlama-70B-Instruct.
CodeLlama - это базовая модель, которую можно доработать.
Представляем SQLCoder-70B, новый уровень кодирования
Таким образом, опираясь на CodeLlama и свой собственный набор данных, созданный вручную, defog доработал CodeLlama-70B, чтобы получить новую версию SQLCoder, а именно defog-sqlcoder-70b!
Последняя
достигла наивысшего на сегодняшний день показателя - 93%! Таким
образом, он стал первой моделью, превосходящей GPT-4 в нише применения.
И результат подтверждается на широком спектре операций SQL!
Что еще?
Вы можете скачать его на Huggingface, изучить на Github!
Выводы и перспективы
Появление SQLCoder-70B на базе CodeLlama-70B знаменует собой значительную веху в эволюции моделей языков кодирования,
устанавливая новую планку в нише кодирования SQL, превосходя
возможности GPT-4. Эта разработка подчеркивает неустанный прогресс
сообщества разработчиков с открытым исходным кодом, которое продолжает
внедрять инновации и совершенствовать модели искусственного интеллекта,
адаптированные к конкретным потребностям программирования. Достижения
SQLCoder-70B с его впечатляющей 93-процентной производительностью
при выполнении различных SQL-операций подчеркивают потенциал
специализированных моделей, способных изменить практику кодирования,
повысить производительность и революционизировать подход разработчиков к
работе с кодом.