Добавить в корзинуПозвонить
Найти в Дзене

Apple без лишнего шума представила на платформе Hugging Face новую модель искусственного интеллекта в помощь будущим разработчикам

Apple без лишнего шума представила на платформе Hugging Face новую модель искусственного интеллекта в помощь будущим разработчикам. Главная ее особенность заключается в нетрадиционном подходе к генерации кода — вместо привычного построчного метода, система может работать в произвольном порядке и улучшать несколько фрагментов одновременно. Новая модель получила название DiffuCode-7B-cpGRPO и базируется на технологии диффузии, которая чаще встречается в генераторах изображений вроде программы Stable Diffusion. В отличие от классических языковых моделей, работающих последовательно слева направо и сверху вниз, диффузионный подход позволяет создавать и совершенствовать весь текст параллельно. Интересно, что в основе разработки лежит открытая модель Qwen2.5-7B от китайской компании Alibaba. Специалисты из Apple доработали её, добавив диффузионный декодер и обучив на более чем 20 тысячах тщательно отобранных примерах кода. В результате производительность выросла на 4,4% по сравнению с базов

Apple без лишнего шума представила на платформе Hugging Face новую модель искусственного интеллекта в помощь будущим разработчикам. Главная ее особенность заключается в нетрадиционном подходе к генерации кода — вместо привычного построчного метода, система может работать в произвольном порядке и улучшать несколько фрагментов одновременно.

Новая модель получила название DiffuCode-7B-cpGRPO и базируется на технологии диффузии, которая чаще встречается в генераторах изображений вроде программы Stable Diffusion. В отличие от классических языковых моделей, работающих последовательно слева направо и сверху вниз, диффузионный подход позволяет создавать и совершенствовать весь текст параллельно.

Интересно, что в основе разработки лежит открытая модель Qwen2.5-7B от китайской компании Alibaba. Специалисты из Apple доработали её, добавив диффузионный декодер и обучив на более чем 20 тысячах тщательно отобранных примерах кода. В результате производительность выросла на 4,4% по сравнению с базовой версией, что впечатляет, учитывая сравнительно скромные 7 миллиардов параметров.

Несмотря на то, что новинка пока не может конкурировать с такими гигантами как нейросеть GPT-4 или система Gemini Diffusion, она демонстрирует интересный подход к решению задач программирования. Похоже, в Купертино потихоньку готовят почву для чего-то большего. Осталось только дождаться, когда эти эксперименты превратятся в реальные продукты.

@fixed