Созданная лишь в апреле текущего года, компания Baichuan Intelligence, основанная известным предпринимателем Уаном Шяочуаном, продолжает устанавливать новые стандарты в сфере искусственного интеллекта. Начиная с июня, она регулярно выпускает крупные открытые модели, привлекая внимание всего мира.
На протяжении последних месяцев Baichuan Intelligence представила следующие модели:
- Baichuan-7B (15 июня): Модель с 70 миллиардами параметров, способная работать с китайским и английским языками.
- Baichuan-13B-Base и Baichuan-13B-Chat (11 июля): Модели с 130 миллиардами параметров, а также их квантованные версии для различных задач.
- Baichuan-53B (8 августа): Третья модель, продолжающая тенденцию к росту.
Общее количество загрузок этих открытых моделей Baichuan уже превысило 5 миллионов, и они стали популярными на GitHub.
6 сентября Baichuan Intelligence снова порадовала сообщество, выпустив Baichuan2-7B, Baichuan2-13B, Baichuan2-13B-Chat и их 4-битные квантованные версии. Важно, что эти модели могут быть бесплатно использованы в коммерческих целях.
Baichuan2 представляет собой полное обновление первого поколения моделей Baichuan и обладает значительным улучшением навыков в различных областях. Например, модель Baichuan2-13B-Base улучшила свои математические способности на 49%, навыки работы с кодом на 46%, кибербезопасность на 37%, логический вывод на 25% и семантический анализ на 15%.
Модели Baichuan2 обладают внушительными объемами обучающих данных (2,6 триллиона токенов) и поддерживают множество языков. Они были тщательно отобраны из огромного объема данных различных сфер, обеспечивая высокое качество контента.
Компания также активно участвует в научном сообществе, предоставляя технические отчеты и другие данные для поддержки исследований в области крупных моделей.
Baichuan Intelligence объявила о создании фонда исследований крупных моделей CCF & Baichuan, сотрудничая с Китайской ассоциацией компьютерной лингвистики (CCF). Этот фонд поддержит исследования крупных моделей и их применение в разных областях.
Глава Baichuan Intelligence Уан Шяочуан рассказал, что компания планирует выпустить модель с 100 миллиардами параметров, конкурирующую с GPT-3.5, в четвертом квартале текущего года, а также разработать выдающиеся приложения на основе своих моделей в первом квартале следующего года. Baichuan Intelligence продолжает свое стремительное развитие, внося важный вклад в китайские и мировые рынки искусственного интеллекта.