1016 подписчиков
☄️ OpenAI выкатили новый флагман по имени o1
Основные выводы по модели:
✔️ прирост качества происходит за счёт рассуждения LLM'кой перед ответом.
Текст рассуждений не будет доступен, лишь краткая выжимка с верхнеуровневым описанием.
Модели и раньше умели рассуждать, но делали это менее эффективно.
Основной упор OpenAI сделали именно на то, чтобы при итеративном само-исправлении (рефлексии) и рассуждениях модель куда чаще приходила к правильному ответу.
✔️ o1 это не замена gpt-4o во всех задачах.
Она значитео лучше в математике/физике/программировании. Чётче следует инструкциям, но потенциально хуже говорит на разных языках и обладает не большим количеством знаний о мире.
Следует воспринимать модель как reasoner («мыслитель» по-русски, видимо).
Мини-версия, со слов OpenAI, в этом плане сравнима с gpt-4o-mini
✔️ Модель доступна платным подписчикам ChatGPT Plus с жестким лимитом: 30 сообщений В НЕДЕЛЮ большой модели и 50 - маленькой.
Так что собирайте все свои хотелки и продумывайте требования к решению наперёд
✔️ Если вы часто пользовались API и потратили больше $1000 в прошлом, то модель будет доступна по API с ограничением 20 запросов/минута.
✔️ Цена генерации выше:
Младшая версия o1-mini стоит чуть-чуть дороже gpt-4o августовской...но при этом вы платите за все рассуждения (которые, напомню, не увидите!) - а их будет МНОГО.
Поэтому реальная наценка будет в 3-10 раз, в зависимости от времени «раздумий» модели
✔️ Модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов.
По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом (~75-80% правильных ответов)
✔️ Возможности использовать изображения, поиск в интернете, запускать код пока отключены.
Но появятся в ближайшем будущем
✔️ Контекстное окно ограничено 128k токенами, как и у старых версий.
Однако следует ожидать увеличения в будущем — OpenAI заявляют, что сейчас модель в пике «думает» чуть больше пары минуты, а они хотят стремиться к часам и дням.
✔️ Могут встречаться простые баги
Когда модель прям на очевиднейшие вещи не отвечает/ведется на джейлбрейки. Это — нормально, уже через 2-3 месяца, когда модель перестанет быть preview, их станет сильно меньше
✔️ У OpenAI есть уже не-preview модель
Однако они её тестируют, и пока не готовы выпускать. Она лучше того, что вышло в общий доступ
✔️ Новую модель НЕ НУЖНО промптить
Не нужно просить отвечать как-то с размышлением, шаг за шагом или по-хитрому; всё это сделается самостоятельно под капотом за вас. Советы по промптингу от OpenAI — тут
Статьи от ученых из OpenAI, которые можно почитать, чтобы примерно прикинуть, как обучали модель: один, два, три.
P.S. Новость важная, но она не затмевает того факта, что сегодня в 19:00 заключительный день нашего интенсива по созданию нейросетевых чат-ботов в Телеграм
2 минуты
13 сентября 2024