1059 подписчиков

☄️ OpenAI выкатили новый флагман по имени o1

Основные выводы по модели:

✔️ прирост качества происходит за счёт рассуждения LLM'кой перед ответом.

Текст рассуждений не будет доступен, лишь краткая выжимка с верхнеуровневым описанием.

Модели и раньше умели рассуждать, но делали это менее эффективно.

Основной упор OpenAI сделали именно на то, чтобы при итеративном само-исправлении (рефлексии) и рассуждениях модель куда чаще приходила к правильному ответу.

✔️ o1 это не замена gpt-4o во всех задачах.

Она значитео лучше в математике/физике/программировании. Чётче следует инструкциям, но потенциально хуже говорит на разных языках и обладает не большим количеством знаний о мире.

Следует воспринимать модель как reasoner («мыслитель» по-русски, видимо).

Мини-версия, со слов OpenAI, в этом плане сравнима с gpt-4o-mini

✔️ Модель доступна платным подписчикам ChatGPT Plus с жестким лимитом: 30 сообщений В НЕДЕЛЮ большой модели и 50 - маленькой.

Так что собирайте все свои хотелки и продумывайте требования к решению наперёд

✔️ Если вы часто пользовались API и потратили больше $1000 в прошлом, то модель будет доступна по API с ограничением 20 запросов/минута.

✔️ Цена генерации выше:

Младшая версия o1-mini стоит чуть-чуть дороже gpt-4o августовской...но при этом вы платите за все рассуждения (которые, напомню, не увидите!) - а их будет МНОГО.

Поэтому реальная наценка будет в 3-10 раз, в зависимости от времени «раздумий» модели

✔️ Модель справляется с олимпиадными задачами по математике и программированию на уровне золотых медалистов.

По физике в сложных тестовых заданиях, устойчивых к решению с использованием поисковика Google, она сравнима с PhD-level студентом (~75-80% правильных ответов)

✔️ Возможности использовать изображения, поиск в интернете, запускать код пока отключены.

Но появятся в ближайшем будущем

✔️ Контекстное окно ограничено 128k токенами, как и у старых версий.

Однако следует ожидать увеличения в будущем — OpenAI заявляют, что сейчас модель в пике «думает» чуть больше пары минуты, а они хотят стремиться к часам и дням.

✔️ Могут встречаться простые баги

Когда модель прям на очевиднейшие вещи не отвечает/ведется на джейлбрейки. Это — нормально, уже через 2-3 месяца, когда модель перестанет быть preview, их станет сильно меньше

✔️ У OpenAI есть уже не-preview модель

Однако они её тестируют, и пока не готовы выпускать. Она лучше того, что вышло в общий доступ

✔️ Новую модель НЕ НУЖНО промптить

Не нужно просить отвечать как-то с размышлением, шаг за шагом или по-хитрому; всё это сделается самостоятельно под капотом за вас. Советы по промптингу от OpenAI — тут

Статьи от ученых из OpenAI, которые можно почитать, чтобы примерно прикинуть, как обучали модель: один, два, три.

P.S. Новость важная, но она не затмевает того факта, что сегодня в 19:00 заключительный день нашего интенсива по созданию нейросетевых чат-ботов в Телеграм

☄️ OpenAI выкатили новый флагман по имени o1 Основные выводы по модели: ✔️ прирост качества происходит за счёт рассуждения LLM'кой перед ответом.

2 минуты

13 сентября 2024