384 подписчика
В ответ на пост
В целом, из того что я вижу, под капотом доведенная до ума концепция, которую мы постоянно используем в промптах для ChatGPT - Chain-of-Thought.
Chain-of-Thought или Цепочка Мыслей: это определенная последовательность "мыслей", которые происходят перед тем как, как дать финальный ответ. Это примерно то что мы видели в недавнем Reflection 70B, и отдаленно похожее на то, что мы добивались промптом "Шаг за шагом проанализируй данный текст...", но намного более глубже. Подробное сравнение на одном и том же промпте показали сами OpenAI у себя в блоге, сравнив ответы GPT-4o и o1-preview.
Также, из интересных моментов, в o1 сделали большой акцент на безопасности (читайте как "акцент на урезании возможности модели отвечать вне рамок этических рамок, законов и т.д.") по сравнению с gpt-4o. Модель специально обучали правилам безопасности OpenAI а также процессу рассуждению по недопущению их нарушению. В целом, "взломать" модель при помощи джейлбрейка стало примерно в 4 раза сложнее, по сравнению с gpt-4o.
Если сравнивать скорость начала ответа, то отвечая на запрос "Give me give countrires with letter A in the third position in the name" gpt 4-o дал ответ через 3 секунды (но неправильно), o1-mini через 9, а o1-preview через 32 секунды, ответив при этом правильно.
1 минута
12 сентября 2024