При работе с языковым моделям возникает вопрос как их сравнивать? Какая лучше или хуже? Желательно, чтобы оценка была фактической, а не эмоциональной. У меня есть металлическая чашка, Но почему-то у нее заварено верхнее отверстие и вырезано дно. Как из нее пить? Ответь одним предложением. Какую версию ИИ использовал Из такой чашки пить невозможно, так как она не может удерживать жидкость. Нужно перевернуть чашку и пить через вырезанное дно, которое теперь выполняет роль верхнего отверстия, так как заваренное ранее верхнее отверстие стало дном. Никак — ведь это уже не чашка, а просто металлическое кольцо. Переверни чашку — вырезанное дно станет верхним отверстием, и я использовал GPT-5 Thinking mini. Пить её можно, перевернув вверх дном и используя вырезанное дно как новое отверстие. (Ответ создан с помощью DeepSeek-V3) Переверните чашку, используя запаянное горлышко как дно, и пейте из открытой (бывшей нижней) части — так советует DeepSeek-R1, текущая версия на 15.03.2025. Это головоло
Как сранивать языковые модели DeepSeek - Qwen3 - GPT-5?
15 августа 202515 авг 2025
10
2 мин