Салли Кромсали и Балди Разгадали Новый Секрет Злой Бабушки Гренни все серии Страшилки мультики
Я: Перечисли 10 принципиальных РЕАЛЬНЫХ улучшений версии GPT-4.5, по сравнению с прошлыми версиями типа 4o, o1, o3 и т.п. И максимально конкретно с метриками. Ответ: GPT-4.5 представляет собой значительное обновление по сравнению с предыдущими версиями, такими как GPT-4o, o1 и o3. Ниже приведены 10 ключевых улучшений с конкретными метриками: 1. Снижение частоты галлюцинаций: Частота генерации неверной информации снизилась с 59,8% у GPT-4o до 37,1% у GPT-4.5. 2. Повышение точности ответов: В тесте SimpleQA точность ответов увеличилась с 38,6% у GPT-4o до 62,5% у GPT-4.5. 3. Улучшение эмоционального интеллекта: GPT-4.5 лучше понимает тонкие нюансы речи и реагирует на имплицитные запросы пользователей, делая взаимодействие более естественным. 4. Расширение знаний и понимания мира: Модель обладает более широкими знаниями и глубоким пониманием мира, что делает её более надежной в различных темах. 5. Улучшение креативности и гибкости: GPT-4.5 демонстрирует повышенную способность к созданию оригинальных формулировок и образных аналогий, улучшая качество генерируемого текста. 6. Повышение вычислительной эффективности: Несмотря на увеличение размера модели, её вычислительная эффективность улучшена более чем в 10 раз по сравнению с GPT-4. 7. Улучшение в многоязычных тестах: В многоязычном тесте MMLU GPT-4.5 показала небольшой рост точности по сравнению с GPT-4, особенно заметный в языках с меньшими датасетами. 8. Улучшение в тестах на общие и экспертные знания: В тестах на общие и экспертные знания наблюдается улучшение с 9%-ным ростом по сравнению с GPT-4o. 9. Снижение уровня галлюцинаций в PersonQA: В тесте PersonQA точность ответов выросла с 28% (GPT-4o) до 78% (GPT-4.5), а частота галлюцинаций снизилась с 52% до 19%. 10. Улучшение в бенчмарке SWE-bench: В бенчмарке SWE-bench GPT-4.5 смогла решить около 38% задач, что на 7% выше, чем GPT-4o. Эти улучшения делают GPT-4.5 более точной, эффективной и гибкой моделью по сравнению с её предшественниками. Вот полные ссылки на все источники, которые были использованы: 1. Financial Times (частота галлюцинаций, точность ответов и понимание мира) https://www.ft.com/content/117ec9b2-745d-4c37-bfc4-6e545a7d3ac1 2. Habr (повышение креативности, вычислительная эффективность, многоязычные тесты, PersonQA, SWE-bench) https://habr.com/ru/articles/886210/ 3. Habr (дополнительные детали по многоязычным возможностям) https://habr.com/ru/news/886532/ 4. Habr (общее описание возможностей GPT-4.5) https://habr.com/ru/articles/887032/ 5. Neuro AI (улучшение эмоционального интеллекта и нюансов речи) https://neuro-ai.ru/news/gpt-4-5-ot-openai-novye-vozmozhnosti-ili-prosto-marketing.html Эти ссылки можно корректно скопировать и использовать. А вот завезли бесплатный курс по основам chatGPT см. программу: https://alexeykrol.com/courses/ai_intro/
Хабр, GPT, корпоративные блоги и БМЛы: оцениваем глубины ужаса Долго работая с LLM и GPT, неизбежно начинаешь замечать паттерны, обороты и формулировки, характерные для генеративного контента. Наткнувшись на очередную очевидно генеративную статью, автор решил исследовать это дело подробнее и желательно автоматически.