Достижения и способности Claude 3 в академических тестах и понимании сложного контента Большая языковая модель (LLM) Claude 3 от Anthropic произвела фурор в марте, превзойдя GPT- 4 от OpenAI (на базе которой работает ChatGPT) в ключевых бенчмарк-тестах ИИ. Claude 3 Opus, самая мощная версия, доминировала в этих тестах, начиная от экзаменов в средней школе и заканчивая задачами на рассуждение. Его братья Claude 3 Sonnet и Haiku, также показали хорошие результаты в сравнении с моделями OpenAI. Однако бенчмарки рассказывают лишь часть истории. Независимый тестер ИИ Рубен Хассид сравнил GPT-4 и Claude 3 в таких задачах, как обобщение PDF-файлов и написание стихов. Claude 3 преуспел в "чтении сложных PDF-файлов, написании рифмованных стихов и предоставлении подробных ответов". GPT-4, напротив, лучше справлялся с просмотром веб-страниц и интерпретацией графиков в PDF. Помимо контрольных показателей, Claude 3 удивил экспертов намёками на осознанность и самореализацию. Однако существует ске
Могут ли машины думать? Claude 3 расширяет границы искусственного интеллекта
29 апреля 202429 апр 2024
7
2 мин