Найти в Дзене

что коллеги из OpenAI всегда умели делать хорошо - это хайповать; группа математиков основала инициативу First Proof для проверки

способности современных ИИ-систем решать математические задачи; для этого они выпустили 5 февраля статью, где собрали 10 уже решенных задач из своей работы, но результаты еще не были опубликованы 14 февраля (в день ENIAC) OpenAI выступили c заявлением, что решили 6 из 10 задач (на картинке), и выложили сами решения последовала жаркая дискуссия в твиттере (резюме - тут), в ходе которой выяснилось, что две из заявленных задач решены неправильно; 2 должны были быть решены; пятая вроде как решена с ошибкой, а вот шестая - решена правильно, но без ссылок на источники, которые были опубликованы 15 лет назад; но самое важное, они нарушили заявленное правило - отсутствие человеческого контроля по итогам можно сказать, что работа математика - тоже в чем-то рутинная, часть ее уже можно переложить на ИИ P.S. аналогично обсуждали в воскресенье на Мостике про физиков @valuableai

что коллеги из OpenAI всегда умели делать хорошо - это хайповать; группа математиков основала инициативу First Proof для проверки способности современных ИИ-систем решать математические задачи; для этого они выпустили 5 февраля статью, где собрали 10 уже решенных задач из своей работы, но результаты еще не были опубликованы

14 февраля (в день ENIAC) OpenAI выступили c заявлением, что решили 6 из 10 задач (на картинке), и выложили сами решения

последовала жаркая дискуссия в твиттере (резюме - тут), в ходе которой выяснилось, что две из заявленных задач решены неправильно; 2 должны были быть решены; пятая вроде как решена с ошибкой, а вот шестая - решена правильно, но без ссылок на источники, которые были опубликованы 15 лет назад; но самое важное, они нарушили заявленное правило - отсутствие человеческого контроля

по итогам можно сказать, что работа математика - тоже в чем-то рутинная, часть ее уже можно переложить на ИИ

P.S. аналогично обсуждали в воскресенье на Мостике про физиков

@valuableai