Добавить в корзинуПозвонить
Найти в Дзене
Машинное обучение

✔️ В macOS-клиенте Codex появилась возможность создания сценариев

OpenAI добавила функцию Record and Replay в Codex для автоматизации десктопной рутины. Инструмент записывает повторяющиеся действия пользователя и конвертирует их в структурированный алгоритм. Пользователь вручную управляет процессом записи. После захвата действий модель генерирует редактируемый сценарий. Его можно сохранить для запуска в будущем. Пока функция работает в виде опциональной настройки только в клиенте для macOS. Для её использования требуется активировать специальное разрешение Computer Use. Из-за региональных ограничений релиз недоступен на территории стран ЕЭЗ, Великобритании и Швейцарии. OpenAIDevs в сети Х ✔️ Artificial Analysis запустила бенчмарк для оценки работы ИИ в бизнес-проектах Тест AA-Briefcase был разработан совместно с Google, McKinsey и BCG. Он состоит из 91 задачи, симулирующей процессы в Data Science, управлении продуктами, банкинге и промышленности. Модели ранжируются по качеству аналитики, точности ответов и формату данных. Лидером рейтинга стала 

✔️ В macOS-клиенте Codex появилась возможность создания сценариев

OpenAI добавила функцию Record and Replay в Codex для автоматизации десктопной рутины. Инструмент записывает повторяющиеся действия пользователя и конвертирует их в структурированный алгоритм.

Пользователь вручную управляет процессом записи. После захвата действий модель генерирует редактируемый сценарий. Его можно сохранить для запуска в будущем.

Пока функция работает в виде опциональной настройки только в клиенте для macOS. Для её использования требуется активировать специальное разрешение Computer Use. Из-за региональных ограничений релиз недоступен на территории стран ЕЭЗ, Великобритании и Швейцарии.

OpenAIDevs в сети Х

✔️ Artificial Analysis запустила бенчмарк для оценки работы ИИ в бизнес-проектах

Тест AA-Briefcase был разработан совместно с Google, McKinsey и BCG. Он состоит из 91 задачи, симулирующей процессы в Data Science, управлении продуктами, банкинге и промышленности. Модели ранжируются по качеству аналитики, точности ответов и формату данных.

Лидером рейтинга стала Fable 5, второе и третье место - Opus 4.8 и GLM-5.2. Показатели успешности остаются низкими, лидер достиг 100% результата лишь в 3% случаев и не набрал половины баллов в 31 задании. В опенсорс-сегменте GLM-5.2 уступила Opus 4.8 на 90 баллов при четырехкратной разнице в стоимости использования.

Разброс цены за выполнение одной задачи составил от 4 центов у DeepSeek V4 до 31 доллара у Fable 5. Авторы бенчмарка зафиксировали, что для прохождения тестов моделям-литерам регулярно требовались инструменты визуального анализа.

artificialanalysis.ai

✔️ Google DeepMind на этой неделе лишилась двух ИИ-звезд

Команду покинул Джон Джампер, руководитель проекта AlphaFold и лауреат Нобелевской премии по химии 2024 года. После почти 9 лет работы в подразделении он принял решение перейти в Anthropic.

Джампер получил мировое признание за создание алгоритма, совершившего революцию в предсказании трехмерной структуры белков, разделив награду с Демисом Хассабисом.

Незадолго до этого о своем уходе в OpenAI объявил Ноам Шазир. Он занимал пост соруководителя разработки Gemini и был одним из ключевых создателей архитектуры ризонинга языковых моделей Google.

Всего за несколько дней Anthropic и OpenAI удалось переманить двух важнейших специалистов, напрямую определявших развитие ИИ-продуктов поискового гиганта.

John Jumper и Noam Shazeer в сети Х

✔️ Genesis AI показал складного колесного робота

Стартап, поддерживаемый Эриком Шмидтом представил складного колёсного робота Eno на базе собственной модели GENE.

В отличие от двуногих платформ, Eno передвигается на колёсном шасси с регулируемой стойкой из шарнирных панелей. Устройство меняет высоту на ходу и складывается до размеров чемодана.

Робот получил руки с 20 активными степенями свободы и обратной связью. За управление отвечает модель GENE, которая работает как физический агент - анализирует обстановку и адаптируется к изменениям без запрограммированных сценариев.

Genesis AI собрала несколько десятков предсерийных образцов. К концу года компания планирует запустить производство для складской логистики, а в перспективе вывести устройство в отели, больницы и потребительский сектор.

genesis.ai

✔️ Норвегия запретила использование ИИ в начальных классах

В конце августа страна закроет доступ к инструментам генеративного ИИ для учеников 1–7 классов (6–13 лет).

В средней школе (14–16 лет) использование нейросетей допускается только под контролем учителей. Обучать работе с алгоритмами будут исключительно старшеклассников.

Правительство считает, что ИИ позволяет школьникам обходить образовательные процессы, вредя базовому освоению чтения, письма и математики. Общее снижение успеваемости с 2015 года власти напрямую связывают с цифровизацией обучения. Помимо ограничений для ИИ, в классы вернут бумажные учебники.

Ранее в Норвегии уже запретили использование смартфонов на уроках, а в ближайшее время планируется ввести запрет на доступ к социальным сетям для детей младше 16 лет.

reuters.com

#news #ai #ml