AI Комета | Дзен

Поддержите автораПеревод на любую сумму

Новая ИИ-модель Count Anything: считает объекты на любых изображениях

Большие языковые модели научились описывать картинки, читать текст и интерпретировать графики, но считать объекты не могли. Теперь исследователи из Университета Цинхуа создали Count Anything, которая считает всё: от голов в толпе до бактерий в чашке Петри. Секрет — комбинация рамок вокруг крупных объектов и точек на мелких. Модель доучивает адаптеры поверх нейросети Meta* SAM3, не переобучая всё с нуля...

4 дня назад

Наделла предупредил о «токен-зависимости» и сам в этом признался

Глава Microsoft Сатья Наделла предупредил об опасности «токен-максинга» — бездумного использования мощных AI-моделей для любых задач. «Предельные издержки должны соответствовать стоимости токена», — заявил он. И признался: «Я тоже токен-максер. Это затягивает». 💡 При этом Наделла видит будущее программирования без ручного...

4 дня назад

Google Gemini-SQL2 разгромил конкурентов в тесте перевода текста в SQL

Google Research представила Gemini-SQL2 на базе Gemini 3.1 Pro. Система переводит запросы на естественном языке в SQL для баз данных. В тесте BIRD точность выполнения — 80,04%. У OpenAI GPT-5.5-xhigh — 72,8%, у Anthropic Claude Opus 4.6 — около 70,9%. Databricks, AWS, Tencent и Alibaba отстали сильнее...

5 дней назад

Инструменты ИИ-редактирования фото в iOS 27: работают, но настораживают

В бета-версии iOS 27 Apple добавила в «Фото» три ИИ-функции с облачной обработкой. «Очистка» (Clean Up) аккуратно убирает объекты — она наименее спорная. «Расширение» (Extend) добавляет пространство по краям, но иногда дорисовывает несуществующие детали (например, горшок). Самая мощная — «Пространственная...

5 дней назад

Microsoft и китайские учёные нашли дешёвый способ прокачать LLM через… Markdown

🎯 Метод SkillOpt трактует текстовую инструкцию как «обучаемое состояние» и оптимизирует её по принципам градиентного спуска. Одна модель-оптимизатор анализирует ошибки замороженной целевой модели и вносит точечные правки в Markdown-файл — но только если они проходят проверку на отдельном наборе данных...

5 дней назад

Будущее Голливуда: не просто «скормить промпт» нейросети

На Tribeca показали фильмы с ИИ — и это урок для студий. Пока одни пытаются выжать из Sora целое кино и получают «визуальный шлак», другие делают ИИ инструментом, а не заменой. Короткометражка DeepMind «Dear Upstairs Neighbors» — пример: режиссёр из Pixar не генерировал всё подряд, а художник нарисовал акварельные концепты, нейросеть лишь дорисовывала кадры и анимировала их...

5 дней назад

Claude Fable 5 обходит GPT-5.5 на 13 пунктов в FrontierMath

Anthropic представила Claude Fable 5 с рекордными 87% точности на задачах FrontierMath уровней 1–3 и 88% на уровне 4 (v2). Для сравнения: GPT-5.5 показывает около 75%, а предшественник Opus 4.5 в начале 2026 года едва дотягивал до 10% на четвёртом уровне. Отрыв — 13 процентных пунктов. Все модели тестировались в единых условиях Epoch AI. Прогресс Anthropic за полгода впечатляет: с менее чем 10% до 88% на самом сложном уровне...

5 дней назад

Открытая модель для кодинга, дешевле GPT-5.5 и Claude до 12 раз

Moonshot AI выпустила Kimi K2.7 Code — открытую модель для программирования и агентов. Цена: $0,95 за миллион входных токенов — в 10–12 раз ниже конкурентов. Архитектура MoE с 1 трлн параметров (32 млрд активных), контекст 256K токенов, мультимодальность. На 30% меньше «размышляющих» токенов, есть режим сохранения рассуждений...

5 дней назад

Правительство США требует отключить Fable 5 и Mythos 5

Правительство США предписало Anthropic немедленно заблокировать доступ к моделям Fable 5 и Mythos 5 для иностранцев, ссылаясь на национальную безопасность. Компания выполнила требование, но считает его необоснованным: обнаруженный джейлбрейк узок, и другие модели (включая GPT-5.5) находят те же уязвимости без взлома...

5 дней назад

Google предложила «верную неуверенность

» Исследователи Google представили концепцию «верной неуверенности» — модель может сказать: «Моя лучшая догадка — …». Сейчас борьба с галлюцинациями — жёсткий компромисс: снижение ошибок до 5% отбрасывает 52% правильных ответов. Авторы называют это «налогом на полезность». Новый подход: галлюцинация — это уверенная ошибка, поданная авторитетно...

5 дней назад

OpenAI меняет лимиты Codex, начиная ценовую войну с Anthropic

OpenAI разрешила накапливать сбросы лимита запросов в Codex — их можно тратить когда угодно. Владельцы тарифов Go, Plus, Pro и Business получают по одному бесплатному сбросу сразу. Plus и Pro могут пригласить до трёх друзей — за первое сообщение каждого обе стороны получат ещё один сброс. Разработчики говорят о гибкости, но причина серьёзнее: ценовая война с Anthropic...

5 дней назад

Вдвое дороже, но всего на 5,7% умнее

Anthropic выпустила Claude Fable 5 — лидера рейтинга AI Index с 64,9 балла, обойдя GPT-5.5 на 5 пунктов. Однако инференс стоит $10 за млн входных и $50 за млн выходных токенов — вдвое дороже предшественника Opus 4.8. Полный прогон тестов обходится в $9 940, а прирост производительности — лишь 5,7%. У модели есть слабые места: в тесте на галлюцинации — всего 55%, хотя общая точность знаний высокая...

5 дней назад

Скрыли публикацию

1,0×