Машинное обучение

✔️ SLA2 - Sparse-Linear Attention with Learnable Routing and QAT

Учёные из Tsinghua и UC Berkeley ускорили видеодиффузию в 18,6 раза - без потери качества. В некоторых случаях результат даже лучше. Ключевой результат: - 97% разреженности attention - качество на уровне полного attention - быстрее и дешевле Метод называется SLA2. Главая идея В видеомоделях большая часть вычислений attention просто не нужна. Раньше использовали гибрид: - sparse attention - linear attention Но в этой схеме была скрытая проблема — математическая ошибка. Sparse-ветка была масштабирована неправильно (фактор α), и linear-ветке приходилось компенсировать эту неточность...

12 часов назад

Перед вами релиза за февраль… всего за 19 дней мире

👇 19–20 февраля - Gemini 3.1 Pro** Улучшенное программирование, более сильные агенты, увеличенный контекст. 18 февраля - Google Lyria 3 Генерирует 30-секундные музыкальные треки с вокалом по тексту, изображениям или видео. 17 февраля - Strand-Rust-Coder-14B - модель, заточенная специально под генерациию Rust кода. 17 февраля - Claude Sonnet 4.6 Быстрая модель для программирования и сложного логического рассуждения. 17 февраля - Fujitsu AI Dev Platform Платформа, которая автоматизирует полный цикл разработки программного обеспечения...

12 часов назад

🧠 Новый интересный пост от Андрея Карпаты, вот его вольный перевод

: Очень интересно наблюдать, как будет выглядеть эпоха по-настоящему персонального софта. Сегодняшний пример. Я решил провести эксперимент - снизить пульс в покое с 50 до 45 за 8 недель. План простой - больше минут в Zone 2 и один HIIT в неделю. Через час у меня уже был полностью кастомный дашборд. Claude: - разобрался с облачным API беговой дорожки - вытащил данные - обработал их - сделал веб-интерфейс Да, пришлось поправить баги - перепутал метры и мили, ошибся с календарём. Но главное - всё это заняло 1 час...

12 часов назад

⚡️ Gemini 3.1 Pro - новый уровень интеллекта моделей

⚡️ Gemini 3.1 Pro - новый уровень интеллекта моделей Google официально представила Gemini 3.1 Pro, и результаты выглядят серьёзно: модель показала 77,1% в одном из самых сложных тестов на абстрактное мышление — ARC-AGI-2. - Резкий скачок качества Результат почти в 2 раза выше, чем у предыдущей версии - Обгоняет конкурентов Gemini 3.1 Pro опережает Opus 4.6 и GPT-5.2 в задачах на обобщение и логическое мышление - Сильнее...

1 день назад

📌Большое интервью создателя Claude Code

Y Combinator выложил на Youtube почти часовой выпуск подкаста Lightcone Podcast с Борисом Черным, создателем Claude Code в Anthropic. Мы собрали для вас ключевые темы, цитаты и утверждения. 🟡Философия разработки Стратегия Anthropic при создании инструментов заключается в опережении текущих возможностей ИИ. Главный совет фаундерам: не подстраивайте продукт под ограничения сегодняшних моделей. Стройте его для модели, которая выйдет через полгода. Если сегодня модель глупая, через 6 месяцев она поумнеет, и ваш продукт должен быть к этому готов...

1 день назад

✔️ Claude получил постоянную память - и это меняет экономику работы с агентами

Claude-Mem - open-source инструмент, который даёт Claude постоянную память между сессиями. Главная проблема Claude Code По умолчанию у Claude нет долгосрочной памяти: - каждый запуск - "с чистого листа" - весь контекст нужно передавать заново - растут токены - быстро достигаются лимиты - агент забывает структуру проекта, решения и предыдущие шаги Это делает длительную работу с кодом дорогой и неэффективной. Что делает Claude-Mem Claude-Mem добавляет слой persistent memory: - сохраняет важный контекст между сессиями - восстанавливает знания при следующем...

1 день назад

💰 OpenAI готовится к крупнейшему раунду финансирования в истории AI

OpenAI близка к закрытию первой фазы нового раунда, общий объём которого может превысить $100 млрд. Если условия подтвердятся, оценка компании может вырасти до ~$850 млрд. Что важно в этом раунде Это не классическое финансирование "деньги в обмен на долю". Сделка структурирована как многоэтапный, много-траншевый раунд, где инвестиции идут не только в виде капитала, но и в виде инфраструктуры: - облачные мощности - GPU и ускорители - долгосрочные вычислительные ресурсы То есть партнёры фактически инвестируют compute, а не только деньги...

1 день назад

✔️ CEO Y Combinator поделился своим промптом для Claude Code он показывает, как ИИ можно использовать как senior-инженера, а не просто

✔️ CEO Y Combinator поделился своим промптом для Claude Code он показывает, как ИИ можно использовать как senior-инженера, а не просто генератор кода. С таким подходом он выпускает фичи на 4 000+ строк с полными тестами примерно за час. Что делает этот промпт: Перед написанием кода AI оценивает решение: - не переусложнена ли архитектура - не слишком ли она упрощена - «достаточно ли инженерии» для задачи Затем модель: - тщательно проверяет тесты, edge-cases и сценарии отказа - ищет узкие места...

1 день назад

📌 Microsoft Research и Salesforce показали проблему, о которой редко говорят: диалог резко снижает надёжность LLM

В исследовании протестировали 15 топ-моделей (GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, o3, DeepSeek R1, Llama 4) на 200 000+ симулированных разговоров. Результат: - Один запрос → ~90% качества - Многотуровый диалог → ~65% Важно: дело не в «умности» модели. Способность решать задачи снизилась всего на ~15%. Главная проблема — надёжность: количество ошибок и сбоев выросло на 112%. Почему диалог ломает модели: - Модель начинает отвечать до того, как вы дали полный контекст - Первое неверное предположение...

1 день назад

🌲 Звучит как научная фантастика, но это уже реальность

Учёные разработали инновационный «живой строительный материал» с цианобактериями внутри. Под воздействием солнечного света они поглощают CO₂ и одновременно укрепляют структуру. Фактически - материал, который со временем становится прочнее, используя углекислый газ. Более 400 дней лабораторных испытаний (Nature Communications) показали, что гидрогель на основе этого подхода способен поглощать 26 ± 7 мг CO₂ на грамм...

1 день назад

Вайбкодинг снова пошел не по плану: Claude дал испанцу контроль над 7000+ роботов-пылесосов по всему миру

😱 Вайбкодер просто хотел управлять своим роботом с геймпада PS5 и для реверс-инжиниринга использовал Claude. В итоге, когда его приложение подключилось к серверам DJI — на удивление ответило 7 000 устройств из 24 стран мира. Ему были доступны камеры, микрофоны и даже планировки домов, которые устройства отправляли в облако...

1 день назад

⚡️ Microsoft Research и Salesforce проанализировали 200 000+ диалогов с ИИ и подтвердили то, о чём многие догадывались

Все модели деградируют в длинных диалогах. GPT-4, Claude, Gemini, Llama - без исключений. Чем дольше разговор, тем выше вероятность: - ошибок в фактах - потери контекста - противоречий самому себе - «галлюцинаций» - Почему это происходит Контекст переполняется шумом: старые сообщения, уточнения, исправления. Модель начинает опираться на неточные или устаревшие части диалога — и качество падает...

2 дня назад

07:38