Найти в Дзене
Заметки Dewiar AI

Новый ИИ-кодер Sonic, голосовые агенты и битва человек vs машина: дайджест для разработчиков

Оглавление

Sonic: засекреченная модель для кодогенерации взламывает инструменты разработки

В Cursor, Cline и других средах появилась новая модель Sonic - предположительно, это Grok-4 Code от xAI (Илон Маск). Хотя официального анонса не было, разработчики уже отмечают её скорость и качество генерации кода.

Что это значит для рынка?

  • Конкуренция между GitHub Copilot, Amazon Q Coder и новыми игроками обостряется.
  • Скрытое тестирование моделей в реальных продуктах становится трендом - так компании собирают данные перед релизом.

Google и редактирование фото через чат: ИИ проникает в мобильные устройства

На ивентe Pixel Google анонсировал:

  • Редактирование фото в Google Photos через текстовые запросы (а̀ la ChatGPT).
  • Gemini Live с расширенными возможностями:
    Подсветка элементов на экране в видео-режиме.
    Интеграция с приложениями.
    Анализ настроения пользователя.

Тренд: ИИ становится «невидимым» — встраивается в повседневные инструменты без необходимости открывать отдельные приложения.

Open-source против проприетарных моделей: Qwen догоняет лидеров

Модель Qwen-Image-Edit (open-source) практически сравнялась в качестве с топовой проприетарной Flux Kontext (по данным лидербордов). Разработчики начинают массово переходить на Qwen через платформы вроде Fal и Replicate.

Почему это важно?

  • Снижение зависимости от закрытых API.
  • Рост качества open-source решений ускоряет инновации.

Голосовые агенты и CRM: как ИИ меняет бизнес-процессы

  • ElevenLabs добавила текстовый режим для голосовых агентов - теперь можно тестировать сценарии без озвучки.
  • Attio (AI-native CRM) автоматически строит CRM из вашей почты и календаря, обогащая данные об компаниях и контактах.

Для кого актуально?

  • Стартапы и растущие команды (примеры: Granola, Flatfile, Modal).
  • Компании, которые хотят автоматизировать продажи и поддержку.

Hackathon «Человек vs Машина»: кто пишет код лучше?

Портфельная компания Factory проводит хакатон в SF (6 сентября), где:

  • Половина участников работает без ИИ.
  • Другая половина использует любые модели и агентов.

Зачем это нужно?

  • Проверить, насколько ИИ реально ускоряет разработку.
  • Выявить сценарии, где человек пока незаменим.

Мы, в свою очередь, уже плотно используем ИИ на всех стадиях написания кода и реализации проектов. Как показала наша практика, это ускоряет работу в 3 и более раз.

Инструменты недели: от генерации UI до голосовых агентов

  1. Pond.computer - стриминг UI-компонентов (не только текста) из LLM.
  2. Sierra Simulations - тестирование агентов через диалоги с mock-пользователями.
  3. Magic Path - генерация UI в реальном времени (смотрите демо от основателя).
  4. Firecrawl V2 - скрейпинг в 10 раз быстрее + удобный playground.
  5. Blue - голосовой ассистент для управления всеми приложениями телефона.
  6. Electric Sheep - автономный видео-редактор: превращает сырые материалы в готовые ролики через чат.
  7. LiveKit Cloud - лёгкое развёртывание голосовых агентов без инженерной головной боли.

Тренд: Инструменты становятся более специализированными, но при этом проще в интеграции.

Для разработчиков: MCP, Warp и самохостинг

  • AGENTS.md - открытый формат для руководства кодогенераторами (используется в Factory AI).
  • Warp лидирует в Terminal Bench - новый стандарт для разработчиков.
  • RenderGit (от Капрэти) - рендер Git-репозиториев в единый HTML-файл для людей или ИИ.
  • Self-host на Replit - развёртывание N8N-воркфлов за 5 минут.

Инвестиции и перспективы

  • Zed (редактор кода) привлёк $32M Series B - планируют интегрировать Git с ИИ.
  • Perplexity работает над SuperMemory - долгосрочной памятью для пользователей.

Выводы от Dewiar AI

  1. ИИ для кода становится commodity - борьба идёт за скорость и интеграцию.
  2. Open-source догоняет проприетарные решения в нишевых задачах (например, редактирование изображений).
  3. Голосовые агенты - следующий рубеж, но пока нет единого стандарта.