19 подписчиков

Релиз обновленной Claude 3.5 Sonnet и функция Computer Use

8 марта8 мар

3 мин

Давайте будем честными: мы все ждали того момента, когда ИИ перестанет просто «советовать» и начнет наконец-то «делать». Мечта о цифровом дворецком, который сам заполнит скучные таблицы, перенесет данные из CRM в Trello или оформит за вас возврат билетов, всегда казалась делом далекого будущего. Но, похоже, будущее решило наступить на пару десятилетий раньше. Anthropic выкатили обновление своей модели Claude 3.5 Sonnet, и главная фишка здесь не в текстах или коде, а в функции Computer Use. Если коротко: Claude теперь умеет смотреть на экран вашего компьютера так же, как это делаете вы. Она видит иконки, окна, кнопки и текстовые поля. Но самое впечатляющее — она может двигать курсором, кликать и печатать текст. Это не просто интеграция через API с каким-то конкретным сервисом. Это универсальный навык управления любым интерфейсом. По мнению экспертов, это фундаментальный сдвиг. До этого момента ИИ был заперт в своей «песочнице» чат-бота. Чтобы он что-то сделал во внешнем мире, разработчи

Оглавление

Что вообще произошло?
Как это работает под капотом?
Почему сообщество разработчиков в экстазе?

Что вообще произошло?

Если коротко: Claude теперь умеет смотреть на экран вашего компьютера так же, как это делаете вы. Она видит иконки, окна, кнопки и текстовые поля. Но самое впечатляющее — она может двигать курсором, кликать и печатать текст. Это не просто интеграция через API с каким-то конкретным сервисом. Это универсальный навык управления любым интерфейсом.

По мнению экспертов, это фундаментальный сдвиг. До этого момента ИИ был заперт в своей «песочнице» чат-бота. Чтобы он что-то сделал во внешнем мире, разработчикам приходилось писать сложные костыли и интеграции. Теперь Claude просто берет «виртуальную мышку» и идет работать.

Как это работает под капотом?

Механика процесса одновременно проста и гениальна. Модель делает скриншоты экрана с высокой частотой, анализирует их, высчитывает координаты нужных кнопок и отправляет команды на перемещение курсора или нажатие клавиш.

Представьте, что вы просите Claude: «Найди в моей почте письмо от бухгалтерии за прошлый месяц, выпиши все суммы в Excel и построй график».

Раньше ИИ мог только подсказать, как это сделать. Теперь сценарий выглядит так:

Claude открывает браузер.
Заходит в почту, вбивает поисковый запрос.
Считывает данные из писем.
Параллельно открывает таблицу и аккуратно вносит цифры.
Сама нажимает «Сохранить».

По исследованиям специалистов, точность таких действий пока не идеальна, но она уже достаточна для автоматизации сотен рутинных процессов, на которые мы раньше тратили часы жизни.

Почему сообщество разработчиков в экстазе?

Для тех, кто пишет код, это как переход от ручной стирки к стиральной машине-автомату. Раньше для автоматизации тестирования сайтов нужно было писать огромные скрипты на Selenium или Playwright. Теперь можно просто сказать модели: «Проверь, работает ли регистрация на моем сайте, и если выскочит ошибка — заскринь и отправь в Slack».

Мнение экспертов сходится в одном: мы видим рождение категории «AI-агентов». Это уже не просто инструмент, а полноценный цифровой сотрудник. В первых тестах Claude уже справлялась с задачами по программированию, где нужно было не только написать код, но и самостоятельно его запустить, проверить ошибки в терминале и поправить их.

Опасения и безопасность

Конечно, когда ИИ получает доступ к управлению компьютером, у многих пробегает холодок по спине. Что, если она случайно удалит системную папку или отправит странное письмо начальнику? Anthropic понимает эти риски. Функция Computer Use сейчас находится в режиме публичного бета-тестирования, и компания внедрила жесткие фильтры.

Например, модель обучали игнорировать попытки социального инжиниринга или действия, связанные с созданием вредоносного ПО. Тем не менее, по исследованиям специалистов в области кибербезопасности, пользователям всё равно стоит сохранять бдительность и использовать для таких экспериментов изолированные среды или виртуальные машины.

Что изменится для нас с вами?

В ближайший год мы увидим взрыв новых приложений. Появятся персональные ассистенты, которые будут жить прямо у вас в трее и помогать с повседневной рутиной.

Маркетологи смогут поручить ИИ сбор аналитики из пяти разных кабинетов в один отчет.
Дизайнеры — поиск и сортировку референсов в папках.
Менеджеры — автоматическое заполнение отчетов на основе переписки.

Главное, что Claude 3.5 Sonnet стала умнее во всех аспектах. Она лучше пишет код (по тестам она обходит даже GPT-4o в некоторых дисциплинах) и быстрее соображает. Но возможность «нажать на кнопку» — это тот самый мостик, которого не хватало для полной интеграции ИИ в нашу жизнь.

Итог

Мы входим в эру, где взаимодействие с компьютером перестает быть процессом «клик-клик-печать». Мы переходим к уровню постановки задач. Вместо того чтобы учить горячие клавиши в Photoshop или сложные формулы в таблицах, мы будем просто описывать результат.

Claude 3.5 Sonnet — это первый серьезный шаг к тому, чтобы компьютер наконец-то стал по-настоящему персональным помощником, а не просто сложным инструментом в наших руках. И если вы еще не попробовали этот функционал через API — сейчас самое время. Будущее уже здесь, и оно активно двигает вашим курсором.

Гаджеты и электроника

5,73 млн интересуются