Vision-Language модели (VLM) кардинально расширяют границы автоматизации тестирования — особенно там, где плохо справляются традиционные инструменты. Canvas, SVG, динамически генерируемые элементы, сложные графические интерфейсы: все это остается «слепыми зонами» для классических фреймворков, привязанных к DOM-структурам и статическим селекторам. Но для моделей это не проблема. Они не читают HTML — они смотрят на экран, как это делает пользователь. Мы решили проверить, насколько эффективно VLM справится с автоматизацией тестирования интерактивных карт. В нашем кейсе модель работала с Яндекс.Картами, выполняя полноценный сценарий: На скриншоте показан интерфейс платформы BugBuster — инструмента для автоматизации UI-тестирования с использованием Vision-Language моделей. Тест описан на естественном языке без использования кода или селекторов. В шагах указано, как пользователь должен взаимодействовать с интерфейсом. Ожидаемые результаты отмечены желтыми «лампочками». Модель успешно выполни
Как Vision-Language модель тестирует интерактивные карты без кода
21 августа 202521 авг 2025
6
1 мин