Найти в Дзене
Aaz Blog

ИИ в QA: Когда нейросети заменят тестировщиков? (Спойлер: Никогда)

Часто слышу от тех кто хочет перейти в IT из других сфер, что "поезд ушёл", нейросети заменят тестировщиков. Причём нас (тестировщиков) так вообще самых первых. Что ж, как человек, который последние полгода+ с упорством маньяка пытался заставить разные нейросети писать сложные тест-кейсы, заявляю: расслабьтесь, ребята. Ваши кресла в безопасности. Если нейросеть и сможет отнять работу у IT-шников, то тестировщики будут последними, кого ИИ подвинет. Примеров конкретных дать не смогу, так как у нас финтех и секретность, но постараюсь описать так, что бы было понятно. =) Я скармливал моделям сотни готовых кейсов, ТЗ, спецификации. Контекст достигал диких 1 000 000 токенов (упёрся в ограничение нейросети гугла, контекста больше пока не попадалось)! И что? Результат — полный провал в стилистике. Нейросеть генерирует текст, который кричит «меня писала машина!». Она не улавливает нюансы, наш корпоративный сленг, уровень детализации. Каждый кейс приходится переписывать вручную. Трудоёмкость — а
Оглавление

ИИ в QA
ИИ в QA

Вступление

Часто слышу от тех кто хочет перейти в IT из других сфер, что "поезд ушёл", нейросети заменят тестировщиков. Причём нас (тестировщиков) так вообще самых первых. Что ж, как человек, который последние полгода+ с упорством маньяка пытался заставить разные нейросети писать сложные тест-кейсы, заявляю: расслабьтесь, ребята. Ваши кресла в безопасности. Если нейросеть и сможет отнять работу у IT-шников, то тестировщики будут последними, кого ИИ подвинет.

Примеров конкретных дать не смогу, так как у нас финтех и секретность, но постараюсь описать так, что бы было понятно. =)

1. Контекст? Нет, не слышали

Я скармливал моделям сотни готовых кейсов, ТЗ, спецификации. Контекст достигал диких 1 000 000 токенов (упёрся в ограничение нейросети гугла, контекста больше пока не попадалось)! И что? Результат — полный провал в стилистике. Нейросеть генерирует текст, который кричит «меня писала машина!». Она не улавливает нюансы, наш корпоративный сленг, уровень детализации. Каждый кейс приходится переписывать вручную. Трудоёмкость — адская, а выхлоп — на уровне джуна, который вчера узнал, что такое QA.

Абсурд в деталях: Однажды я скормил нейросети два ТЗ по 200-300 листов каждый и пример смок-чека на 2000 строк. Промт был не простой, сводился к: «Сделай на их основе такой же чек-лист». А в ответ я получил два десятка абстрактных абзацев про «принципы тестирования» на уровень школьного реферата. Ноль конкретики, ноль пользы.

2. Декомпозиция ТЗ — не для машинного ума

На примере смока для теста общего функционала по ТЗ, живой тестировщик не тыкается в него как слепой котёнок. Он:

  • Декомпозирует его, выписывая блоки группами.
  • Собирает в кучу функционал одной формы, раскиданный по разным уголкам документа.
  • Строит беглый план — что и в каком порядке тестировать.

Нейросеть же видит просто «много текста». Она не понимает, что смоук — это проверка базового функционала, а не попытка проверить все 30 полей формы поиска за раз со всеми вариантами пересечений, даже наличие в промте "используй принцип попарного тестирования" не сильно спасает. Она не догадается, что кнопки «Закрыть», «Нет» и «Отмена» нужно тыкать до заполнения полей. У неё нет чувства тактической целесообразности.

3. Системное мышление — наш козырь

Вот реальный случай из практики: в 6 разных местах приложения вроде бы была одна и таже форма «Вложения». На деле — это были кривые клоны. Отдавай баг разрабам, они чинили его в одной, но не чинили его в остальных пяти. Живой тестировщик, найдя косяк в своей зоне, проверит все известные ему клоны и в баге чётко укажет: «Воспроизводится там-то и там-то, а там-то — нет». Это помогает разработчикам быстро найти рабочий код для примера.

ИИ на такое не способен. Он не видит систему как паутину связей. Он видит только тот кусок, который ему скормили.

4. Логика и интуиция там, где ИИ пасует

Нейросеть не поймёт, почему из-за запуска импорта файлов сбивается курс доллара на всём сайте. А живой тестировщик докопается: по какой-то непонятной причине на время выгрузки цены считаются по курсу 1=1, а когда импорт завершается цены пересчитываются по курсу верно (оказалось что приоритет у обработчика импорта ставил на паузу обработчик конвертации валют). ИИ не найдёт баг, когда при выборе в одном списке, потом втором, и снова в первом - второй список просто целиком слетает со страницы. Это требует построения причинно-следственных цепочек, на которые ИИ пока не способен.

5. Философия Мёрфи — наше всё

Главное оружие тестировщика — не знания SQL, а философия Мёрфи в её шуточной, но абсолютно практической форме: «Всё, что может сломаться, — сломается. И именно самым дурацким и неочевидным способом».

Мы ищем баги, потому что параноидально уверены: они есть. Мы проверяем то, что «и так работает». Мы не верим ТЗ, не верим разработчикам, не верим даже самим себе. ИИ же не обладает этой здоровой паранойей. Он не может позволить себе предположить, что всё пойдёт наперекосяк самым идиотским образом.

🚀 Так зачем он тогда нужен? (Костыль для уставшего мозга)

Списать нейросети со счетов — глупо. Они — мощные ассистенты, но не замена. Идеально справляются с рутиной:

  • Конвертация данных: Превратить таблицу с описанием полей в типовые шаги — легко.
  • Генератор идей: Помогает сформулировать шаги, когда мозг уже «выкипел».
  • Проверка консистенции: Сравнить заголовки в таблице с требованиями — запросто.
  • Скриптовый кодло-генератор: Написать заготовки для автотестов или оптимизировать таблицы — её стезя.

Вывод

Нейросеть в QA сегодня — это стажёр-переросток, который не понимает сути работы, но умеет быстро копировать таблицы в Excel. Он может взять на себя рутину, но не может думать, анализировать, сомневаться и нести ответственность.

Пока нужны системное мышление, здоровая паранойя и умение тыкать носом в ТЗ — «кожаные» тестировщики останутся незаменимыми. А ИИ... пусть пока таскает за нами ящики с инструментами.

А вы сталкивались с попытками внедрить ИИ в ваш QA-процесс? Делитесь в комментариях — посмеёмся вместе!