Найти в Дзене
Нейро Арт

Мой (не)удачный опыт использования нейросетей.

Привет! Хочу поделиться своей историей о том, как я пытался использовать нейросети для работы с каталогом товаров. Спойлер: всё пошло не так, как я планировал, но в итоге я вынес из этого кучу полезных уроков. Если вы тоже думаете, что нейросети — это универсальный ключ ко всем проблемам, то эта история точно для вас. Всё началось просто: мне нужно было вытащить данные из каталога товаров на каком-то сайте. Задача казалась стандартной — парсинг сайтов делают многие, и я решил попробовать "по-современному". Вместо того чтобы писать скрипт или использовать специальные инструменты, я подумал: "А почему бы не поручить это нейросети? Она же умная!" Эксперимент я проводил на трех модных нейронках - Qwen 2.5, DeepSeek и ChatGPT. Сперва попробовал скормить им адрес страницы, в надежде, что они умеют ходить в интернет. Но этот способ не сработал, т.к. все нейронки при включенном "WebSearch" работали с результатом поиска, а не с конкретной страницей. Сперва я сохранил всю страницу целиком и скор
Оглавление

Привет! Хочу поделиться своей историей о том, как я пытался использовать нейросети для работы с каталогом товаров. Спойлер: всё пошло не так, как я планировал, но в итоге я вынес из этого кучу полезных уроков. Если вы тоже думаете, что нейросети — это универсальный ключ ко всем проблемам, то эта история точно для вас.

Вроде Easy...

Всё началось просто: мне нужно было вытащить данные из каталога товаров на каком-то сайте. Задача казалась стандартной — парсинг сайтов делают многие, и я решил попробовать "по-современному". Вместо того чтобы писать скрипт или использовать специальные инструменты, я подумал: "А почему бы не поручить это нейросети? Она же умная!"

Эксперимент я проводил на трех модных нейронках - Qwen 2.5, DeepSeek и ChatGPT. Сперва попробовал скормить им адрес страницы, в надежде, что они умеют ходить в интернет. Но этот способ не сработал, т.к. все нейронки при включенном "WebSearch" работали с результатом поиска, а не с конкретной страницей.

Попытка №2: работаем с HTML-кодом

Сперва я сохранил всю страницу целиком и скормил нейронкам как файл html. Увы, разочарование ждало меня и здесь. Мне нужно было обработать около 60 товаров, но ни одна нейронка ни разу не сгенерировала таблицу со всеми строками. То ли они ленятся, то ли не умеют выводить длинный ответ, но каждая хитрила по своему.

Иногда в качестве ответа выдавали только первые строки, иногда первые несколько выводили верно, а остальные фантазировали "от балды".

Я решил упростить задачу и скормил нейросетям уже отдельный фрагмент html, в виде текстового файла. Но там началось еще интереснее. ChatGPT вдруг перестал понимать, что там есть html разметка, и решительно отвечал, что ни тегов, ни атрибутов там нет, и вообще, отстань от меня, кожаный. А Qwen вместо реальных адресов картинок вставил пустышки "another_img1", "another_img2" и так далее. DeepSeek вел себя похожим образом.

Grep вашу мать

В конце концов я плюнул на это дело, и полез в bash. Написал несколько grep команд, выдрал нужные мне фрагменты и вставил в эксель. Там уже дело пошло веселее. До полного счастья мне оставалось только вставить картинки по уже известному адресу (адреса картинок я тоже вытащил в виде текста).

Самым быстрым решением мне показалось написать какой-нибудь макрос, который в эксель вставит картинки, скачав их из интернет. И вот тут-то нейросети мне и помогли по-настоящему.

Макросы спешат на помощь

Сформулировав запрос, я отправился к нейросетям за подсказками. На этот раз не пришлось перебирать все варианты, Qwen 2.5 Max прекрасно справился с задачей, написал мне нужный макрос, популярно объяснил как им пользоваться , и как адаптировать под свои данные. Вставив макрос в Excel-таблицу, я уже через пару минут получил вставленные в ячейки картинки.

Потом, конечно, пришлось немного повозиться, чтобы эти картинки вставлялись нужного размера и в нужную колонку, но это уже прям совсем мелочи.

Какие выводы я сделал из этой истории?

  1. Нейросети — это не волшебная палочка. И не серебряная пуля. Они действительно мощные, но не всесильные. Иногда старые добрые методы, такие как парсинг с помощью скриптов или использование макросов, работают лучше.
  2. Не все задачи подходят для нейросетей. Если задача слишком сложная или плохо структурирована, нейросеть может запутаться. Лучше начинать с чего-то простого и постепенно усложнять.
  3. Важно учитывать размер контекста и размер выходных данных. слишком большой ответ нейронки пока не тянут - пытаются отвечать сжато, обрывают ответ на середине или вообще начинают троить. Иногда помогает явно сказать нейросети - анализируй таблицу с 20 по 40 строки. Тогда выше шансы, что она не пропустит данные.
  4. Гибридный подход — это здорово. Хотя нейросети не справились с основной задачей, они помогли мне написать макросы. То есть, даже если что-то не работает напрямую, это не значит, что оно бесполезно.
  5. Технологии — это инструменты, а не чудо. Чтобы получить хороший результат, нужно понимать, как они работают, и правильно выбирать задачи. Нейросети — это не замена человеческого мышления, а дополнение к нему.

Главное - не бояться экспериментировать, и как говорилось в мультике "Лучше день потерять, потом за пять минут долететь".

Так что, если вы тоже хотите попробовать что-то новое, дерзайте! Только помните: не всё нужно решать в лоб, и слона нужно есть по частям. Большую сложную задачу пробуйте разбивать на части, и уже отдельные подзадачи решать при помощи нейросетей.