Аудит сайта - как спарсить сайт. Как провести технический аудит сайта с помощью Netpeak Spider
Как спарсить любой контент сайта с помощью Google Таблиц Сегодня расскажу о полезных функциях, которые сильно упрощают работу
Как спарсить любой контент сайта с помощью Google Таблиц
Сегодня расскажу о полезных функциях, которые сильно упрощают работу с сайтами и информацией.
Например, у нас есть список урл и нужно по каждому вытянуть тайтл или описание. Открываем гугл таблицы, и в ячейке пишем следующую формулу
=IMPORTXML(url, "//title")
Вместо url подставляем адрес страницы. Если у вас вся колонка в адресах, то в формуле прописываем вместо url адрес каждой ячейки. (смотри скриншот)
Вместо //title можно ставить //h1, //h2, //description Тогда будет подтягиваться соотвествующая инфа.
Если нужно сделать что-то более сложное, то тут нужно уже смотреть стили сайта и прописать в формуле путь или атрибуты стиля...
Как парсить сайт - инструкция «для чайников»
Парсинг нужен, чтобы получить с сайтов открытую информацию. К примеру, цены, фотографии или полностью каталог товаров. Для этой задачи нужны специальные инструменты.
Расскажем о том, как спарсить информацию...