Добавить в корзинуПозвонить
Найти в Дзене
Полезные IT советы

Простой и бесплатный парсер сайта

Сегодня хочу поговорить о простом и бесплатном парсере. Он поможет Вам быстро собрать небольшой объем данных с текущей страницы. Это не отдельная программа, а так сказать парсер расширение для Хрома. Называется это дополнение Scraper. Скачать его можно по ссылке. Хоть он и не обновляется с 2015 года, но поверьте, он часто может Вас выручить, когда нужно собрать данные за 1 минуту. Правда интересно? Давайте сразу попрактикуемся. Бесплатный парсер ключевых слов с Вордстат (Wordstat) Например, Вам нужно быстро подобрать ключи по запросу "пластиковые окна" по Москве и области. P.S не забудьте скачать дополнение! Поехали! Видим результат: https://wordstat.yandex.ru/#!/?regions=1&words=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5%20%D0%BE%D0%BA%D0%BD%D0%B0 И видим замечательный результат нашей работы Теперь Вы можете скопировать данные в буфер обмена или загрузить на Гугл диск. Если Гугл таблицы Вам не нужны, то просто копируйте и потом открывайте Excel или Calc и вс
Оглавление

Сегодня хочу поговорить о простом и бесплатном парсере. Он поможет Вам быстро собрать небольшой объем данных с текущей страницы. Это не отдельная программа, а так сказать парсер расширение для Хрома.

Называется это дополнение Scraper. Скачать его можно по ссылке.

Хоть он и не обновляется с 2015 года, но поверьте, он часто может Вас выручить, когда нужно собрать данные за 1 минуту. Правда интересно? Давайте сразу попрактикуемся.

Бесплатный парсер ключевых слов с Вордстат (Wordstat)

Например, Вам нужно быстро подобрать ключи по запросу "пластиковые окна" по Москве и области.

  • Заходите на Вордстат
  • Выбираете регион
  • Вводите ключ

P.S не забудьте скачать дополнение! Поехали!

Видим результат: https://wordstat.yandex.ru/#!/?regions=1&words=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5%20%D0%BE%D0%BA%D0%BD%D0%B0

  • Выделяем мышкой два заголовка таблицы с ключами "Статистика по словам" и "Показов в месяц". Только выделяйте четко по словам, чтобы не захватить лишнее.
  • Нажимаем правой кнопкой мыши на любом выделенном столбцеи в контекстном меню выбираем "Scrap similar", как показано ниже на скриншоте
Бесплатный парсер ключевых слов с Вордстат
Бесплатный парсер ключевых слов с Вордстат

И видим замечательный результат нашей работы

Бесплатный парсер WordStat
Бесплатный парсер WordStat

Теперь Вы можете скопировать данные в буфер обмена или загрузить на Гугл диск. Если Гугл таблицы Вам не нужны, то просто копируйте и потом открывайте Excel или Calc и вставляйте. Данные прекрасно переносятся.

Парсим ссылки с карты сайта (sitemap.xml)

Ранее, я уже рассказывал, как можно собрать ссылки с сайта через карту сайта с помощью Datacol, и дальше уже собирать нужные нам данные.

В этом примере рассмотрим, как можно быстро взять ссылки с карты сайта и затем их использовать как стартовые, для начала полноценного парсинга.

Возьмем к примеру, карту сайта для категорий с моего сайта, перейдем на нее и нажмём правойкнопкой мыши на первой ссылке

Парсим ссылки с карты сайта
Парсим ссылки с карты сайта

И получаем список ссылок

-4

Собираем ссылки с меню

Также возьмем в пример рассмотренную ранее статью по сбору URL из меню.

Перейдем на офф сайт Дататкола, выбираем меню Решения и далее правой кнопкой мыши на первом пункте меню "ПАРСЕРА ИНТЕРНЕТ МАГАЗИНОВ" и "Scrap similar".

Собираем ссылки с меню
Собираем ссылки с меню

Получаем ссылки на разделы меню решения + их заголовки

Собираем ссылки с меню сайта
Собираем ссылки с меню сайта

Это только некоторые примеры использования этого расширения. И одно замечание, не всегда возможно корректное автоматическое определение xpath, поэтому желательно чтобы Вы немного ориентировались в его подборе и также работе с инструментом разработчика в браузере, чтобы можно было подобрать значения.

Также хочу отметить, что этот простой парсер сайта и годится он для простых и средних задач и данных которые находятся на одной странице. Если Вам нужен полноценный парсер, тогда используйте проверенный Datacol.

И напоминаю, что по моей партнерской ссылке Вы получите 20% скидки на любой тариф, при покупке Датакол. Например, годовая лицензия будет стоить 4400руб. вместо 5500р.