Найти в Дзене
Вячеслав Вареня

Как использовать машинное обучение в SEO-экспериментах

Каждый уважающий себя вебмастер хоть раз в жизни проводил собственный эксперимент. Для этого нужно чётко сформулировать гипотезу, собрать данные, подготовить (очистить) их, провести анализ. Большинство данных я собираю, используя программы Netpeak Checker и Netpeak Spider. Затем приступаю к подготовке данных для анализа. Меняю там, где нужно формат данных, разделители, удаляю строки и столбцы, которые не содержат необходимой информации. Полученные таким образом наборы данных иногда содержат очень много информации и тут на помощь вебмастеру может прийти машинное обучение. Машинное обучение - это применение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования. Машинное обучение позволяет анализировать огромное количество данных. Хотя обычно оно дает более быстрые и точные результаты, для его надлежащей подготовки могут также потребоваться дополнительное время и ресурсы. Сочетание
Оглавление

Каждый уважающий себя вебмастер хоть раз в жизни проводил собственный эксперимент.

Для этого нужно чётко сформулировать гипотезу, собрать данные, подготовить (очистить) их, провести анализ.

Большинство данных я собираю, используя программы Netpeak Checker и Netpeak Spider.

Затем приступаю к подготовке данных для анализа. Меняю там, где нужно формат данных, разделители, удаляю строки и столбцы, которые не содержат необходимой информации.

Полученные таким образом наборы данных иногда содержат очень много информации и тут на помощь вебмастеру может прийти машинное обучение.

Машинное обучение - это применение искусственного интеллекта (ИИ), которое предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта без явного программирования.

Машинное обучение позволяет анализировать огромное количество данных. Хотя обычно оно дает более быстрые и точные результаты, для его надлежащей подготовки могут также потребоваться дополнительное время и ресурсы. Сочетание машинного обучения с искусственным интеллектом и когнитивными технологиями может сделать его еще более эффективным при обработке больших объемов информации.

Я использовал бесплатный инструмент для машинного обучения - BigML в своих последних исследованиях:

Машинное обучение в среде BigML

По моему опыту, в качестве источника данных BigML лучше всего обрабатывает файлы в формате CSV.

Итак, давайте начнём. Откройте BigML и создайте там аккаунт. На закладке Источники (Sources) вы увидите бесплатные источники данных, которые заранее загружены в систему и на которых вы можете потренироваться.

Нажмите на копку с иконкой в виде листа бумаги с плюсиком и добавьте в систему свой набор данных.

Создание источника данных в BigML.
Создание источника данных в BigML.

Создание набора данных в BigML

Как только вы загрузили свой набор данных, можете приступать к следующему этапу – создание набора данных в BigML.

Для этого нажмите на название вашего источника данных. Основные типы данных это цифровые (обозначены как 123) и категории (обозначены как АВС). Если вы заметили, что система неправильно при загрузке распознала ваши данные (присвоен не тот тип), нажмите на иконку в виде боченка со звездочкой. BigML после этого откроет вкладку для конфигурации в которой вы сможете внести все необходимые исправления. Затем нажмите на кнопку Update.

Создание набора данных в BigML.
Создание набора данных в BigML.

После этого, в источнике нажмите на кнопку в виде облака с молнией и там вам нужно выбрать вкладку «1-CLICK DATASET».

BigML на основе вашего источника данных создаст набор данных для анализа в системе.

Машинное обучение данных

Войдите в созданный набор данных и нажмите на кнопку в виде гистограммы с шестеренкой и в открывшемся меню нужно выбрать TRAINING|TEST SPLIT.

Машинное обучение данных в BigML.
Машинное обучение данных в BigML.

BigML разделит ваш набор данных на две части обучаемую (80%) и базовую (20%). Когда это будет сделано нажмите на новый обучаемый набор данных (80%) и создайте модель.

Для этого нажмите на уже знакомую для вас кнопку в виде облака с молнией. В открывшемся меню нужно выбрать Модель (Model).

Создание модели в BigML.
Создание модели в BigML.

BigML создаст дерево решений, которое позволит вам получить интересные результаты для ваших выводов.

Дерево решений в BigML.
Дерево решений в BigML.

Это первая из цикла статей публикация, посвященная поисковой оптимизации и машинному обучению.