Найти в Дзене
Выполняем заказ на фрилансе 1.1
Есть вот такой заказ и необходимо спарсить данные с сайта OZON, я решил действовать следующим образом: На данном этапе я написал парсер городов РФ и собрал их в json и csv файл. Коротко о коде: В классе city метод get_data возвращает список после сбора информации с сайта и ее фильтрации по black_list. Метод save_list сохраняет полученный лист в csv в json. Чтобы сохранить кириллицу в json, используйте данный кусок кода...
3 года назад
Как я создавал бота для продвижения резюме на HH
Однажды, всем приходится работу и ваш покорной судья не был исключением. Тогда я решил связаться с HH, опубликовал пару резюме, и обнаружил, что резюме можно поднимать раз 4 часа, но делать это можно в ручную мне это крайне не понравилось, поэтому я решил написать бота. Я использовал библиотеку selenium и сервис pythonanywhere. В pythonanywhere вы просто прописывайте какой файл запустить и он крутиться на сервере. mkdir - команда создания папки. cd - переход по папкам. На всякий случай это нужно прописать: pip3...
306 читали · 3 года назад
Датасеты и машинное обучение
Когда начинаешь свой путь в освоение инструментов машинного обучения/анализа данных не понятно, где взять данные. Давайте решим эту проблему. 1. Датасеты sklearn Для начала необходимо установить библиотеку scikit-learn c помощью команды: pip install scikit-learn. С помощью нее мы можем получить данные для анализа sklearn.datasets.[name_of_library]. Еще одна полезная функция sklearn, это разделение датасета на тренировочную и тестовую выборку. from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y,stratify=y,test_size=0...
3 года назад