844 читали · 3 года назад
Крупнейшие датасеты для машинного обучения
Огромный набор датасетов, которые вы можете скачать и начать пользоваться прямо сейчас. @bigdatai - еще больше открытых размеченных датасетов в нашем телеграм канале. Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning) Рост населения датасет News Articles — содержит атрибуты новостной статьи. Satellite Photograph Order — набор данных спутниковых фотографий Земли — цель состоит в том, чтобы предсказать, какие фотографии были сделаны раньше других...
Как создать свою нейросеть: пошаговое руководство
Язык программирования: Python (стандарт для машинного обучения). Ключевые библиотеки: Среда разработки (на выбор): Где взять данные: Этапы подготовки: Выбор зависит от задачи: Пример простой архитектуры (Keras): model = keras.Sequential([ keras.layers.Dense(128, activation='relu', input_shape=(input_dim,)), keras.layers.Dropout(0.3), keras.layers.Dense(64, activation='relu'), keras.layers.Dense(num_classes, activation='softmax') ]) Шаги: Метрики (в зависимости от задачи): Тестирование на test‑выборке: python test_loss, test_accuracy = model...
3 года назад
Python, анализ данных Steam
Доброго времени суток! В этой статье будем проводить анализ данных, с помощью библиотеки pandas для python, а также библиотеки numpy и matplotlib. Итак, для анализа я взял данные по сервису Steam. Файл с данными в формате csv я скачал с сайта https://www.kaggle.com. В этом файле собраны даты выхода игр, их оценка Metacritic, рекомендации пользователей, а также данные по жанрам и ценам. Ещё есть отдельный столбец, в котором указано бесплатная игра или нет, с него мы и начнём. Для начала импортируем нужные библиотеки import pandas as pd import numpy as np import matplotlib...