124 читали · 1 год назад
Крупнейшие датасеты для машинного обучения
Огромный набор датасетов, которые вы можете скачать и начать пользоваться прямо сейчас. @bigdatai - еще больше открытых размеченных датасетов в нашем телеграм канале. Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning) Рост населения датасет News Articles — содержит атрибуты новостной статьи. Satellite Photograph Order — набор данных спутниковых фотографий Земли — цель состоит в том, чтобы предсказать, какие фотографии были сделаны раньше других...
266 читали · 1 год назад
Подготовка диалоговых датасетов для рекуррентной нейросети на Python
1)Первое, что нужно сделать это найти нужный нам датасет диалогов. Есть сайт где можно найти множество любых датасетов - это Hugging Face 2)На главной странице в правом верхнем углу будет Datasets("Датасеты") жмём на неё на этой вкладке будут датасеты для разных нейросетей , но нам нужен датасет диалогов , поэтому слева в фильтрах выбираем Conversational("Разговорный, диалоговый") там будут разные языки , но если вы хотите выбрать нужный вам язык , то просто в фильтрах добавьте тот язык, который вам будет нужен. После скачивания датасета на компьютер надо перенести данные из нейросети я выбрал...