13,7K подписчиков
Источник: Nuances of Programming Без чего нельзя обойтись в датасайенс-проекте? Конечно, без данных! Именно об этом пойдет речь в сегодняшней статье. Мы поделимся с вами 14 датасетами, которые можно использовать для анализа данных и их визуализации, классификации текстов/изображений, создания системы рекомендаций и многого другого. Анализ данных Работать с наборами данных, перечисленными в этом разделе, можно с помощью Pandas и Numpy. Exam Scores Набор данных Exam Scores содержит оценки учащихся...
2 года назад
9,3K подписчиков
С этой научитесь приемам импорта данных различных форматов с помощью Pandas с помощью нескольких строк кода. Мы будем учиться импортировать базы данных SQL, листы Excel, таблицы HTML, CSV и файлы JSON на примерах. Pandas - это простой в использовании инструмент анализа данных с открытым исходным кодом, который широко используется в аналитике данных, инженерии данных, науке о данных и машинном обучении. Он поставляется с мощными функциями, такими как очистка и манипуляции с данными, поддержка популярных форматов данных и визуализация данных с помощью matplotlib...
2 года назад
13,7K подписчиков
Источник: Nuances of Programming Библиотека Python Pandas и язык структурированных запросов (SQL)  —  основные инструменты в арсенале специалиста по анализу данных. Хотя Pandas  —  мощный инструмент для работы с данными, многие специалисты с той же целью предпочитают использовать SQL. В этой статье будет рассказано, как выполнять манипуляции с данными в Pandas Dataframe, используя SQL с применением библиотеки pandasql. Что такое Pandasql? Pandasql  —  это библиотека Python, которая позволяет обрабатывать датафреймы Pandas с помощью SQL...
2 года назад