900 читали · 3 года назад
5 различных способов загрузки данных в Python
Данные - это хлеб с маслом для специалиста по анализу данных, поэтому знание многих подходов к загрузке данных для анализа имеет решающее значение. Здесь рассматриваются пять методов Python для получения данных с примерами кода, которые вы можете использовать. Как новичок, вы можете знать только один способ загрузки данных (обычно в формате CSV), который заключается в чтении их с помощью функции pandas.read_csv. Это одна из наиболее популярных и простых функций, но и другие способы очень полезны и, безусловно пригодятся...
2 года назад
Как разбить текст на абзацы с помощью Python
Источник: Nuances of Programming В этой статье будет представлен подход, использованный мной в проекте, посвященном реферированию подкастов. Корректное реферирование текста всегда начинается с разделения его на смысловые части  —  абзацы. Общий подход Нам предстоит превратить текст в нечто понятное машине, т.е. в векторы. В практике обработки естественного языка векторное представление текста называется эмбеддингом (встраиванием). Есть два способа его проведения. Второй вариант реализуется быстрее и позволяет достичь приемлемых результатов...