13,7K подписчиков
Источник: Nuances of Programming В этой статье будет представлен подход, использованный мной в проекте, посвященном реферированию подкастов. Корректное реферирование текста всегда начинается с разделения его на смысловые части  —  абзацы. Общий подход Нам предстоит превратить текст в нечто понятное машине, т.е. в векторы. В практике обработки естественного языка векторное представление текста называется эмбеддингом (встраиванием). Есть два способа его проведения. Второй вариант реализуется быстрее и позволяет достичь приемлемых результатов...
1 год назад
1,2K подписчиков
В данной статье рассмотрим несколько способов разделить строку с несколькими разделителями в Python. Разделение строки методом split() Один из способов разделить строку с несколькими разделителями в Python - использовать метод split() и передать ему регулярное выражение в качестве разделителя. Регулярное выражение может содержать несколько разделителей, которые будут использованы для разделения строки на подстроки. Пример использования метода split() с регулярным выражением для разделения строки...
10 месяцев назад