Добавить в корзинуПозвонить
Найти в Дзене
Максим Кульгин

Совет нужен - есть ли вообще механизм (сервис) скачать весь текстовый контент с сайта, включая файлы pdf/word/excel? Без html/js/css и т

п. Мне нужно получить Google.Doc с всеми текстами (нужно сплошником в одном документе) и файлы отдельно. Купил тут программку даже для этого на MacOs за цельных 6$, промучался час, но она скачивает сайт целиком, включая структуру, а мне для ИИ это лишнее... Кто подскажет, поможет? :) Спасибо. p.s. можно привлечь команду парсинга, это ясно, но вдруг есть более простые решения, сайт не защищается, сделать нужно один раз. prouniver.ru - вот этот. Хочу в rag закинуть.

Совет нужен - есть ли вообще механизм (сервис) скачать весь текстовый контент с сайта, включая файлы pdf/word/excel? Без html/js/css и т.п. Мне нужно получить Google.Doc с всеми текстами (нужно сплошником в одном документе) и файлы отдельно.

Купил тут программку даже для этого на MacOs за цельных 6$, промучался час, но она скачивает сайт целиком, включая структуру, а мне для ИИ это лишнее...

Кто подскажет, поможет? :) Спасибо.

p.s. можно привлечь команду парсинга, это ясно, но вдруг есть более простые решения, сайт не защищается, сделать нужно один раз. prouniver.ru - вот этот. Хочу в rag закинуть.