машиночитаемый вид. Нашел отличный опенсорсный инструмент, который превращает ЛЮБОЙ PDF в текстовый документ OpenDataLoader. Он конвертирует PDF в Markdown, JSON или HTML и отлично сохраняет структуру с таблицами и колонками. Это буквально лучшее, что существует прямо сейчас. Скорость нереальная: инструмент конвертит 100+ страниц в секунду на CPU. И да, всё работает локально. Ссылка 📱 Делитесь @aidivision
Если вы собираетесь настроить в своём бизнесе RAG AI бота, вам предстоит обработать огромный объём документов и превратить их в
21 марта21 мар
~1 мин