1283 подписчика
См. картинку - в таком виде отдаем результаты парсинга сайтов клиентам xmldatafeed.com.
На изображении сбора данных с магазина Петрович (DIY), формат на выходе json. Наше частное облако сделано на базе open source NextCloud - просто какой-то автомат Калашникова в мире облаков :) Кстати, Петрович в этом кейсе парсим для проекта poisk.im...
Нас интересовали характеристики товаров, поэтому такой формат (характеристики - это фактические данные, не защищаемые авторским правом в отличии от описания и изображений, а мы чтим закон). Зачем брать характеристики? А ведь их можно "скормить" в ИИ и попросить сделать авторский текст :) уникальный.
Клиенты потом забирают по API/WebDAV или через браузер. Находка просто, всячески рекомендую. Но есть один огромный минус - нет возможности дать прямую ссылку на файл для скачивания... Иногда прямо нужно. Но плюсов сильно больше.
p.s. причем можно настроить резервное копирование облака на другой сервер, что мы тоже делаем. Другой момент - копии то есть, но никогда не пробовали восстанавливать :)
Около минуты
31 мая 2024