Добавить в корзинуПозвонить
Найти в Дзене
Максим Кульгин

В чате предложили идею парсинга сложных проектов через OCR

В чате предложили идею парсинга сложных проектов через OCR. У нас на xmldatafeed.com бывают запросы на парсинг так, что данные можно собрать только из мобильных приложений. Например - сеть Монеточка. Решение простое, только что опробовал - эмуляция Android, делаем скрин, кидаем в ИИ и просим вернуть Google Merchant Feed JSON. Вот что получилось у меня лично: title: Огурцы короткоплодные люкс 450 г description: Свежие короткоплодные огурцы категории люкс; пищевая ценность на 100 г: 15 ккал, белки 0.8 г, жиры 0.1 г, углеводы 3 г. availability: in_stock price: 129.00 RUB brand: — condition: new google_product_category: Еда, напитки и табак > Продукты питания > Овощи > Огурцы unit_pricing_measure: 450g unit_pricing_base_measure: 100g Цена копеечная, можно переложить на клиента. Кто тут чертов гений? :) (шучу). Вопрос лишь один - кто-то будет из заказчиков готов к такому НИОКР... Русский ИТ бизнес

В чате предложили идею парсинга сложных проектов через OCR. У нас на xmldatafeed.com бывают запросы на парсинг так, что данные можно собрать только из мобильных приложений. Например - сеть Монеточка.

Решение простое, только что опробовал - эмуляция Android, делаем скрин, кидаем в ИИ и просим вернуть Google Merchant Feed JSON. Вот что получилось у меня лично:

title: Огурцы короткоплодные люкс 450 г

description: Свежие короткоплодные огурцы категории люкс; пищевая ценность на 100 г: 15 ккал, белки 0.8 г, жиры 0.1 г, углеводы 3 г.

availability: in_stock

price: 129.00 RUB

brand: —

condition: new

google_product_category: Еда, напитки и табак > Продукты питания > Овощи > Огурцы

unit_pricing_measure: 450g

unit_pricing_base_measure: 100g

Цена копеечная, можно переложить на клиента. Кто тут чертов гений? :) (шучу). Вопрос лишь один - кто-то будет из заказчиков готов к такому НИОКР...

Русский ИТ бизнес