1341 подписчик
Вот так делаются базы компаний на продажу. Наши роботы "бегают" по 5.5 млн. сайтов в Рунете (.ru/.рф/.kz/...) и СНГ, записывают информацию в ElasticSearch, а потом на основе анализа title/description сайтов мы делаем выборки, которые включают в себя: почту, телефоны, ИНН, ОГРН и т.п.
А потом? Суп с котом :) а если серьезно, по ИНН мы заглядываем в налоговую и собираем всю информацию о компании. Выручка, генеральный, численность персонала и т.п.
Что меня немного беспокоит - я до конца не понимаю тонкую грань по персональным данным, которые человек (если он не ИП и у него не юр.лицо) сделал доступными на своем сайте. Ну предположим, есть дизайнер, он сделал сайт (портфолио), создал раздел "Контакты" и там вписал свои личные контактные данные. Наши роботы это соберут, т.к. данные то открыты и дальше попадут в базы. И я вот мучаюсь - это законно или не очень :)
p.s. на картинке "ошибка" - нет программ без ошибок, нету :) Что-то сломалось, ребята будут смотреть. Это мы делаем базы под заказ...
Около минуты
16 марта 2023