Под этим странным термином скрывается достаточно простая идея - брать информацию с готовых источников, как правило с WEB-ресурсов. В наше время многие площадки автоматически собирают контент. Например, qa.ru явно парсит StackOverflow, Яндекс новости парсят популярные новостные издания, в общем, примеров очень много.
Итак, если вам интересно попробовать себя в этом деле, то ниже приведены технологии, которые вам пригодятся.
Внимание! Редакция NET Watcher против незаконного использования или присваивания чужой интеллектуальной собственности. Поступайте с умом и знанием юридической стороны вопроса. Язык программирования О, да, очень банально, не правда ли? Но тем не менее, от этого никуда не деться - этот язык станет вашим главным рабочим инструментом. Я даже скажу больше: это должен быть конкретный высокоуровневый язык, крайне желательно, чтобы он мог работать на серверной части. От C# и Java и до NodeJS и PHP, по-сути, вы не особо ограниченны в выборе. Понимание HTML, селекторов и DOM Т