Про машинное обучение мы недавно говорили, сегодня обсудим ещё один buzzword (модную тему): data science, или наука о данных. Наука о данных — набор научных методов, алгоритмов для получения из данных неочевидных знаний и закономерностей. Звучит довольно похоже на машинное обучение: там мы тоже учили компьютер выявлять закономерности, A -> B — в чём разница? Разберёмся на примере. Представьте, вы владелец риэлторской фирмы, и у вас есть много хорошо структурированных данных о продаже домов (пример таблицы ниже). Что вы можете с ними сделать, используя машинное обучение? Например, научить компьютер определять ориентировочную цену ещё не проданных домов и показывать её при размещении объявлений клиентам. Действительно, у вас есть набор параметров жилья А и набор соответствующих им цен В, A -> B, на котором вы сможете обучить систему, и дальше она, уже умная, сможет рассчитывать цену любых других домов. А что вам даст наука о данных? Она помогает найти неочевидные закономерности: наприме