Найти в Дзене
Новое электричество

Ну-ка, о данных!

Про машинное обучение мы недавно говорили, сегодня обсудим ещё один buzzword (модную тему): data science, или наука о данных. Наука о данных — набор научных методов, алгоритмов для получения из данных неочевидных знаний и закономерностей. Звучит довольно похоже на машинное обучение: там мы тоже учили компьютер выявлять закономерности, A -> B — в чём разница? Разберёмся на примере. Представьте, вы владелец риэлторской фирмы, и у вас есть много хорошо структурированных данных о продаже домов (пример таблицы ниже). Что вы можете с ними сделать, используя машинное обучение? Например, научить компьютер определять ориентировочную цену ещё не проданных домов и показывать её при размещении объявлений клиентам. Действительно, у вас есть набор параметров жилья А и набор соответствующих им цен В, A -> B, на котором вы сможете обучить систему, и дальше она, уже умная, сможет рассчитывать цену любых других домов. А что вам даст наука о данных? Она помогает найти неочевидные закономерности: наприме
Photo by Rohan Makhecha on Unsplash
Photo by Rohan Makhecha on Unsplash

Про машинное обучение мы недавно говорили, сегодня обсудим ещё один buzzword (модную тему): data science, или наука о данных.

Наука о данных — набор научных методов, алгоритмов для получения из данных неочевидных знаний и закономерностей.

Звучит довольно похоже на машинное обучение: там мы тоже учили компьютер выявлять закономерности, A -> B — в чём разница?

Разберёмся на примере. Представьте, вы владелец риэлторской фирмы, и у вас есть много хорошо структурированных данных о продаже домов (пример таблицы ниже).

Что вы можете с ними сделать, используя машинное обучение? Например, научить компьютер определять ориентировочную цену ещё не проданных домов и показывать её при размещении объявлений клиентам. Действительно, у вас есть набор параметров жилья А и набор соответствующих им цен В, A -> B, на котором вы сможете обучить систему, и дальше она, уже умная, сможет рассчитывать цену любых других домов.

А что вам даст наука о данных? Она помогает найти неочевидные закономерности: например, что трёхэтажные дома при прочих равных стоят дешевле двухэтажных, или что новые дома дороже вторичных в среднем на 15%.

Ну и какая мне польза, скажете вы? А если, например, она обнаружит, что комиссии брокеров по домам в некоторых районах почему-то ниже, чем в других? Повод задуматься, не обманывают ли вас!

Машинное обучение даёт на выходе какую-то программу, функцию, наука о данных же — набор фактов, презентацию, а что с ней делать — решать вам.

#ai for everyone #ии для всех