№57 (208 стр) Ын Анналин, Су Кеннет "Теоретический минимум по Big Data. Всё, что нужно знать о больших данных"
#1mlnpages
Есть такая знаменитая крылатая фраза: «кто владеет информацией, тот владеет миром». Применительно к данной книге эту фразу можно было бы вполне перефразировать так: "мало владеть информацией, нужно выявлять скрытые тенденции и течения, архи важно полученные результаты правильно трактовать и интерпретировать..."
Пожалуй, сегодня термином Big Data/большие данные уже мало кого можно удивить именно с точки зрения того, что он уже "притерся" и "не режет слух". Но история в том, что не многие внятно, даже на бытовом уровне могут объяснить, что он под собой подразумевает, для чего чего служит и т.д. Эта книга - хороший вариант закрыть такой пробел.
Авторы совсем не лукавят, когда пишут, что в книге совсем нет формул и продвинутой математики, буквально на пальцах и визуальных примерах объясняются базовые вещи из области больших данных.
Например, разбирается пример о том, как может строится рекомендательная система, скажем, для любителя онлайн-кинотеатров, если уже известно, что за последний месяц был просмотрен "Терминатор" и "Адвокат Дьявола". Или строятся прогнозы относительно того, какие сочетания товаров приобретаются с большей вероятностью покупателем супермаркета. Скажем, чисто гипотетически "пиво покупается с рисом и яблоками" (не спрашивайте почему такое сочетание, придумал на ходу;)). Тогда логично, например, расположить эти продукты рядом в магазине и/или даже продавать наборами.
У меня еще сложилось стойкое впечатление, что книга хорошо поглотилась еще за счет отличного перевода. Этому нужно отдать должное. Каких-то странных, даже корявых словосочетаний или предложений, которые потом можно было бы списать на технический, математический жаргон тут практически нет. При этом надо быть готовым и к специфическим терминам: бэггинг, дерево решений, случайные леса...без этого никуда!!
Субъективная оценка: 8,25/10
P.S.
Друзья, присоединяйтесь к ЧЕЛЛЕНДЖУ #1mlnpages
Будем вместе читать в 2020 году