469 прочтений · 4 года назад
5 базовых статистических концептов, которые должен знать каждый специалист по обработке данных
В таком искусстве, как наука о данных, статистика может оказаться мощным инструментом. В широком смысле, статистика означает использование математики для технического анализа данных. Базовая визуализация, например, гистограмма, может быть очень информатична, но с помощью статистики мы получаем гораздо больше точных данных. И математические вычисления дают не примерную оценку, а конкретные выводы о данных. Статистика позволяет нам получать более глубокую и детальную информацию о том, как устроены наши данные...
Понимание вероятностных распределений (distributions) в машинном обучении с примерами кода на Python
Машинное обучение, в своей основе, сводится к принятию решений или предсказаний на основе данных. Эти решения часто принимаются в условиях неопределенности, поскольку данные, которыми мы располагаем, часто зашумлены, неполны или иным образом несовершенны. Вот где на помощь приходят вероятностные распределения. Они предоставляют математическую основу для количественной оценки и анализа неопределенности. Вероятностные распределения используются в машинном обучении различными способами. Например, они...