Найти в Дзене
Логистическая регрессия (часть 4)
1. Логика логистической регрессии I.3. Преобразование вероятностей в логиты Логит тесно связан с понятиями «вероятность» и «шанс». Вероятность – это объективная мера появления некоторого события, измеряемая от 0 до 1. На практике оценкой вероятности служит относительная частота появления события. Значение вероятности 0 означает невозможность появления события. Значение вероятности 1 означает, что событие непременно произойдет. Шансы – это отношение вероятности того, что событие произойдет, к вероятности того, что событие не произойдет...
3 года назад
Логистическая регрессия (часть 3)
1. Логика логистической регрессии 1.2. Знакомство с логистической функцией Мы выяснили, что обычная линейная регрессия с бинарной зависимой переменной сталкивается с рядом трудностей. На помощь нам приходят специальные регрессионные модели бинарного выбора. В рамках таких моделей мы строим модель вероятности того, что бинарная зависимая переменная примет значение 1 при заданных значениях независимых переменных. Для моделирования вероятности бинарной зависимой переменной подбирают специальную монотонно возрастающую функцию, которая может принимать значения только от 0 до 1...
3 года назад
Логистическая регрессия (часть 2)
1. Логика логистической регрессии 1.1. Проблемы обычной регрессии с бинарной зависимой переменной 1.1.2. Проблема достоверности статистического вывода Даже если в некоторых случаях прямая линия аппроксимирует нелинейные зависимости, возникают некоторые проблемы, которые снижают эффективность оценок, несмотря на то, что оценки остаются несмещенными. Проблемы связаны с тем, что регрессия с бинарной зависимой переменной нарушает предположения о нормальности и гомоскедастичности. Обе эти проблемы возникают по причине существования только двух наблюдаемых значений для зависимой переменной...
3 года назад
Формула AUC-ROC (кратко, часть 1)
AUC-ROC равен доле пар объектов вида (наблюдение класса 1, наблюдение класса 0), которые алгоритм верно упорядочил в соответствии с формулой: В этой формуле x – ответ алгоритма для наблюдения (при этом это может быть не только вероятность, но и целое число). Наблюдения положительного класса имеют нижний индекс i, наблюдения отрицательного класса имеют нижний индекс j...
176 читали · 3 года назад
Краткое знакомство с Docker
1. Введение Docker – это платформа, которая предназначена для разработки, развертывания и запуска приложений в контейнерах.  Упрощенно говоря, Docker – это виртуальная машина, на которой уже установлено окружение, которое потребуется для проекта. Возникает вопрос, зачем нужен Docker в DS-проектах? Скорость. Docker позволяет быстро создать среду разработки для data scienceпроекта. Вам не потребуется отдельно устанавливать python, anaconda или библиотеки для data science. Все, что нужно – найти подходящий образ Docker и запустить контейнер...
3 года назад
Если нравится — подпишитесь
Так вы не пропустите новые публикации этого канала