Test Data в Машинном обучении простыми словами
Тестовые данные – это часть Датасета (Dataset) , проверяющая основа Модели (Model) Машинного обучения (ML) . Является одной из составляющих разделенного набора данных наряду с Тренировочными (Train Data) и Валидационными (Validation Data) данными. Пример. Мы создаем модель, предсказывающую потребление электроэнергии в городе. Если на тренировочных данных она, подобно человеческому мозгу, учится видеть скачки потребления электричества, то на тестовой Дата-сайентист (Data Scientist) проверяет качество обучения...
Что такое TTT в Машинном обучении
Двусторонний тест (англ. Two-Tailed Test, TTT) – метод проверки Выборки (Sample) на принадлежность определенному интервалу значений. Он используется при проверке Нулевой гипотезы (Null Hypothesis) и проверке Статистической значимости (Statistical Significance): если проверяемая выборка попадает в одну из критических областей, вместо нулевой гипотезы принимается Альтернативная (Alternative Hypothesis). Нулевая гипотеза: среднестатистическое количество уничтоженных мылом микробов равно 99%.Альтернативная: Мыло в среднем уничтожает менее 99% процентов микробов...