Часть 3. Когда набор данных велик (как с точки зрения количества переменных, так и с точки зрения количества наблюдений), можно сначала применить некоторую соответствующую методику сокращения измерений, а затем выполнить кластеризацию по сокращенному набору данных. Следует иметь в виду, что дискриминантная полезность расстояний теряется в пространствах параметров высокой размерности, поскольку расстояния имеют тенденцию становиться похожими (один из аспектов “проклятия размерности”). В этом методе,...