Для оценки качества кластеризации, такие как weighted accuracy и F-1 score, нам потребуется, чтобы у нас были как истинные метки кластеров, так и предсказанные метки кластеров. Мы будем использовать scikit-learn для вычисления этих метрик. Вот как можно вычислить weighted accuracy и F-1 score для кластеризации: import pandas as pd from sklearn.metrics
import accuracy_score, f1_score
# Пример DataFrame
data = {
'id': [1, 2, 3, 4, 5],
'category': ['A', 'B', 'A', 'C', 'B'],
'text': ['text1', 'text2', 'text3', 'text4', 'text5'],
'name': ['John Doe', 'Jane Smith', 'Alice Johnson', 'Bob Brown', 'Charlie White'],
'district': ['District 1', 'District 2', 'District 1', 'District 3', 'District 2'],
'true_cluster': [0, 1, 0, 2, 1], # Истинные метки кластеров
'predicted_cluster': [0, 1, 0, 2, 2] # Предсказанные метки кластеров
}
parsed_data = pd.DataFrame(data) # Истинные и предсказанные метки кластеров
true_labels = parsed_data['tru