Найти тему
Создание пользовательского интерфейса на фласк
from flask import Flask, render_template, request from flask_wtf import FlaskForm from wtforms import TextAreaField, SubmitField from wtforms.validators import DataRequired import re import pandas as pd from nltk.tokenize import word_tokenize from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.svm import SVC # Создание экземпляра приложения Flask app = Flask(__name__) app.config['SECRET_KEY'] = 'your_secret_key' # Задайте секретный ключ для защиты формы # Функция предварительной...
9 месяцев назад
Метрики оценки качества классификации.
Для оценки качества кластеризации, такие как weighted accuracy и F-1 score, нам потребуется, чтобы у нас были как истинные метки кластеров, так и предсказанные метки кластеров. Мы будем использовать scikit-learn для вычисления этих метрик. Вот как можно вычислить weighted accuracy и F-1 score для кластеризации: import pandas as pd from sklearn.metrics import accuracy_score, f1_score # Пример DataFrame data = { 'id': [1, 2, 3, 4, 5], 'category': ['A', 'B', 'A', 'C', 'B'], 'text': ['text1', 'text2', 'text3', 'text4', 'text5'], 'name': ['John Doe', 'Jane Smith',...
9 месяцев назад
Факторный анализ
import pandas as pd from factor_analyzer import FactorAnalyzer from sklearn.preprocessing import StandardScaler def factor_analysis(data, n_factors=5, output_file=None): """ Функция для выполнения факторного анализа переменных Параметры: - data: pandas DataFrame, содержащий переменные для анализа - n_factors: int, количество факторов для извлечения (по умолчанию 5) - output_file: str, путь к файлу для сохранения нового датасета с факторами (по умолчанию None) Возвращает: - factor_loadings: pandas DataFrame, загрузки переменных на факторы - factor_data:...
9 месяцев назад
Базовое обучение машинному обучению на Titanic dataset
Импорт библиотек и данных </></></></></></></></></></></></></> import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder, StandardScaler import seaborn as sns import matplotlib.pyplot as plt # Загрузка данных from google.colab import files uploaded = files.upload() # Предполагаем, что файлы train.csv и test.csv были загружены train_data = pd.read_csv('train.csv') test_data = pd.read_csv('test.csv') </></></></></></></></></></></></></> Модуль A: Парсинг и предобработка данных Шаг 1: Загрузка данных </></></></></></></></></></></></></> # Просмотр первых строк данных train_data...
9 месяцев назад