from flask import Flask, render_template, request
from flask_wtf import FlaskForm
from wtforms import TextAreaField, SubmitField
from wtforms.validators import DataRequired
import re
import pandas as pd
from nltk.tokenize import word_tokenize
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import SVC
# Создание экземпляра приложения Flask
app = Flask(__name__)
app.config['SECRET_KEY'] = 'your_secret_key' # Задайте секретный ключ для защиты формы
# Функция предварительной обработки текста
def clean_text(text):
# Приведение текста к нижнему регистру
text = text.lower()
# Удаление лишних символов и знаков препинания
text = re.sub(r"[^а-яА-Яa-zA-Z0-9ёЁ]+", ' ', text)
return text
# Функция токенизации текста
def tokenize_text(text):
# Токенизация текста
tokens = word_tokenize(text)
return tokens
# Функция обучения модели классификации
def train_classifier(features, labels):
# Используем метод опорных векторов (SVM) для класси