🆕 🚀 ИИ и нейросети: тонкая настройка Qwen 2.5 VL 7B — распознавание рукописных цифр в 2 раза точнее (технологии 2025) Искусственный интеллект выходит на новый уровень: визуально-языковые модели (VLM/VLLM) превращают рукописные таблицы в готовые данные для науки и бизнеса за считанные шаги. 🔬 Технические детали 📊 Модель: Qwen 2.5 VL (7B параметров); в статье рассматриваются 6 ключевых разделов работы: мотивация, преимущества, датасет, аннотации, SFT технические детали и результаты. Упомянуты 3 традиционных OCR: Tesseract, DocTR, EasyOCR. 🔹 Архитектура: Qwen 2.5 VL 7B, vision+LLM интеграция 🔹 Обучение: supervised fine-tuning (SFT) для распознавания рукописных цифр и ячеек таблиц 🔹 Данные: норвежский фенологический датасет с аннотациями, экспортируемый в Excel/Parquet 🔹 Сравнение: VLM против EasyOCR/Tesseract — VLM устойчив к шуму и границам ячеек 🔹 Инструменты: пайплайн включает GitHub-репозиторий, HuggingFace-датасет и локальную предобработку изображений 💰 Практическое пр
🆕 🚀 ИИ и нейросети: тонкая настройка Qwen 2.5 VL 7B — распознавание рукописных цифр в 2 раза точнее (технологии 2025
29 августа 202529 авг 2025
1 мин