Но «чистые данные» — это миф Волшебной таблицы «идеально размеченные данные» не существует. Всегда есть дубли, пропуски, ошибки. Вопрос не в том, чтобы добиться идеала, а в том, чтобы начать с достаточным качеством. Правило «60% годятся»: если 60% ваших данных можно использовать для обучения — начинайте. Неидеальный ИИ, который даёт 80% точности, уже приносит пользу. Остальное дообучите по мере накопления. Многие компании топчутся на месте в страхе, что «данные не готовы». Пора с этим заканчивать.