Поисковые роботы, которые собирают данные для обучения новых моделей искусственного интеллекта, активно загружают контент с сайтов Wikimedia. Особенно сильно это по тому, как вырос трафик от автоматических программ. По данным Wikimedia Foundation, объём загрузки мультимедийных файлов увеличился на 50% всего за несколько месяцев. Большая часть этого трафика идёт на скачивание 144 миллионов медиафайлов. Из-за этого у организации начали возникать технические трудности. Проблема в том, что боты занимают слишком много ресурсов. Хотя они обеспечивают около трети всех просмотров страниц, именно они создают две трети самой большой нагрузки на систему. Команда фонда регулярно блокирует такие боты, чтобы сайт продолжал стабильно работать. Причина резкого роста — в том, что компании, разрабатывающие ИИ, массово собирают открытые данные, чтобы обучать свои модели. Википедия и её проекты — один из главных источников для таких данных. Особенно ценны изображения и видео, которые скачивают с огромной