Фонд Викимедиа, головная организация Википедии и примерно десятка других краудсорсинговых проектов, в среду сообщил, что с января 2024 года потребление трафика для загрузки мультимедиа из Викисклада выросло на 50%. Причина, как написала компания во вторник в своём блоге, заключается не в растущем спросе со стороны жаждущих знаний людей, а в автоматизированных сборщиках данных, которые хотят обучать модели ИИ. «Наша инфраструктура рассчитана на внезапные скачки трафика, создаваемые людьми во время событий, вызывающих большой интерес, но количество трафика, создаваемого ботами-скрейперами, беспрецедентно и представляет собой растущие риски и издержки», — говорится в сообщении. Wikimedia Commons — это общедоступное хранилище изображений, видео и аудиофайлов, которые доступны по открытым лицензиям или находятся в общественном достоянии. По данным Wikimedia, почти две трети (65%) наиболее «дорогостоящего» трафика, то есть наиболее ресурсоёмкого с точки зрения потребляемого контента, приходи
Боты атакуют: Википедия борется с ростом трафика сборщиков данных для ИИ
4 апреля 20254 апр 2025
3
2 мин