Многие слышали про существование и работу такого инструмента, как Wayback Machine, но мало кто представляет себе весь его масштаб, а также то, как работает и где располагается эта организация. В ходе недавнего мероприятия Online News Association 2018 директор WM Марк Грэм впервые приоткрыл завесу этих тайн, и теперь все мы можем оценить колоссальный масштаб хранилища: 22 петабайта информации (которая дублируется на случай поломок оборудования) ежегодно прирастают почти на 20% и содержат в себе всё: от снапшотов главной страницы Google и редких аудиозаписей 70х годов, до снимков из Snapchat и публичных telegram-чатов. "Конечно, в наши дни Интернет-архив предлагает гораздо больше, чем текст. К примеру, в нём есть архив более 1,6 млн. записей программ новостей с возможностью упорядочивания и доступа, по ключевым словам (трансляции становятся доступны через 24 часа в виде двухминутных кусов с возможностью поиска). Растущая аудио- и музыкальная часть интернет-архива охватывает радионовости,
Ars Technica: Хранители Интернета? «Некоторые называют нас хранителями - мне нравится говорить, что мы архивариусы»
1 декабря 20181 дек 2018
15
1 мин