Не знаю, но мне эта статья понадобится, поэтому как минимум одному человеку будет что почитать. :-)
Дано:
Есть в сети Интернет форум, понравилась очень тема с обсуждением, а на форуме надо листать несколько страниц для чтения всего материала. Также некоторые темы оказались без картинок, но они были ранее. Необходимо сделать себе на диске локальную копию форума, ну хотя бы теперь и сейчас.
Инструменты:
FAR Manger (не обязателен, при написании текста и выполнении сохранения метод упростился ),
Google Chome,
Opera,
WizBrother Html Editor,
доступ в Интернет.
p.s. FAR не нужен и вообще достаточно одного браузера.
Уточнение условия задачи (пример одного из форумов):
сделать копию ветки форума сайта, возьмём для примера это - http://twistypuzzles.ru/forum/index.php/topic,995.0.html (тут всего две страницы навигации по сообщениям), не сложный пример.
Результат:
на диске в папке несколько файлов html и папок с картинками, при открытии можно смотреть без подключения к Сети Интернет.
Начинаем работу.
Открываем уже установленный (у меня портативный ) WizBrother Html Editor.
Здесь находим и загружаем ...
Открывается редактор, вот так он выглядит, это новый проект и мы находимся в редактировании.
Пишем текст в пока пустой странице, например "Архивная копия сайта ...", будет напоминанием, что мы без Интернета. На всякий случай нажимаем пару раз Enter.
Затем курсор перемещаем чуть назад, выше (под нашей надписью), это уменьшит проблему редактирования, если надо будет вставить что-то ниже (можно не делать поэтому).
Теперь открываем браузер, у меня Google Chrome, и переходим на страницу форума, ссылка выше.
Тут просто дело в том, что этот браузер используется для доступа в Интернет, а Opera будет уже для открытия (проверки работы) локальных файлов. Можно делать в одном браузере всё, но мне нравится переключать окна по Alt+Tab, а не выбирать страничку в одной из вкладок. Также Opera без авторизации на форуме, бывает это полезно.
Открываем источник и отмечаем что копировать.
Тут небольшое замечание, по дальнейшей работе. Выйдите с форума, если страница без авторизации выглядит одинаково, то можно делать как сказано ниже.
Но если что-то не отображается, опять войдите на форум.
Если вы вошли на форум, то будет сохранена лишняя информация, в том числе имя пользователя с возможно какой-то статистикой.
Выделяем (мышкой) на открывшейся странице форума часть страницы, без "макушки" и "хвоста". То есть только начиная с навигации, со слов "Начало", "Помощь" .... и захватывая в самом низу строку, начинающуюся словами "Страницы: 1 2 » Вверх"....
Пара скриншотов что было отмечено для переноса в редактор:
Публикация в редакторе информации с сайта.
Этот выделенный текст копируем в буфер обмена, переходим в редактор Html и вставляем его, смотрим ниже скриншоты редактора.
Что дальше будем делать?
Можно уже на этом остановиться, возможно будет надо в редакторе чуть-чуть удалить лишнее вверху и самом низу страницы, затем сохранить результат и продолжить со следующими страницами работать, но нам этого мало. Надо также сделать связи между страницами.
Редактирование.
Удалим лишнее в начале страницы, а затем лишнее снизу страницы, но тут Вам решать что оставить, а что удалить, тем более можно будет опять отрыть страницу в редакторе и сделать исправления. Вот что у меня получилось на данном этапе, не сильно отличается.
Сохранить результат на диске.
Теперь сохраним эту страницу на диске. Выбираем в меню редактора "File", затем нажимаем "Save As...", тип файла Html, а имя делаем "01" для первой страницы, для следующей "02", ну и так далее.
Возможно лучшим вариантом для хранения локальных копий будет по типу хранения как на сайте. Я создал папку "TwistyPuzzles.RU ", в ней "Спортивная сборка головоломок", уже в ней "Спортивные дисциплины ", а в ней "Сборка вслепую" и уже в этой "Коммутаторы". Вот сюда всё и выкладываю при данной работе. При этом появится, например в первом случае, файл "01.htm" и папка "01_files".
Но можно и просто сохранять все без создания сложного дерева сайта.
Но у меня есть идея сохранить несколько разных веток форума, поэтому себе создаю такие сложности.
Повторяем с новыми страницами операцию сохранения.
Для начала работы со следующей страницей надо будет нажать кнопку "New". Если конечно есть уверенность, что уже закончили редактировать текущий документ, то нажимаем эту кнопку в меню редактора.
Хотя можно всегда в редакторе открыть эту страничку на редактирование и внести изменения, не страшно видимо.
Открываем в браузере следующую страницу и опять выделяем текст, вставляем в редактор, редактируем шапку и подвал, сохраняем и так далее...
Теперь все страницы сохранены локально, если необходимо, то сделайте архив или копии файлов htm (картинки не обязательно, мы их не редактируем), вдруг что-то пойдёт не так при редактировании ссылок и испортите.
Работа по настройке ссылок для локальных переходов.
ниже чуть у старела информация, можно проще, не буду удалять, оставлено на память
Осталось нам только поправить ссылки в страницах для навигации, сделать их работающими между локальными файлами. Вероятно это можно сделать в редакторе Html, но тут я поленился разбираться, извините, делаем по-старинке, в текстовом редакторе. Мне нравится редактор текста в FAR Manager, давно с ним дружим как бы.
Запускаем FAR, Переходим в каталог с сохранениями. Тут возможно будет лучше сразу сменить расширение файла с "htm" на "html", так меньше будет делать изменений при редактировании.
Отрываем по F4 на редактирование файл. Нажимаем F7 и вводим строку поиска "Страницы:". Редактор делает переход на первую строку, а их будет 2 (верх и низ на сайте), в которой надо изменить навигацию при просмотре в браузере.
Это выглядит как длинная строка со словом "Страницы:" и их перечислением, но также тут будут реальные ссылки для переходов.
Тут можно сразу опять нажать F7 и сделать поиск нового слова. Ищем "http://twistypuzzles.ru". Но можно просто зажать клавишу Shift нажимать несколько раз курсор вправо, пока в этой строке не появится это слово.
Всё что в кавычках, например "http://twistypuzzles.ru/forum/index.php/topic,995.15.html" (по сути будет прирост на 15 для последующей страницы), заменяем на "02.htm" или "02.html", отсылая на следующую страницу.
Делать это, как было сказано чуть выше, надо будет в «шапке» документа и «подвале».
Не забываем, что переходы могут быть на несколько страниц темы форума, необходимо сразу все исправления внести (ссылки на 01.html, 02.html, 03.html, 04.html …, даже если нет пока этих документов локально сохранённых, не поленитесь это сделать).
Тут есть важное замечание. Появилось при написании текста. И визуальном осмотре редактора. :-)
Можно вообще без FAR обойтись, в редакторе html есть три вкладки - "Edit", "Preview" и "Source". Необходимо просто перейти в Source, тут найти и отредактировать ссылку. Убедился что так даже намного лучше получается, проще искать слова, пример ниже, несколько скриншотов в каруселе.
Исправление в редакторе, без стороннего софта:
И что-то мы кажется забыли, точнее чуть не забыли. Дело в том, что надо после вставки в редактор следить за скачиванием вложенных картинок, если раньше сохраните, то могут не отобразиться потом.
Картинки должны показываться полностью, не ленитесь проверить.
Также в редактор не копируются ролики с youtube, поэтому необходимо вернуться на открытую в Crome страницу, скопировать ссылку на ролик и просто вставить уже её в редакторе.
После сохранения второй страницы, ну и далее по номерам, лучше проверить как это открывается и работают ли переходы между страницами. У меня по умолчанию открывается в браузере Opera, задачу ставил сам себе, поэтому и указал её в инструментах.
Надеюсь процесс создания быстрой копии ветки форума описан правильно и у Вас получится сделать архивную копию с работающим перелистыванием по страницам
Спасибо, удачи.
P.S. Чуть не забыл, опять.
Можно сохранять страницы из редактора html в другие форматы, но они уже не поддерживаются браузерами, будут сложности, если надо будет кому-то отправить «отпечатки сайта».
Один из возможных вариантов - это распечатать в формат PDF, есть много бесплатных виртуальных pdf принтеров.
Всем спасибо, удачи.