Поиск битых ссылок на сайте - LinkChecker

LinkChecker
LinkChecker

Оказывается существует очень мощная и свободная программа для поиска битых ссылок, которая умеет сканировать даже домены на кириллице в https.

Достаточно указать адрес сайта и нажать Start, и программа начнет поиск ссылок, по которым не получилось перейти. Она укажет по какой причине не получилось, то есть укажет ошибку.

Время сканирования зависит от количества страниц на сайте. Небольшой сайт на пару сотен страниц она может сканировать минут 15-20, а вот сайт с парой тысяч страниц, в зависимости от его структуры, около часа.

Программа находит не только битые веб-странички, но и ссылки на несуществующие ресурсы, например, изображения или файлы.

В моём случае, для корректного сканирования домена на кириллице в SSL пришлось отключить в настройках sslverify=0.

Программа написана на Python 2.7.2, но его дополнительная установка не требуется, так как все необходимые библиотеки скомпилированы и судя по структуре файлов чем-то вроде cx-freeze.

Также программа умеет сохранять отчеты, согласно техническим характеристикам в форматы HTML, TXT, CSV, XML. Пробовал сохранять в HTML, но важно перед сохранением отчета отсортировать по колонке результат, иначе одну и ту же проблему можно встретить несколько раз и не по порядку.

Настройки конечно для новичка могут показаться очень сложными, но они очень гибкие. Внешне напоминают about:config, но в текстовом файле, если Вы понимаете о чем я.

Распространяется программа для поиска битых ссылок на сайте по лицензии GNU GPL v2, и найти её можно тут.