httrack Website copier は仕事でお世話になることがあります。
何ができるかというと、
ブラウザからアクセスしたウェブサイト全体を
そのサイト構造を保ったまま
丸ごとコピー(ダウンロード)してくれます。
もちろんブラウザからアクセスできるファイル… HTML/CSS/画像 などのみですが
時と場合によってはとても便利なツールです。
例えば、
■ WordPress で構築したサイトの保守運用をやめて、静的サイトとして保管しておきたい。
■ サイトリニューアルの見積もりのため、既存のサイトのページ数を調査したい(インデックスされていないページも調査可能)。
こんな時に力になると思います。
Download
https://www.httrack.com/page/2/
特徴としては、
◯ 内部リンクをたどってファイルをコピーしていくので、内部リンクされていないページは取得できない(はず)
というところでしょうか。
Windows であれば GUI ツールが用意されているので、
このページでは使い方を説明しません。
Homebrew でインストール
Homebrew – httrack
https://formulae.brew.sh/formula/httrack#default
Manual
https://www.httrack.com/html/fcguide.html
Homebrew がインストールされている前提です。
ターミナルを立ち上げて次のコマンドを入力します。brew install httrack
かなりインストールには時間がかかります。
インストールが終了したら、確認のため、バージョン出力しましょう。
httrack --help
オプションなどのヘルプの内容が出て、最後にバージョンが出力されます。HTTrack version 3.49-2
こんな感じでバージョンが出力されれば、インストール完了です。
サイトをコピーする
サイトをコピーしていきます。
次のコマンドがサイトコピーの基本です。
httrack "コピーしたいURL" -O "コピー先のディレクトリへのパス" -v
コマンドラインから実行すると、GUI版とは比べ物にならない位動作が早く完了します。