WebArchive一括DLスクリプト
ネットランナー5月号向けに、WebArchiveから一サイト分丸ごとのデータをダウンロードするスクリプト「Warrick.exe」を書きました。順を追って説明すると
- 「インターネットの図書館」とも呼ばれるWebArchiveには、閉鎖済みサイトなども含め過去のウェブサイトキャッシュが大量に眠っています
- しかしWebArchiveキャッシュは表示が重いし日本語はまず間違いなく文字化けする。1ページ読むならともかく、サイト一気読みに使うと結構ストレス貯まる
- そこで一サイト分のデータを丸ごとダウンロードしローカル上で鑑賞するための「Warrick」というツールがあります(参考:閉鎖済みサイトをWebArchiveキャッシュから一括DLする「Warrick」)
- ただ、Warrickはコマンドラインでの操作が必要なので、そこらへんに不慣れだと少し使いにくい
- で、今回作成した「Warrick.exe」は、Warrickを簡単に使うためのスクリプトです
と、いった感じです
>>続きを読む
