Weboxでオフライン世界旅行現在、ラップトップ持参で旅行する人が増えています。主に写真の整理やホームページ作成が目的なのでしょうが、せっかくならそのPCにネットの情報を蓄えておきたいものです。その場合有効なのが、ウェブサイトをまるごとダウンロードするウェブ巡回ソフト。あらかじめ他の人の旅行記や、旅の掲示板などをダウンロードしておけば、ホテルでのんびり旅のプランを立てることができます。ここでは、代表的なソフトであるWeboxを使った活用法をご紹介します。 |
旅行時期: 2009年
為替: N/A 作成日: 2010.4.20 目次 | ||||||||||||||||||||||||||||||||||
Webox概要Webox(ウェボックス)は、ウェブページをPCに取り込んでオフラインで管理するソフトです。ウェブサイト全体をダウンロードすることもできます。同様のウェブ巡回ソフトに、巡集、GetHTMLWなどいくつかあります。私がWeboxを使う理由は単に、他のソフトをよく知らないからです。 この手のソフトは、旅行者にもってこいです、あらかじめ必要な旅行情報をラップトップにダウンロードしておけば、現地でインターネットを探す手間が省けます。ネットカフェのない街もあれば、ラップトップをつながせてもらえない場合もあるからです。お気に入りの旅行サイトを前もってダウンロードしておき、好きな時間に好きな場所で読むのです。この記事では、サイトの種類別に、Weboxの設定方法とコツを紹介していきます。 |
補足
|
||||||||||||||||||||||||||||||||||
何が取り込めるかほとんどのページはそのままダウンロードされますが、例外的に取り込めないページやファイルがあります。
|
|||||||||||||||||||||||||||||||||||
使い方この記事では、サイトを丸ごと取り込むことを前提に話を進めます。 基本設定サイト全体をダウンロードする場合、設定は基本的に次の3点。
その他の設定その他、次のような設定も必要に応じて使います。
閲覧ダウンロードしたページはネットに接続しなくても閲覧できます。取り込まれたサイトはディスクにファイルとして保存され、IEやFirefoxなど一般のブラウザーで読むことができます。ただ、一部の拡張子のないファイルは、Webox内臓のブラウザーでしか表示できません。 |
| ||||||||||||||||||||||||||||||||||
個人サイト個人や会社が作ったウェブサイトをまるごと取り込むのが目的です。主に、無料ホスティング・サービスを使ったサイトを想定しています。個人サイトの場合、動的コンテンツが少なく、構造もシンプルなので、Webox的には組しやすいところです。 サイトの構造サイトのトップページは、 sekakoh.web.fc2.com など、ディレクトリー名よりもサブドメイン名でユーザーを区別したものが主流です。独自ドメインを持っているサイトもあります。基本的に、これらのサーバー名やディレクトリー名の下にすべてのコンテンツが置かれています。リンクの深さはサイトによりますが、2-5くらいでしょうか。この世界攻略ジャーナルの場合、トップページ -> メニューページ -> 各記事の三層構造になっているので、リンクの深さは2になります。個人サイトは基本的には静的ファイルで構成されているので、リンクを多めに設定しても悪影響はありません。 サイトにブログへのリンクを張っている人もいますが、ブログは別サーバーになるので同時にダウンロードすることはできません。 Webox の設定
実験いくつかサイトをピックアップして実験してみました。すべて大きな問題はなし。
ローカルコピー
| |||||||||||||||||||||||||||||||||||
フォートラベル4TRAVELに投稿されている旅行記をまとめてダウンロードするのが目的です。 旅行記の投稿サイトはいくつかありますが、フォートラベルが一番メジャーだと思われます。まぐまぐやMSN Travelにも、全く同じものがフィードされています。 サイトの構造URLはこのようになっています。
Webox の設定特定のお気に入り旅行者の旅行記すべてをダウンロードします。
実験自分のサイトで試してみます。アクセス数がおかしくなるので実験しないでください。
ローカルコピーローカルディスクには、次のように保存されます。サーバーはすべて - http://4travel.jp/
さらに分析
|
補足
|
||||||||||||||||||||||||||||||||||
したらば掲示板私設BBSの開設が容易なライブドアしたらば掲示板。 スレッドの集合体である板を丸ごとダウンロードします。 サイトの構造URLはこのようになっています。URLのサーバー部分はすべてhttp://jbbs.livedoor.jp/。
Webox の設定ダウンロードしたいのは「スレッド一覧」と「スレッドのレスを全部表示」のページのみ。その他は、内容がダブっているので取り込み拒否設定で無視することにします。ただ、サイトのデザイン上、「スレッド一覧」と「スレッドのレスを全部表示」の間に、必ず「スレッドの最新の50レスを表示」が入ります。ですので、これも取り込むようにします。
実験2つの掲示板を試しました。
ローカルコピーローカルディスクには、次のように保存されます。
これは2つのことを意味しています。
さらに分析
| 補足 |
||||||||||||||||||||||||||||||||||
2ch 掲示板ご存知2ちゃんねる掲示板。スレッドの集合体である板を丸ごとダウンロードします。2ちゃんねるは、したらばと同じスタイルの掲示板ですが、2つのアクセス規制がかかっているので対処が必要です。
サイトの構造URLはこのようになっています。ディレクトリー名が少し違う以外は、したらば掲示板と同じです。 URLのサーバー部分はhttp://サーバー名.2ch.net/。 板によってサーバー名が異なります。
Webox の設定したらば同様、ダウンロードしたいのは「スレッド一覧」と「スレッドのレスを全部表示」のページのみ。
実験2つの掲示板を試しました。
ローカルコピーローカルディスクには、次のように保存されます。
したらば同様、スレッド毎に2つのページが取り込まれます。また、subback.htmlを開けて、l50をindex.htmlに置換すれば一般のブラウザーからも読むことができます。 さらに分析 - 過去のスレッド
これは本家のサービスと違い、無料です。代表的なのはunkarでしょうか。
|
補足 |
||||||||||||||||||||||||||||||||||
ブログ現在、旅日記の主流はブログです。お気に入りの旅行ブログなどを取り込むのが目的です。 過去の記事をすべて取り込むことは可能ですが、ブログサービスによってその難易度は様々です。具体的には、日記一覧のメニューがよくまとまっているブログは、ダウンロードしやすく、閲覧もしやすい。また、1ページにたくさんの日記エントリーが載っていると、リンクを辿る回数が減るので、これも助かります。そういう観点から言えば、はてなダイアリーやYahoo!ブログは扱いやすく、アメーバは最悪です(設定による)。 サイトの構造サイトの構造は、ブログサービス毎に違います。アメブロの場合こうなっています。 Webox の設定特定ユーザーのすべてのブログエントリーをダウンロードします。
実験はてなダイアリーのとある個人グログをダウンロードしてみました。
ローカルコピー
|
|||||||||||||||||||||||||||||||||||
メルマガ (まぐまぐ)ブログが普及する以前は、メールマガジンから情報発信する人が大勢いました。当時書かれたものの中には、今でも役立つものが少なくありません。 大手メールマガジンのまぐまぐでは、 大半の作者がバックナンバーを公開しています。これを利用して一括ダウンロードを試みます。 サイトの構造
Webox の設定特定メルマガの過去の配信すべてをダウンロードします。
実験とあるメルマガをダウンロードしてみました。
ローカルコピー
|
補足
|
||||||||||||||||||||||||||||||||||
その他ここまでで紹介した以外のトピックについて見ていきます。 CURLCURLは、URLを指定してファイルをダウンロードするコマンドライン・ツールです。ファイル名に正規表現が使えるため、一風変わった使い方ができます。以前、インドの鉄道を研究していた時、オンラインの時刻表をダウンロードする必要がありました。その時刻表は、一つのファイルではなく、ページ毎にPDF化されているため、100を超えるファイルすべてを取り込まなければなりません。サイトのデザイン上、Weboxを使ってダウンロードすることはできません。幸い、ファイル名は予測可能なので、CURLを使いまとめて落とすことができます。 ファイル名は、路線番号(1-97)にオプションでAが付くシンプルなものです(例、5.pdf, 92A.pdf)。よって次のコマンドを使って一括ダウンロードできます。
このコマンドは、1.pdf, 1A.pdf, 2.pdf, 2A.pdfと順番にダウンロードしていきます。存在しないファイルをダウンロードしようとした場合、2KB程度のエラーファイルが作成されます。これらはコマンド終了後、小さいファイルを削除することでお掃除できます。 その他の掲示板2chやしたらばなどのスレッドフロー型以外の掲示板を見てみます。
MixiWeboxはミクシーと連携したダウンロードも行えるようです。試していないので、詳しいことはわかりません。 |
補足 | ||||||||||||||||||||||||||||||||||
最後にまだまだ不明な点たくさんありますが、今回はこのへんで。
|
|||||||||||||||||||||||||||||||||||
Copyright (C) 2009 Sekakoh. All Rights Reserved. |