間接型ロボットチェッカー
ロボットのアクセスをとれるアクセス解析ツールベータ版
提供終了 ロボット型検索エンジンの動きって知っていますか?皆さんが何か検索をしたときに、世界中からデータを集めるのがロボットの仕事だと思っていませんか?実はそうではなく、ロボット型検索エンジンのデータは事前に検索エンジンのサーバ内に集められているのです。どのように集めるかというと「クローラ」や「スパイダー」と呼ばれるプログラムが、前もって世界中のホームページの情報を日々収集しています。皆さんが検索するときにはこの事前に集められた情報の中から検索されるわけです。
この「クローラ」や「スパイダー」と呼ばれるロボットはイメージが付きにくいですよね。「鵜飼い」を連想するとわかりやすいと思います。鵜飼いというのは鵜匠と呼ばれる人が、鵜と言う鳥を操る漁のことを言います。鵜を水中で操り、鵜が飲み込んだ魚を吐き出させるものです。鵜飼いとロボット型検索エンジンの関係は下記のようになります。
| 鵜飼い | ロボット型検索エンジン |
| 鵜匠 | ジョブスケジューラー(ここの正しい表現がわかりません) |
| 鵜 | クローラ、スパイダー |
| 魚 | ホームページ情報 |
| 川 | インターネット |
要するに クローラというロボット が、あなたのホームページにアクセスして、ホームページ情報 を持って帰ります。この クローラ は、水面下で アクセスする ため、特殊なサーバ でなければみることができません。
この特殊なサーバとは「サーバサイドスクリプト」が動くサーバ、または Web サーバの生ログへのアクセス権がある場合と言うことになります。サーバサイドスクリプトとは CGI、PHP、ASP 等の言語です。最近ではレンタルアクセス解析も多くありますが、これらのレンタルアクセス解析ではクローラのアクセスをとることはできません。また、JavaScript でログをとっている場合は「クライアントサイドスクリプト」ですので、クローラのアクセスはとれないのです。
間接型ロボットチェッカーは、「間接的」に皆さんのページにアクセスしているロボットをチェックするためだけのツールです。
現在取得できるロボットは、Google, msn, Yahoo!, Naver の 4 種類です。それ以外のロボットは対応していません。対応して欲しいロボットがある場合はご連絡下さい。
サンプルは http://www.su-jine.com/bots/su-jine.html をご覧下さい。これは Su-Jine のトップページに来ているロボットです。
自分のサイトにクローラが来ているか知りたい方、クローラをみてみたいと言う方、今すぐ登録!もちろん無料です!
下記の E-mail アドレス、希望の ID (半角英数 8 文字以内) を記入し「申請」ボタンをクリックしてください。設置方法、ロボットの確認方法を E-mail で送ります。間違った E-mail アドレスを入れると設置することが出来ませんので、間違わないように注意してください。
|