PubSubHubbubによる、リアルタイムインデックスの話。

この記事を書くきっかけは @matsudai23 のブログ
DIGITABLEBOX -デジタブルボックス- の記事である

[Đ]サイトをGoogleに爆速でインデックスさせるWordPressのSEOプラグイン「PuSHPress」設定不要!インストールして放置!
http://digitablebox.net/blog/post-296/

を開いて、そいえばこの記事の元になったPubSubHubbubって今はどうなったのかなと思い、執筆しはじめた。

そもそも、件の記事の内容はWordpressのプラグインである「PuSHPress」というプラグインの紹介である。

プラグインの紹介としては、シンプルでとてもわかりやすいんですが、

何故そんなに爆速でgoogleインデックスに登録されるのか。

この点については触れていなかったので、記事の紹介とともに、技術的な点の解説をしたく思う。

まず、PuSHPressというWordpressプラグインというのは何をしているかというと、記事の更新とともに更新された事をgoogleサーバーへPubSubHubbubプロトコルを用いて通知しているものである。
googleはこの通知をもとにクローラーがページ情報を取得する事によってインデックスへ登録され、googleの検索結果として反映されるものとなります。

そもそも、googleで検索出来るようになる為には、googleのクローラーがページを巡回し、googleへ登録されて初めて検索結果に使われます。
また、googleのクロールは定期的な巡回によって行われるため、検索結果へ反映されるのには時間がかかります。

しかし現在はtwitterのようなリアルタイムSNSが多くなり、検索結果についてもリアルタイム性が求められるようになってきました。そのため、今までのgoogleが定期的な巡回によってインデックスを収集するアプローチではなく、更新したサイトがgoogleに通知し、googleに巡回してもらうアプローチを取る事が一番だと考えられました。

そこで生まれたのが、googleなどのクローラーへ更新した事を通知する仕組みとしてPubSubHubbubというプロトコルなのです。

プロトコル自体は2008年頃には出来上がっていたのですが、未だに取り上げられる事が少ない。
wordpressなどのCMSではPubSubHubbub対応のプラグインも多いので、この機会に導入する事をおすすめします。

PubSubHubbubについて詳しく知りたい方は
W3CのPubSubHubbubコミュニティー http://www.w3.org/community/pubsub/
Google CodeのPubSubHubbubのページhttps://code.google.com/p/pubsubhubbub/
atmarkITのPubSubHubbubの記事
http://www.atmarkit.co.jp/news/200908/19/pubsubhubbub.html
あたりがよいかと。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください