グーグル、リアルタイム性を重視した新技術「Caffeine」を発表 : Googleウォッチ - Computerworld.jp
米国Googleは6月8日、シアトルで開催された「Search Marketing Expo」において、新たなWebインデックス化システム「Caffeine」を発表した。同社は、「Caffeineを使用すれば、Googleの既存システムよりも"現実"に近い検索結果を表示できる」と述べている。
これまでGoogleは、Web上の情報の一端を毎晩クローリングして集め、それらをインデックス化し、検索結果として表示してきた。
これに対しCaffeineは、既存システムと同様にWebのクローリングによって新たな情報を探し出すが、そのインデックス化は即座に行われるという。
Googleのウェブスパム・チーム責任者であるマット・カッツ(Matt Cutts)氏は、「瞬間的に処理するので、数秒後には結果として提供できる」とコメントしている。
同氏によれば、Googleは創業当時、インデックスのアップデートを4カ月に1回しか行っていなかったという。2000年ごろになって情報のインデックス化を毎月実施するようになったが、そのプロセスには1週間から10日ほど必要だった。つまり、複数のユーザーが検索したことばが同じでも、アクセスしたGoogleのデータセンターが異なれば、得られる結果が違っていたことを意味する。
「今では笑い話だが、われわれの全データセンターを一度にアップデートするだけのキャパシティがなかったのだ。(中略)Caffeineは数日前から稼働し始めており、現在はすべてのGoogleデータセンターで利用されている」(カッツ氏)
Caffeineは「より新鮮な」結果を表示するばかりでなく、「Googleの能力を劇的に強化する」ものでもあるという。カッツ氏いわく、Caffeineのおかげで、Googleは「約100ペタバイト」もの大量のドキュメントをインデックス化できるようになるとのこと。同社の公式ブログによると、Caffeineは1日あたり数十万ギガバイトというペースで新しい情報を追加していくという。
Googleのインデックス化技術の進歩には、最新最速の情報をインターネットから取得したいというユーザーがますます増えている現状が映し出されている。Googleの考えでは、米国中枢同時多発テロ後、人々はとにかく1分でも新しい情報を探そうとしているようだとカッツ氏は述べた。





コメントする