Webページの増加と検索エンジンの限界

2008/4/30-1

ブログの記事などを含めると、毎日、毎時、毎分、毎秒、無数のWebページが生成されていっています。 このブログ記事も、世界のWebページを増加させています。 インターネットはまだ誕生して間もないので、Web上に存在するWebページ数は単調増加していると思われます。 もちろん、サイトの閉鎖等で消えるページも多く存在していますが、今は増加量が勝っているのではなかと考えています。

世界に存在している情報は、既にWebに公開されているものが全てではありません。

インターネットが社会インフラとして確立しつつあるのは比較的最近です。 IT系以外の分野では、インターネットへのシフトがまだ行われていない分野も数多く存在しており、それらが大挙してインターネットになだれ込んでくれば、Webに存在するページ数は爆発的に増加すると思われます。

Deep Web」と呼ばれる検索エンジンに未登録である巨大空間も存在していると言われています。

これらが登録されたとき、本当にキーワードのマッチだけで全て事足りるのでしょうか? 現在の検索は、複数のキーワードの組み合わせに対して最大1000番目までの結果を表示するものが主流です。

検索単語そのものが増加することはあまりありません。 検索単語は、自然言語そのものである事が多く、自然言語の単語はWebページの増加に比べると非常にゆっくりと増加していきます。

キーワードの組み合わせは無限にあるため、1000番目まで結果が出れば無限のカバレージがあるように思えます。 しかし、非常にニッチなキーワードは誰も入力しないことが多く、存在していても存在意義はあまりなさそうです。 (もちろん、ロングテールという考え方もあります。)

一方で、非常にありふれた単語に対する競争は日々激しさを増しています。 SEO無しでは1000番以内に入ることは不可能と言われるような単語が発生してしまう日が将来的に来るのか?と妄想することもあります。

Webの世界全体が凄い速度で拡大していると思うと、特定のキーワードで1000番目以内に入れないWebページの数は凄い勢いで増加しているのではないかと思われます。 特定のキーワードで検索したときに、関連するWebページの数が増加していくと、恐らく情報の質は上昇していくと思われます。 検索エンジンの精度が日々上昇していって、検索をするWebページの母数が増えれば必ず質の高い情報が出るような気がします。 そうなると、新しい記事を書いて検索結果に反映されるための敷居がドンドン上昇してしまいます。

現状ではキーワードによる検索は機能しています。 恐ろしく効率的です。 しかし、Webの重要度が今よりも上昇し、Webに掲載される情報が爆発的に増大したときに、どうなるのだろうと不思議に思います。

将来的にはキーワードだけではなく、個人ごとにオプティマイズされた検索結果が出るようになると主張する人もいます。 ただ、本当にそれだけで大丈夫なのでしょうか?

この問題に対する解答は今の私にはわかりません。 将来的にこの課題に関する革新的な技術が誕生して、全世界が驚愕するという「検索の次」はどのような技術であり、そして誰がそこにたどり着くのか非常に興味がある今日この頃です。

最近のエントリ

過去記事

過去記事一覧

IPv6基礎検定

YouTubeチャンネルやってます!