上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Googleが今日の大をなした基礎が共同創立者ラリー・ペイジの発明したペイジランクと呼ばれるウェブページと検索キーワードの関連性を評価するシステムにあることはよく知られている。

しかし、それではペイジランクのどこがそれほど優れていたのかはあまり広く理解されていない。

巨大なデータに対する全文検索システムも検索語に対する検索対象の関連性を評価するシステムもGoogle以前から存在した。クローズ・システムでは現在も種々の検索システムが利用されており、必ずしもGoogleのアプローチが絶対ではない。

しかしGoogle以前のシステムはウェブというオープンな世界を検索するシステムとしては致命的な欠陥が存在した。スパムに弱いことである。ページ中に「car car car car...」と繰り返せば検索システムはそのページが自動車に関連があるにちがいないと評価してしまう。

ウェブページに適当な単語を埋め込むのに比べて、外部からリンクを張る行為は比較にならないほどコストがかかる。そのため「ページに向けて張られたリンクの数を数える」というペイジランク・システムは飛躍的にスパム耐性を高めることができたのである。

このブログでもGoogleがリンク売買に厳しい態度をとっていることに触れ、「リンク(記事)の売買でページランクが歪められることになれば、ビジネスの根幹を揺るがす大問題だ。厳しい対応を取るのは当然」と評した。

予想通り、Googleは最近、参加ブログのペイジランクをゼロにするという制裁を加えてPayPerPostネットワーク全体を壊滅に追い込んでいる

セマンティック・ウェブの「セマンティックな」メタデータは基本的にドキュメントの制作者が自由にコントロールできる。つまり検索エンジン・スパムに関してはGoogle以前の振り出しに戻ってしまうわけだ。

信頼関係で成り立っているクローズ・ネットワーク内のドキュメントの構造化手法としては興味ある試みだが、オープンなウェブ世界には故意に不正を働いて巨額の収入を得ようとする輩が充満している。セマンティック・ウェブが汎用のウェブ検索のベースとなるには、超えなければならないハードルが高い。

スポンサーサイト
コメント
この記事へのコメント
コメントを投稿する
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://socweb.blog80.fc2.com/tb.php/160-57e9e630
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。