上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

下の「Googleの野心―インターネット完全支配?」記事でも触れたGoogleのデータセンター建設ラッシュだが、ノースカロライナ州で6億ドルをかけて建設予定のデータセンターはSimilarity Engineを稼動させる中心となるという。Google to Spend $600 Million for New Datacenter

このSimilarity EngineはGoogleが米国で特許を認められた新技術で、ウェブページ上の文書同士の「似ている度合い」を高速に照合する。意味論的判断を一切排除し、純粋に形式的操作だけで文書の類似度を判断する画期的なアルゴリズムだ。

米国特許庁による特許公報

なお、米国特許庁USPTOの特許文書の図版はTIFFフォーマットを利用しているため、以下のサイトからプレイヤーをインストールして閲覧するよう推奨されている。(IE用とFirefox、Opera用あり) http://www.alternatiff.com/

内容については現在解読中だが、概略としては、文書中に出現する単語に重み付けしたリストを作成、これをベクトル(行列式)化、続いてハッシュ化してsketchと呼ばれる文書の指紋となる値を計算、このsketch値を比較することによって文書が似ている度合いを判断するというもの。

仮に1pの文書のsketch値が64bitだとすれば、10億ページの総当たり比較数は、(10億x(10億-1))/2となり、毎秒10億回の比較が実行できるサーバを使えば5億秒かかる。このサーバを10万台用意すると、5千秒=1時間23分で比較が完了する計算となる。

もちろん総当たり比較の前にさまざまなふるいをかけて「全然似ていない」文書を照合対象から外すことができるはずだから、全世界のウェブページをクロールしながらリアルタイムで「同一文書」を網羅的に発見していくことは十分に可能だろう。

現在トラックバックスパムなど不当ないし灰色ゾーンのSEOによりGoogleのページランクの精度が低下しているとされる。Googleの生命線は、Google創立当初からスパムの排除にかかっている。このSimilarity Engineが期待どおりの成果を上げるかどうかはGoogleの将来にたいへん大きな影響を与えそうだ。

逆に、Similarity Engineが所期の効果を上げ始めたら、合法、非合法を問わずSEO業界を激震が襲うことになるだろう。

スポンサーサイト

少し前のLong Tail Worldの記事だが、ジェフ・ハン氏のマルチタッチ・インターフェイスがすごい:Jeff Han's Multi-touch Interface、確かにすごい。要注目。

詳しい解説は元記事を見ていただくとして、とにかく発明者自身によるデモの動画をご覧いただきたい。

この驚異の「万能」UI、ありとあらゆる応用が考えられそうで楽しい。だが、唯一代替できないデバイスがキーボードと思われる。デモ中でも一応画面キーボードを出してはいたが、さすがに器用なハン氏もやりにくそうな感じだった。キーから指先への複雑なフィードバックがないと効率的なタイピングは不可能。さらに固い平面を直接叩いたのでは衝撃が吸収されなないから指に悪影響が出そうだ。

YouTubeエンベッドネタが続いてちょっと気がひけるが、これもスグレもの。紙からWeb2.0までのメディアの進化をプロモーションビデオ風にテンポよくまとめてある。

メディアパブ他早耳なブログ数箇所ですでに引用されている。アメリカの有力テクノロジーブログSomewhat Frankで紹介されたのを機にブレーク中。

[カンサス州立大Wesch助教授のWeb2.0 プロモビデオ]の続きを読む

I, Cringelyに「Googleの野心―インターネット完全支配?」の続編が掲載されている。

Honesty (and a little TCP Mustang) is the solution to tomorrow's Internet video problem.

結論はWYBIWYG(What You Buy Is What You Get)、つまり「世の中にタダのものはない」。

Web上の「ネット中立性」の議論ではテルコ(マ・ベル)が悪者ということになっているが、やはりネットTV時代のインフラ整備に金がかかることは事実で、それを全部テルコに背負わせるのはやはりムリということのようだ。

タイトル中のTCP MustungというのはNuMetraという新技術のことで、これはインターネット内に一種の特急ネットを作る仕組みのようだ。ぐぐってもまだオフィシャルサイトhttp://www.numetra.com/以外にほとんど情報が出て来ないが、なにやらかなり画期的な技術らしい。いま少し研究してみたい。

サンフランシスコ湾沖でヨットで行方不明になったチューリング賞受賞コンピュータ科学者のジム・グレイはカリフォルニア大学バークレー校で始めてコンピュータ科学で博士号を取ったこの分野のパイオニアだった。残念ながらアマゾンのメカニカルタークを利用したボランティアの画像捜索にもかかわらず、手がかりは発見されていない。

ジム・グレイ関連の記事がいろいろ出ているが、中で目にとまったのはJeff AtwoodのブログCoding Horrorの  The Economics of Bandwidthという記事。

グレイがACM(アメリカ計算機学会)のインタビューに答えてテラバイト級の大きなファイルを転送する歳に「スニーカーネット」を推奨している記事が引用されていた。スニーカーネットというのは、昔、フロッピーを持ってスニーカーで建物の中をコンピュータからコンピュータへと走り回ってデータを移動させたことから来ている。この場合はファイルを記録したハードディスクをそのままFedExで送ってしまう方法を指している。

[Jim Gray とスニーカーネットの帯域幅]の続きを読む

Powersetというベンチャー企業が「PARCから画期的な検索技術のライセンスを受けた」ことが話題になっている。このスタートアップ会社は昨年から「新しい検索エンジンを開発してGoogleを倒す」と主張して相当なベンチャー資金を集めていた。が、その画期的テクノロジーというのが「自然言語による検索」と聞いてはいささか竜頭蛇尾の感がする。

PowersetのCEO、バーニー・ペルの説明によると「Googleなど従来の検索エンジンはストップワード(and, in, by, of, for)を無視する。そこで books for children, books by children, books of chlidrenはすべて同じ[books, children]というキーワードセットに還元されてしまう。自然言語検索ではこれらの単語の意味を汲み取ってはるかに適切な検索結果を返す」のだそうだ。

結論からいえば、Powersetの「新技術」はいかに「PARCの30年の研究の蓄積」だろうと、結局、不発に終わるのではないか。そう予測できる根拠はいろいろある。

[Powerset、自然言語検索エンジンの野望]の続きを読む

大統領選で注目を集めている民主党のオバマ候補が、公式サイトを立ち上げた。ところがそのページの一部に人種や性的志向に関する差別的な表現が紛れ込んでいた。TechCrunch日本版の記事BarackObama.comに非常にみっともないバグによると、「グループを検索」ページの検索例に“Example: Gay Nigger Association of America -#@ for Obama, 16892.” と表示されていたというから穏やかでない。

[オバマ候補の公式サイト、ハックされる?]の続きを読む

Googleの創立者の一人、サーゲイ・ブリン(Sergey Brin)の個人的な情報はほとんど公開されていなかった。ところが今回Moment誌2月号にロングインタビューが掲載されて話題になっている。

Moment誌は1975年にホロコーストの生き残りでノーベル文学賞受賞者の作家・ジャーナリスト、エリ・ウィーゼル(Elie Wiesel)らによって創刊されたユダヤ系コミュニティー向け雑誌。Jewish Culture, Politics, Religion というサブタイトルのとおり、ユダヤ文化、政治、宗教を論じる高級誌である。日頃は秘密主義のブリンもモスクワ生まれのユダヤ人としてのアイデンティティーの側面からこのようなインタビューに応じることになったのだろう。

cap_070216_sergey_400w.jpg

興味深いのはロシアでユダヤ人迫害を体験してアメリカへ移住してきた両親へのインタビューだ。一家はサーゲイが高校生のときにモスクワに里帰りするが、そのとき、サーゲイはソビエト社会に衝撃を受け、父ミハイルに「僕らをアメリカに連れてきてくれてありがとう」と深刻な表情で言ったという。

なお、もう一人のGoogleファウンダー、ラリー・ページも家系としては完全にユダヤ系だということもこの記事ではっきりした。ラリーの母方の祖父はイスラエルのアラドに住み、母はユダヤ教徒として育てられた。ラリーの父もユダヤ系だが無宗教で、ラリー自身もバルミツバ(ユダヤ教の成年式)を受けてはいないという。

Mark Malseed記者は、Googleは2人の(あるいは何人でもよいが)ユダヤ人によって創立された史上最大の企業(のひとつ)であり、「悪をなさない」という律法的なモットー、従業員に対する家父長的な保護、技術部門では博士号取得者だけを採用するエリート主義、訴訟も辞さない強引な業務展開、などにそこここにユダヤ的色彩を濃く持っていると評している。

アップデート (2/18)

CNNによると、2月17日午後、サンフランシスコでエリ・ウィーゼル(78)を襲った男が逮捕された。ウィーゼルに怪我はなかったようだ。ウィーゼルは講演のためサンフランシスコを訪れていたが、滞在先のホテルで20代の白人男性がウィーゼルにインタビューを強要、エレベーターから無理やり引きずり出したという。反ユダヤ主義のhate crimeらしいが詳しい動機などは明らかになっていない。

オライリージャパンとCMPテクノロジージャパンは、『Web 2.0 EXPO Tokyo』を2007年11月15、16日の2日間、六本木の泉ガーデンで開催する。キーノートはティム・オライリー自身がひさびさに来日して務めることが発表された。

ニュースリリース
公式サイト

CMPテクノロジージャパンは1993年、Ziff-Davis conference and Exposition Company の日本法人として設立され、以降毎年Interop Tokyoを主催してきた。ソフトバンクのZDへの資本参加にともないソフトバンクフォーラム株式会社となる。現在は英国に本部を置く国際総合メディア企業United Business MediaのB2Bメディア部門CMPの日本法人。

カンファレンスのアドバイザリーボードにはジョイこと伊藤穣一氏、「ザ・サーチ」のジョン・バッテル氏などの名前が並んでいる。セミナーの内容や出展者はこれから決まっていくものとみられるが、ティム・オライリーが来るとなれば相当の注目を集めることはまちがいないだろう。期待がもてる。

Hitwiseのレポートによると、GoogleからWikipediaへのトラフィックは着実に増大を続けている。下の図はWikipediaにトラフィックを送り込んでいる検索エンジンのシェア。Googleが順調にシェアを増やし、その分だけYahoo! Searchが食われている。MS Searchを含むその他大勢はあまり変化がない。

逆にGoogleから出るトラフィックの行き先としてもWikipediaは3位になった。1位はGoogleイメージ検索、2位はMySpaceだという。

070218_hitwise021607-1.png

2007年に入ってからYouTubeを巡ってのGoogleと全米テレビネットワークの交渉が軒並み暗礁に乗り上げている。TechCrunch日本版から目に付いた記事を拾っただけでも以下のとおり。

GooTube、Viacomからの手厳しいコンテンツ取り下げ要求に直面

NBCもGoogleに追い討ち―YouTube戦略に疑問符

GoogleとFoxの再交渉に思わぬ暗礁?

YouTube、ユーザー情報をFoxに手渡す

さらにウォールストリートジャーナル紙は2月21付でGoogle-CBS Deal Dead For Now; YouTube’s Tough Going With TV Networks「GoogleとCBSの交渉は当面中断―YouTubeのイバラの道」と題する記事で、一時有望に見えたCBSのYouTubeへの番組配信契約の交渉は完全に停止状態だ報じている。問題はやはり著作権使用料、広告収入の分配金額の問題のようだ。

一方ViacomはYouTubeをバイパスして独自にインターネットへの配信を試みている。TCJの記事Viacom、Joostとの提携に調印へでマーシャル・カークパトリックは「テレビ番組がJoostのような別のチャンネルで配信されることになると、プロの制作した番組とアマチュアの投稿をすべて一箇所で見られるような便利なサービスが実現されるという希望に暗雲がかかってくることになる」と懸念を示している。

Googleは名うての「しわい」会社なので、赤字が出るような契約は絶対に調印しない。予想されるYouTubeからの収入からGoogleがはじき出した数字と、テレビ局側のGoogleによる大盤振る舞いの期待とのギャップが大きすぎたのだろう。

ここは双方の我慢比べがしばらく続くことになるのか?

J-CASTが報じた電通の「2006年日本の広告費」によるとネット広告が29.3%増の3,630億円と大幅に伸び、雑誌にほぼ追いついた。全体のパイは前年から変わらず6兆円で、食われたのはテレビ(2兆161億円、1.2%減)と新聞(9,986億円、3.8%減)、雑誌(3,887億円、1.5%減)。

額、率ともに新聞の落ち込みが大きく、ネット広告と新聞広告が直接の競合関係に入っていることが見てとれる。消費税アップとなれば新聞の販売部数の落ち込みは確実。広告収入がこのままネットに食われていくと下位の全国紙が経営危機に陥ることは避けられまい。

YouTubeのトラフィックはViacomの著作権コンテンツ取り下げ要求後も急上昇している。

HitwiseのブログによるとYouTubeのトラフィックはViacomのコンテンツ取り下げ要求後14%増加し、ネットワークテレビ局サイトの合計を抜いたということだ。YouTubeより大きなトラフィックを集めているドメインはGoogle本体を除と、MySpace、Yahoo、Hotmail、MSN、eBay、Live Search、Facebookだという。これでテレビ局とGoogleの「我慢比べ」は、テレビ局側の分がさらに少し悪くなった。

070224_hitwise_youtubes.jpg

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。