Googleの全貌

Googleの全貌 (単行本(ソフトカバー))日経コンピュータ『Googleの全貌』(日経BP社, 2009)

情報系の学生には、「Googleに先を越された」という苦い経験を持つ人がかなりいる。そういう苦い経験は必ずしも悪いものではないのだけれど、「できれば避けたい」という場合に取り得る戦略ですぐに思いつくのは次の2つ。

  • 先を越されないようにがんばる
  • Googleとかぶりそうなことはしない

後者の戦略を採用するなら、まず最初に、Googleが何をしているのかをよく調べなければならない。

4774134325この本は、そういうときに最適な1冊。西田圭介『Googleを支える技術』(技術評論社, 2008)のテーマがGoogleの「技術」だったのに対し、本書のテーマはGoogleの「技術戦略」である。

『Googleを支える技術』もかなりいい本で、輪講に使ったりもしたのだが、Googleの社員が発表した論文を解説するという形式ゆえに、お世辞にも「一般向け」と言えるものではなかった(それでも書店で平積みなっていたのには笑ったが)。

『Googleの全貌』が扱う内容は『Googleを支える技術』より広い。MapReduceのような、共通して扱われるトピックの技術的な詳しさにおいては『Googleを支える技術』が上だが、『Googleの全貌』では論文にはなっていないような技術も数多く取り上げられており、しかもそれらの記述がすべて、「戦略」をとらえるために必要なレベルにとどめられている点でバランスがいい。

本書のかなりの部分は、ITProの「グーグルが描くテクノロジの未来」で読めるのだが、こうして改めてまとめられたものを読み返すと、断片的に読んでいたときには立てなかった視点に立てる。

本書に書かれていることが「Googleの全貌」なのかといえば、そういうわけではないと思う。たとえば、最近の中国での事件で見られた、世界を変えるもう一つの方法などは、本書では見えない。とはいえ、情報系の学生のためのよい本であることに変わりはない。

どのハードディスクが危険なのか

追記:What Hard Drive Should I Buy?

Googleを支える技術 ~巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ) (単行本(ソフトカバー))コンピュータのパーツで故障しやすいものの代表格はハードディスクとファンだろう。特にハードディスクはファンに比べて壊れたときに失うものが多いため、なるべく壊れにくいものがほしい(もっとも、ファンが壊れて火事になるほうが、失うものは多いかもしれないが)。

買ってきたPCに搭載されているハードディスクを使っている限りにおいて、そういうことを気にする人はほとんどいないだろう。しかし、ハードディスクを追加するような場合には、故障率が低いと言われているメーカのものを使いたいという人は多いはずだ。

残念なことに、メーカごとの故障率のデータが、衆目を集めるということはあまりない。たとえそういうデータを持っていたとしても、その影響力に尻込みして発表を控えるということは理解できる。たとえば、膨大な数のハードディスクを利用しているGoogleは当然、メーカごとの故障率のデータを持っているはずだが、それは慎重に隠されている。Googleが発表しているのは、次のようなことだけだ(詳細は、論文:Failure Trends in a Large Disk Drive Populationや、この論文についての解説を収録した西田圭介『Googleを支える技術』(技術評論社, 2008)を参照)。

  • 長く使うと壊れやすくなるわけではない
  • よく使うと壊れやすくなるとも限らない
  • 温度が高いほど壊れやすいということもない
  • いくつかのSMART値は故障率に大きく影響する
  • 故障率に影響しないSMART値も多い
  • SMART値だけではいつ故障するかはわからない

これらの事実が有用であることは認めるが、メーカごとの故障率に比べれば、当たり障りのないことだとも言える。

だから、「データ復旧業者がHDD復旧統計データの2009年版を公開」などと言われると、「本当にそんなデータを出してしまっていいの?」と思ってしまうわけだ。注目した人も多いだろう。

タイトル はてな コメント トラックバック
どのハードディスクが危険なのか、データ復旧業者がHDD復旧統計データの2009年版を公開 (GIGAZINE) ×
どのハードディスクが危険なのか、データ復旧業者がHDD復旧統計データの2009年版を公開(livedoor ニュース) ×
2008年製はハズレ? HDDのデータ復旧、依頼が多いメーカーは(Biz.ID) ×
日本データテクノロジー、2009年に復旧依頼をうけたHDD約4万台の統計調査(マイコミ) × ×
日本データテクノロジー、データ復旧対象のHDDメーカー比率を公開 (PC Watch) × ×

この話についての結論:よくわからなかった

期待して読んでみたが、メーカごとの故障率が発表されたわけではないことがわかった。そういう意味で、Biz.IDのタイトルは若干不誠実だと思う。どの記事も、プレスリリースをそのまま記事にしただけの感じ。そもそも何を意図した発表だったのかがわかるような書き方にはなっていなかった。(PC系のニュースサイトなら、メーカごとのシェアのデータと合わせるくらいの工夫はしてもいいのに。)

マスメディアの新人教育では「裏を取る」ことの重要性が強調されるらしいが、個々のネットメディアにそれを求めるつもりは私にはない。ネットには、いろんな意見を集約する機能があり、それによって、はじめは不完全だった情報が、少しずつ豊かなものになっていくことが期待できるからだ。そういう意味で、コメントもトラックバックも受け付けていないネットメディアは、もう少し工夫して欲しい。

Google PageRankの数理

Google PageRankの数理 ―最強検索エンジンのランキング手法を求めて― (単行本)Googleがウェブページの順位付けに用いている指標の一つであるPageRank。最近ではその重要度が下がっていて、“Googe Pagerank is Dead!”などと言われたりもするのだが、アイディアはとてもシンプルで、(対象ページが少なければ)実際に計算するのも簡単なため、「ウェブページの順位付けと言えばまずPageRank」という状況はまだ当分続くだろう。(「Google検索アルゴリズムで生態系崩壊を予測」などという応用もある。)

PageRankについての概説と言ってまず思い出すのは「Google の秘密 – PageRank 徹底解説」だが、さらに徹底的に解説した書籍『Google PageRankの数理』が翻訳された。

数学的な細部も詳しく説明されていて便利なのだが、コーヒーブレイク的なコラムも充実していておもしろい。

たとえばGoogle Bomb。

実際にウェブページの順位付けをしようとすると、PageRankのような数学的に整理されたきれいなものだけでなく、いろいろと細かい調整をしなければならなくなる。Google Bombはその一例だろう(参考:ブッシュ大統領もひと安心? グーグルが無力化したネット上の「爆弾」

『Google PageRankの数理』によれば、Googleは2004にはこの問題への対応を始めている(原書 p.55)。不思議なことに、それからずいぶん時間が経っているにも拘わらず、MicrosoftのBingやYahoo! Japanは、現時点で、Google Bombのもっとも有名な例「miserable failure」にさえ対応できていない(Yahoo.comは大丈夫)。

グーグル―Google 既存のビジネスを破壊する

グーグル―Google 既存のビジネスを破壊する  文春新書 (501)佐々木 俊尚
文藝春秋 (2006/04)

ネットで何が起こっているかなんてまったく知らない人たちのために、Googleのすごさをわかりやすく楽観的に語ったのが梅田望夫『ウェブ進化論』だった。これに対して、検索エンジンとしてのGoogleのことは当然知っている人たちのために、アドワーズやアドセンスの詳細やGoogleの怖さを語ったのが本書。

本書の最大の特徴は、Googleの怖さについて語った最終章、「すべてを支配していく」にあるだろう。Googleが必ずしも「善」とは言えない事例が紹介されている。

  • 悪徳商法を扱ったサイト「悪徳商法マニアックス」の問題。Yahooで「悪徳商法」を検索すればトップにくるような有名サイトが、Googleの検索では出てこないのだ(「上位にならない」ではない)。あらゆる情報がGoogleに集まる状況下では、Googleで検索しても出てこなくされてしまうこと(グーグル八分)のデメリットは非常に大きい。「検索結果に手を加えない」というGoogleの主張を鵜呑みにしてはいけない。
  • アドセンスが突然停止され、その詳細な理由が開示されない問題。こういうことは、技術的が改良で少なくなっていくのかもしれないが、個人顧客は現時点では大切にされないということは言えるだろう。
  • 中国に提供している検索エンジンでは、中国政府による検閲が容認されている問題。「Googleがまったく使えないよりは制限付きでも使えた方がいい」という見方もあるかもしれない。しかし、「言論の自由よりはビジネスの拡大のほうが重要」だという意思表示ともとれるのだ。
  • 精密航空写真の消去の問題。米国以外の国からのクレーム(軍事機密が漏れるなど)は聞かないくせに、米国の軍事施設の精密写真は(自主?)規制して見えなくしているらしい。米国政府を敵に回しては生きていけないからという現実的な理由もあるだろうが、「無邪気な技術者集団」ではないことは明らかだろう。

ビッグブラザーのようなわかりやすい監視体制ではなく、国家による監視とマーケティング的な監視が結びついてネットワーク化され、監視されていることにさえ気づかないアセンブラージョを実現する下地が整いつつあるというのだ。

面白いことに梅田氏は、このようなネガティブな面ではなく、あくまでGoogleのポジティブな面について述べた部分をもって本書を評価している。

佐々木俊尚著「グーグル」の真骨頂は、佐々木さんが、社会部記者としての実力をいかんなく発揮して書かれた「グーグルと日本の零細企業の結びつき」を詳細に描く第二章「小さな駐車場の「サーチエコノミー」、第三章「一本の針をさがす「キーワード広告」」、第四章「メッキ工場が見つけた「ロングテール」」にある。(「グーグルをどう語るか」を巡って

そして、問題点については次のように述べている。

個別の「不幸な出来事」は実験途中のバグだと認識し、バグ情報をもとに改善に向かう。振り返って、出てしまったバグの後始末をやろうとはしない。「やろうとしない」が言いすぎならば、「適当にローカルオフィスで何とかしておいてね。でも、そんなことのために組織作ったりするなよ。予算も使うなよ。だって来年にはシステムがうんとよくなって、そんな問題が発生する確率は下がるかもしれないからね。じゃあ、よろしくー」が、グーグル開発陣の感覚なのである。(同上)

しかし、上に列挙したなかで、アドセンスの問題以外は、技術的に簡単に解決できるとは思えない。

「Googleは主義を曲げた」――創設者、中国での検閲を語る(ITmedia)

追記:tiananmen(天安門)でGoogleイメージ検索(Web屋のネタ帳) (2006.6.12)