AOLが検索ログを公開


今に始まったことではないのかもしれないけど、なんだかうまく行かないAOLの最近の大ヒット。

政府への提供すら拒否したGoogleやMSNと比べると、「古き良き」という言葉が浮かぶほどのおとぼけぶり。それでも、事態の深刻さは理解したらしい。

謝ろうが責任者を首にしようが、一度出回ってしまったデータの回収は不可能だろうね。今日現在、ミラーはいたるところにあるから、探せばすぐに見つかるはず。

Aol Search DatabaseAOL Search Logs, AOLpsychoのように、ある程度遊べる形のページが公開されているから、生データを入手して加工する必要はないかもしれない。がんばれば、個人を特定できるかも(データの利用法としては感心しないけど)。

よく見てみると、AOLpsychoは連続する行のクエリが同じ場合、最後のClickURLしか返していない。Aol Search Databaseは何を検索しているのかよくわからない(最初のデータファイルの最初の行からして入っていない?)。ちゃんと使えるのはAOL Search Logsだけっぽい。これもAnonID=2955040のデータが1行足りないし、AnonID=9403684のClickURLが1つ欠けているんだけど、まあ許せる範囲か。

Thelma Arnoldさん、AOLデータから特定された最初の人(TechCrunch)この婦人

検索エンジンはパーソナライズを目指していろいろやっているから、気をつけたほうがいいかもしれない。AOLをenhanceしているはずのGoogleは?

「AOLの二の舞にはならない」:グーグルCEO、検索情報の漏えい問題で(CNET)

大丈夫かなあ。いずれにしても、個人を特定できるようなキーワードで検索するのは控えめにしたほうがいいかもしれない。「そうしているから大丈夫」という向きも、たとえばこんなhackに対しても、大丈夫だと言い切れる? それには、(略)

それにしても、AOLは失態が止まらない。

AOL、無償版「AOL 9.0」がバッドウェアに指定(CNET)

Active Virus Shieldなんかも、一見すごくいい感じだけど、AOLだからと思って気をつけてみると、うーん、スパイウェアか。

Related posts:

  1. Amazon.comのフルテキスト・サーチ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>