階層的クラスタリングでデンドログラムが変になる例

階層的クラスタリングは、非類似度の指標とクラスタの連結法にたくさんの選択肢があって、いろいろ試すことができます。たとえば、Rのhclustには、クラスタの連結法としてwardとsingle、complete、average、mcquitty、median、centroidがありますが、medianとcentroidでは、連結によって非類似度が必ずしも増加しないため、デンドログラムがおかしくなる危険があり、使いどころが難しいです。

おかしくなる例を一つ紹介します(RSSリーダーではコードが見えないかもしれません)。

1 thought on “階層的クラスタリングでデンドログラムが変になる例

  1. こうしたパラメータを、都合の良いクラスターが出てくるように選んだりする場合もありますからね。ルールが必要とは思いませんが、使う人は少なくとも原理は分かっていてほしいなと思います。

コメントは停止中です。