階層的クラスタリングでデンドログラムが変になる例


階層的クラスタリングは、非類似度の指標とクラスタの連結法にたくさんの選択肢があって、いろいろ試すことができます。たとえば、Rのhclustには、クラスタの連結法としてwardとsingle、complete、average、mcquitty、median、centroidがありますが、medianとcentroidでは、連結によって非類似度が必ずしも増加しないため、デンドログラムがおかしくなる危険があり、使いどころが難しいです。

おかしくなる例を一つ紹介します(RSSリーダーではコードが見えないかもしれません)。

階層的クラスタリングでデンドログラムが変になる例” への1件のコメント

  1. こうしたパラメータを、都合の良いクラスターが出てくるように選んだりする場合もありますからね。ルールが必要とは思いませんが、使う人は少なくとも原理は分かっていてほしいなと思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です