階層的クラスタリングは、非類似度の指標とクラスタの連結法にたくさんの選択肢があって、いろいろ試すことができます。たとえば、Rのhclustには、クラスタの連結法としてwardとsingle、complete、average、mcquitty、median、centroidがありますが、medianとcentroidでは、連結によって非類似度が必ずしも増加しないため、デンドログラムがおかしくなる危険があり、使いどころが難しいです。
おかしくなる例を一つ紹介します(RSSリーダーではコードが見えないかもしれません)。
こうしたパラメータを、都合の良いクラスターが出てくるように選んだりする場合もありますからね。ルールが必要とは思いませんが、使う人は少なくとも原理は分かっていてほしいなと思います。