Unicodeから見ると、JIS漢字は1文字増えます

まずは用語の確認を

ここでいうJIS漢字とは、JIS X 0213:2004に含まれる漢字のことです。メールなどで使われているISO-2022-JP(いわゆる「JISコード」)がサポートする漢字のことではありません。ちなみにISO-2022-JPはISOの規格ではありません

ここで読むのをやめる人がたくさんいるでしょうね

本題です。JIS漢字は何字あるでしょうか

JIS X 208で規定される漢字が6355、JIS X 0213で規定される漢字は10050字のはずです。でも、みんな大好きUnihan Database(Unicodeの漢字データベース)のデータをテキストファイルで持ってきて、

awk '!/^#/{if($2=="kJis0") print $1}' Unihan.txt | uniq | wc -l

などとしてみると(kJis0というのはこのデータベースにおけるJIS X 0208のラベル)、あら不思議、JIS X 208の漢字が6536字あります

JIS X 0213はといえば、ラベルの部分を「kJIS0213」にすると数えられて、3695字だとわかります。これは、0213の漢字というよりは、0208にはなくて0213にある漢字だと解釈すれば、10050-6355=3695なので、あっています。ちなみにJIS X 0212(ラベルはkJis1)は5801字で、これも大丈夫です

犯人(字?)は「」です。この字はJIS的には「仮名又は漢字に準じるもの」であって漢字ではないのですが、日本以外でも使われていて、Unicode的には漢字です

というわけで、Unicode的にはJIS漢字は10051文字になるのです。ちなみに手元の新漢語林にも「仝」は収録されています(もちろん漢字として)

おまけ:漢字の一覧

  • JIS X 0208:第1,2水準(携帯で表示できるのはこれだけでしょう)
  • JIS X 0212:補助漢字
  • JIS X 0213の第3,4水準:FirefoxやOperaは、𠀋 (U+2000B)以降を漢字とは見なしていないようで、wordwrapにとまどっています。MS書体の場合、新しいのじゃないとだめです

ブラウザによっていろいろです