文字符号の歴史—欧米と日本編

安岡 孝一 (著), 安岡 素子 (著)
出版社: 共立出版 ; ISBN: 4320121023 ; 欧米と日本編 巻 (February 2006)

これはいいね

文字符号の成立過程やその内容に関しては、伝聞や根拠のない憶測はいっさい避け、あくまで文献によって裏づけのとれる事柄だけを、参考とした文献とともに示した。文献学や科学史研究においては、ごくあたりまえとされていることを、あたりまえにやっただけである。

文字符号についての基礎文献になることは間違いない

残念なのは、記述がJIS X 0213の制定(2000.1.20)までで終わっていること。私自身はJIS X 0213の文字セットをUnicodeで使うのが「現実」的だと考えているからまあいいのだが、特に人名・地名などで異体字にこだわる人もいて、そういう人にとって唯一の手段であろうAdobe-Japan1-5(2002.9.20)あるいはAdobe-Japan1-6(2004.6.11)はあとがきで触れられているだけ

その欠点を補うように、著者の一人が論文を公開している。すばらしい

Adobe-Japan1-6とUnicode—異体字処理と文字コードの現実

別に私は、Unicodeがだめだと言いたいわけではない。ただ、

  • Unicodeに登録されている漢字のうち、JIS X 0213にも含まれているものだけを使うべき(これを調べる方法はまた別の機会に)
  • コードは違っていても意味は同じであるような文字を認識する仕組みが必要(つまり日本語にとってはUnicodeだけでは不十分)

だと思う。2点目の例として、次の5字を挙げておこう(Unihan Databaseにはvariantsとして登録されているのだから、U+6717とU+F929の同一視は不可能ではない。実際MacOSXでは実現されている、すべてのアプリではないとしても)。上で紹介した論文では、8489と14098のunicodeが逆になっている

6717.png

CID=8489とCID=20305の違いがわからないという向きは下を(小塚明朝Pro-VIでのもの。ヒラギノ明朝Proではこのデザイン差はない)

8489vs20305.jpg

理想」を言うなら、白川静のおおせのとおりに、字体をあるべき姿に戻してもらえるとおもしろいんだけどなあ。いろんな意味で、そういうわけにはいかないのだけれど

4 thoughts on “文字符号の歴史—欧米と日本編

  1. U+F929をU+6717とどう切り分けるべきかは、確かにアタマの痛い問題なんですが…。JIS X 0213:2000の立場としては、1-85-46(U+F929)はあくまで人名用漢字許容字体専用の符号位置なので、いかなる包摂も許されず、例示字体に従えばAdobe-Japan1-5のCID=20305にしか対応しえないんですよね。ところが、2004年9月27日の人名用漢字改正では、CID=20305ではなくCID=8489が人名用漢字になってしまった。で、私もだいぶ悩んだんですけど、『Adobe-Japan1-6とUnicode ― 異体字処理と文字コードの現実』では、CID=8489とCID=20305の両方を、U+F929に対応させておくことにしたのです。

  2. > U+F929をU+6717とどう切り分けるべきかは、確かにアタマの痛い問題なんですが…。JIS X
    > 0213:2000の立場としては、1-85-46(U+F929)はあくまで人名用漢字許容字体専用の符号位置なので、
    > いかなる包摂も許されず、例示字体に従えばAdobe-Japan1-5のCID=20305にしか対応しえないんですよね。
    1-85-46には包摂基準を適用しないということは知らずに書いていました
    JIS X 0213の規格票で確認しました
    > ところが、2004年9月27日の人名用漢字改正では、
    > CID=20305ではなくCID=8489が人名用漢字になってしまった。
    これは絶対のものなのでしょうか
    確かに、小塚明朝Pro-IVではCID=8489とCID=20305の字形は区別されていますが、
    ヒラギノ明朝Proでは区別されていません
    人名用漢字は「朗」に点が増えたものを指定しているだけだと考えることはできない
    のでしょうか。Unihan DatabaseではU+F929に対応しているのはCID=20305だけですし
    > で、私もだいぶ悩んだんですけど、『Adobe-Japan1-6とUnicode―異体字処理と文字コードの現実』では、
    > CID=8489とCID=20305の両方を、U+F929に対応させておくことにしたのです。
    私がここに書いたのは、
    私の環境(Adobe InDesign CS, 小塚明朝Pro-VI Ver. 6.005)で
    あのようになっていたからですが、何の疑いも抱かずに書いたのは
    軽率だったかもしれません

  3. えっと、CID=8489とCID=20305の字形の区別、ってのは「絶対のもの」じゃない、と私も思います。というのも、この程度の差は、『常用漢字表』の付録「明朝体活字のデザインについて」で、はっきりと「デザインの違いに属する事柄であって,字体の違いではない」とされてますから。その意味では、Adobe-Japan1-5がCID=8489とCID=20305を分けてしまったのが、そもそも「やり過ぎ」だったんじゃないか(CID=8489をちょちょいとイジるだけでも、よかったんじゃないか)、というのが正直なところです。
    このあたりの話を、以前、内田明さんのところhttp://d.hatena.ne.jp/uakira/20050731/ でも議論したので、よければご参照下さい。

  4. > このあたり、内田明さんのhttp://d.hatena.ne.jp/uakira/20050731/
    > でも議論になったので、よければごらん下さい。
    「問題を発見した」というつもりはなかったのですが、
    より深い議論がすでになされていたのを知らなかったのは不勉強でした
    > 実のところ、Adobe-Japan1-5がCID=8489と
    > CID=20305を分けてしまったのが、そもそも「やり過ぎ」だったんじゃな
    > いか(CID=8489をちょちょいとイジるだけでも、よかったんじゃないか)、
    > というのが正直なところです。
    こういう話を聞けると実はうれしいです。小塚明朝は、書体としての「デザイン哲学」のようなものを重視していないという印象があります

コメントは停止中です。