Unicodeのすべての文字を1回ずつ使って絵を描く

文字の並びで表現された絵は一般にアスキーアートと呼ばれます。その名前からは、使える文字がASCII文字に制限されているように思えますが、実際はそうではなく、なんでもありです。「MS Pゴシック」に含まれる文字を使うのが伝統でしょうか。

先日数えてみたように、Unicode 6.0にはGraphic Characterが109242個あります(参照:Unicodeのすべての文字を1ページで)。使える文字をここまで広げると、いわゆるアスキーアートのように文字の形を利用するのではなく、文字の濃さを利用して絵を描けます。(Graphic Charactersに印刷できない文字も含まれていることは、ここでは無視します。)

せっかくこれだけの文字があるので、それぞれの文字は1回しか使えないという制約を入れましょう。正方形のキャンバスなら、331 × 331のグリッド上に文字を並べることになります(331 x 331 = 109561は109242以上の最小の平方数)。ちょっと文字が足りないので、その分は半角スペースで補うことにします(109561 – 109242 = 319個)。

こんな絵が描けます(クリックで拡大、PDF 23MB)。

Unicodeのすべての文字を1ページで

この記事で作るもの:Unicode 6.0のすべての文字を1ページで (PDF, 23MB)

4327377368ヨハネス・ベルガーハウゼン, シリ・ポアランガン『世界の文字と記号の大図鑑 ー Unicode 6.0の全グリフ』(研究社, 2014)の著者はUnicode 6.0の全109242文字2時間30分かけて見るビデオの作者ですか。今度は1024ページの書籍。「Decodeunicode」で画像検索すると原著が出てきますが、楽しみですね。(追記:世界の文字と記号の大図鑑

「Unicodeのすべての文字を印刷した本って、前にもなかったっけ?」と思って本棚を探したのですが、勘違いでした。

0321480910頭に浮かんだのはThe Unicode Consortium『The Unicode Standard, Version 5.0』(Addison-Wesley Professional, 2006)(文献リストあり、索引なし)だったのですが、この本は、(1) The Unicode Standard、(2) Code Charts (PDF)から漢字を除いたもの、(3) Han Radical-Stroke Index (PDF)という構成でした。つまり、漢字はコードポイント順に一つずつではなく、Han Radical-Stroke Indexという形で掲載されているだけでした。

Unicode 5.0より後は、紙媒体ではないようですが、たとえば6.0について同じことをするなら、 (1) The Unicode Standard (PDF)、(2) Code Charts (PDF)、(3) Han Radical-Stroke Index (PDF)を使うことになるのでしょう。(Code Chartsには漢字も含まれているので、「文字の一覧(番号順)」が欲しいだけならCode Chartsだけで十分です。)

これらの資料もいいのですが、こういうのは、自分でもちょっとやってみたいところです。例えば、Unicodeの全文字を1ページに、なんてことも、自分で作れるようになればできます。

というわけで、必要なデータをEnumerated Versions of The Unicode Standardから探して作ろうとしたら、これがなかなか面倒でした。

Unicode 6.0の全文字は、UnicodeData.txtに載っているはずですが、この第1列をHTMLの数値文字参照に置き換えるだけでは終わりません。

UnicodeData.txtには、CJK統合漢字など、1行1文字になっていない部分があります。それを補うのは面倒なので、Unicode 5.1以降で導入されたUnicode Character
Database in XML
を使うことにします。このXMLファイルは、char要素1個が1文字に対応します。

XMLファイルには、印刷できない文字?も含まれているので、それを除外しなければなりません。Unicode 6.0のコードポイントは109449個ありますが、そのうちGraphic Characterは109242個です(参照)。『世界の文字と記号の大図鑑』の109242文字というのはこれのことなのでしょう。Graphic Characterの定義General_Category ValuesThe Unicode Standard Chapter 2 General Structureの「Table 2-3. Types of Code Points」を見ると、char要素のgc属性値がCから始まるものとZl, Zpになっているものは除外しなければならないことがわかります。(異体字セレクタのような、明らかに印刷不能な文字が残るのですが、とりあえずはそのままにします。それを使う異体字もここでは数えません。)

というわけで、ちょっとスクリプトを書いて、Unicode 6.0の文字の一覧を作ります。

こんなHTMLファイルです。このファイルは、Unicodeの文字を数値文字参照で書いてあるだけのものなので、文字を実際に表示できるかどうかは環境によります。Noto花園明朝などを入れた環境で、Firefox 31とChrome 36を試したところ、FirefoxはUnicode 6.0のすべての字形を表示できたようですが、Chromeはぜんぜんだめでした(目視以外の確認法がわかりません)。

Windows上のFirefoxでAdobe PDFに印刷した結果が冒頭のPDFファイルです。

完成に必要な無料フォントを列挙する(あるいはもっとよい方法の提案)という自由研究を、どこかの小学生がやってくれることを期待します。

関連:Unicodeのすべての文字を1回ずつ使って絵を描く

追記:The Unicode Map Projectがすばらしいです。

本を読む人のための書体入門

4061385410

茨木のり子の有名な詩に「自分の感受性くらい自分で守れ」という言葉があります。

その言葉には、字のうまさよりも、タイピングの速さよりも、ずっと大切なことがこめられていると思うのです。(p.129)

「内容と形式を分離するのが原則で、内容の記述にはHTMLを、形式の記述にはCSSを使います」なんてことをよく言って、たしかにウェブはそのおかげでうまくいっているわけですが、その原則がいつでも通用するかというと、そういうわけではありません。

その例として私がよく使うのは、Knuth『The TeXbook』に掲載されている下の文章です。

円形の組版

ここで言っている形式は、「文章の構造」ではなく単なる「見た目」のことです。文章の構造が見た目と無関係かというと、そういうわけでもないのですが。

こういう例を持ち出すまでもなく、書体でさえも、文章の意味に影響するということは、なんとなくわかっているのですが、そのことをはっきりと説明してくれるのが、正木香子『本を読む人のための書体入門』(星海社, 2013)です。世に書体の本はたくさんありますが、同著者の『文字の食卓』や本書のような視点で書かれたものを、私は他に知りません。

『文字の食卓』は「味覚」が全面に出ていましたが、『本を読む人のための書体入門』でこだわっているのは、趣の意味での「味」です。著者の正木さんはこの2つの概念がかなり近いという特殊な感覚を持っています。

子供の頃、自分が好きだと思う書体、慣れ親しんでいる書体がつかわれている本から読んでいたとのことですが(p.102)、そんな人は極めてまれで(私は聞いたことがない)、そういう人だからこそ書ける本でしょう。

4088518314冒頭で紹介されるのはなんとあの、『ドラゴンボール』(連載第1回)! かつて夢中になって読んでいたはずなのですが、大切なことはまったくわかっていなかったのかもしれません。

関連(対極):フォントのグラデーション

文字の食卓

4860112474正木香子『文字の食卓』(本の雑誌社, 2013)

自分が好きなものを好きだと言っておかないと、消えてしまったときに後悔する。インタビューによると、読んでいた雑誌の書体が断りなく変わったことへの「怒り」から立ち上げたサイト「文字の食卓」を書籍化したものだという。音を聞くと色が見える、いわゆる共感覚とは、厳密には違うのかもしれないが、著者の正木さんは、文字を味覚に結びつける。失われつつある写植の書体を中心に選んだ39書体の「味」を綴った(静かな)衝撃のエッセイ。

『鈴木勉の本』(字游工房)に大きな影響を受けているとのこと。参考文献リストなし・索引なし。

好きなものは好きだと言っておく。

ウェブサイトの「"ヒラギノ角ゴ Pro W3", "Hiragino Kaku Gothic Pro", "メイリオ", Meiryo, Osaka, "MS Pゴシック", "MS PGothic", sans-serif」の味も気になる。

ヤン・チヒョルト展

4306094316ヤン・チヒョルトが卓越したタイポグラファであったことの証のひとつ、『アシンメトリック・タイポグラフィ』(鹿島出版会, 2013)が、ちょうど最近出版されたところでした。

4568502772彼はまた、卓越した書体デザイナーでもありました。たとえば、小林章『欧文書体』(美術出版社, 2005)によれば、彼の作成したSabonは「洗練という言葉が最もふさわしいローマン体の一つ」(p.43)とのことです。

そんなヤン・チヒョルトの展覧会が、ギンザ・グラフィック・ギャラリー(ggg)で開催されています。

Jan Tschichold ヤン・チヒョルト展

11月26日(火)まで。