「404 Blog Not Found:Unicodeは文字集合か符号化方式か」 で紹介されていたこの本を読んだ。
電脳社会の日本語 | |
加藤 弘一 文藝春秋 2000-03 売り上げランキング : 10951 おすすめ平均 普段何気なく使っている日本語を見直す機会になりました Amazonで詳しく見る by G-Tools |
戦前から話が始まるので、コンピュータの話が出るまで、ちょっと億劫だけど、だんだん面白くなって、Unicodeにからむユニコード推進派と日中韓(CJK)の動きなどは、一気に読んでしまった。
一介のユーザにとってはまさに対岸の火事だが、標準をまとめる当事者の方々は大変だろうなぁ、と想像。
・採録字体の決定過程における、「正しい○○語」対「一般的に流通してしまっている漢字」の取捨選択。
・コード実装における「唯一のコード」「データ量の節約」「コードマッピング領域の制約」「過去との継続性」の調整。
用語として、康煕字典体、当用漢字、常用漢字、JIS、SJIS、Unicode(UTF-16,UTF-8) というあたりの流れが押さえられて、とても勉強になった。サロゲートペアとか第4水準とか、聞きなれなかった単語もなんとなくマッピングできた。
- - -
JIS2004で一部の漢字が康煕字典体に変更されるのだけれど、ここまでPCとインターネットが普及した現在において、いまさら漢字の見た目を変更するのは、そっちが正しい日本語だとしても、あまり歓迎できないなぁ。
何十年前も前のバグ(要求仕様との差異)は、もうバグじゃなくて「実装によって確定した現実の仕様」、ないし、デファクトスタンダードというべきものじゃないだろうか…。