電脳社会の日本語

404 Blog Not Found:Unicodeは文字集合か符号化方式か」 で紹介されていたこの本を読んだ。

電脳社会の日本語
電脳社会の日本語加藤 弘一

文藝春秋 2000-03
売り上げランキング : 10951

おすすめ平均 star
star普段何気なく使っている日本語を見直す機会になりました

Amazonで詳しく見る
by G-Tools

戦前から話が始まるので、コンピュータの話が出るまで、ちょっと億劫だけど、だんだん面白くなって、Unicodeにからむユニコード推進派と日中韓(CJK)の動きなどは、一気に読んでしまった。

一介のユーザにとってはまさに対岸の火事だが、標準をまとめる当事者の方々は大変だろうなぁ、と想像。

採録字体の決定過程における、「正しい○○語」対「一般的に流通してしまっている漢字」の取捨選択。

・コード実装における「唯一のコード」「データ量の節約」「コードマッピング領域の制約」「過去との継続性」の調整。

用語として、康煕字典体、当用漢字、常用漢字、JIS、SJISUnicode(UTF-16,UTF-8) というあたりの流れが押さえられて、とても勉強になった。サロゲートペアとか第4水準とか、聞きなれなかった単語もなんとなくマッピングできた。

- - -

JIS2004で一部の漢字が康煕字典体に変更されるのだけれど、ここまでPCとインターネットが普及した現在において、いまさら漢字の見た目を変更するのは、そっちが正しい日本語だとしても、あまり歓迎できないなぁ。

何十年前も前のバグ(要求仕様との差異)は、もうバグじゃなくて「実装によって確定した現実の仕様」、ないし、デファクトスタンダードというべきものじゃないだろうか…。