概要 §
未熟で稚拙な技術を使って人々は文字を送ろうと考えた。それらが互換性という問題をもたらし、技術の負債となって現在の我々を苦しめる。複雑怪奇な文字コードの世界へようこそ! 今こそ文字コードの歴史を振り返ろう!
目次
まえがき
そもそも文字とは何か
文字を伝えるとはどういうことか
文字の符号化とはどういうことか
狼煙で伝えろ「敵が来たぞ」
腕木通信/手旗信号/信号灯
モールス符号・トンツーは世界を革命した
テレテレタイプの登場・符号の暗記は要らなくなった
JIS C 0803・テレタイプに日本語がやって来た
ASCIIコード登場・シフトいらずの7ビット!
ISO/IEC 2022の世界とシフトコード
カナ対応のJISコードだけで当時は日本語対応だった
漢字対応のJISコード・本命がきたる
JISコードと文字扱いではなかった漢字
NEC漢字コードで漢字は文字扱いできた
シフトJIS誕生! 夢の文字エンコーディングは未来への負債
EUC-JPは【正しい】文字エンコーディングだった
ISO-2022-JPはインターネットと共にやって来た
未来への道・望まれた新天地
Unicodeへの道・全ての文字を16bitで符号化せよ
ISO/IEC 10646 DIS1という対抗馬
ASCIIのAとJIS X 0201のAは同じなの? 違うの?
満身創痍のUnicodeの船出
ISO/IEC 10646と32ビットのUCS-4
サロゲートペアとUTF-16
UTF-7/8バイト単位の逆襲
BOMとエンディアンの問題
Base64がもたらす文字列化されたUnicode
MIME ヘッダーのエンコードはもっと悩ましい
Punycodeはドメイン名をUnicodeに解放する
UTF-8の利用が望ましい
文字化けの原因と対策
あとがき
参考文献