以前、「パソコンにおける日本語処理/文字コードハンドブック」という本を書きました。1999年に出版され、既に内容の多くが古い本ではありますが、たまにこれを読めば分かるだろうという質問を受けることがあるので、ここに掲載しておきます。
余談 §
オータムマガジンは、この「余談」があるから読者も読みに来るのだろうと思いますので、ちょっとだけ書いておきますが。
実はこの本は出版時点で既に内容が一部古くなっていました。というのは、出版者側が「変化の激しい生もの」という認識を持たず、じっくりと良い本を作ろうと、時間を掛けてしまったのです。執筆も時間が掛かっていたのでそれも合わせて、ちょっと出遅れた内容、という感じがあるのは否めません。
もう記憶が定かではありませんが、と学会の永瀬唯氏が内容が古いと批判した記事を書いていたという話を聞いたような気がしますが、まったくその通りです。申し訳ないです。
ただ、ここまで古くなってしまうと、逆に「それでも変わらない基本知識はある!」という価値を「あえて開き直って」主張できる余地はありますね。特にこれ以上変わりようのない古い話は、本が古くなっても価値は変わらないでしょう。そういう歴史的な過去の経緯や基礎知識を身に付けないで知ったかぶりをするとボロが出る、というのは良くある話ですから。ストイックにやせ我慢してこういう本を買って勉強しておきましょう。結局は、勉強するのが最も楽で早い道です。
電子メールで使用できるcharsetとは? §
ちなみに、インターネットの電子メールでシフトJISを送っていいの?というようなFAQは以下を参照することで分かります。以下は、インターネットの電子メールに限らず、インターネットに登録されたcharset名の一覧です。
CHARACTER SETS
たとえばシフトJISは以下のように定義されています。
Name: Shift_JIS (preferred MIME name)
MIBenum: 17
Source: This charset is an extension of csHalfWidthKatakana by
adding graphic characters in JIS X 0208. The CCS's are
JIS X0201:1997 and JIS X0208:1997. The
complete definition is shown in Appendix 1 of JIS
X0208:1997.
This charset can be used for the top-level media type "text".
Alias: MS_Kanji
Alias: csShiftJIS
見ての通り、名前としてはShift_JISが正しく、SJISやShift-JISは誤りです。
また、CCS(coded character set)つまり使用できる文字の集合は、JIS X0201:1997 and JIS X0208:1997と表記されている通り、この2つのJIS規格に掲載されているものに限られます。つまり、これに掲載されていない丸付き数字などは使えません。
では、丸付き数字を書く方法がないのかというと、無いこともありません。以下のようなものもあるからです。
Name: Windows-31J
MIBenum: 2024
Source: Windows Japanese. A further extension of Shift_JIS
to include NEC special characters (Row 13), NEC
selection of IBM extensions (Rows 89 to 92), and IBM
extensions (Rows 115 to 119). The CCS's are
JIS X0201:1997, JIS X0208:1997, and these extensions.
This charset can be used for the top-level media type "text",
but it is of limited or specialized use (see RFC2278).
PCL Symbol Set id: 19K
Alias: csWindows31J
しかし、日本語の電子メールはISO-2022-JPを使用するという慣習が定着している現在、Shift_JISとして電子メールを送信して相手が正しく読めるか否かは確実ではなく、ましてWindows-31Jは読めない可能性が極めて高いと考えて良いと思います。
現在、丸付き数字を電子メールで送りたい場合は、UTF-8で送信するのがお勧めです。これも確実とは言えませんが、UTF-8は次世代のインターネット標準となるもので、各種ソフトの対応はかなり進んでいます。
しかし…… §
ここまで書いてふと気付きましたが。これを書いている今、アマゾンによると本書は「現在、在庫切れです」とのこと。これは痛いなぁ (汗