2004年07月02日
川俣晶の縁側技術関連執筆情報total 2744 count

旧著: パソコンにおける日本語処理/文字コードハンドブック

Written By: 川俣 晶連絡先

 以前、「パソコンにおける日本語処理/文字コードハンドブック」という本を書きました。1999年に出版され、既に内容の多くが古い本ではありますが、たまにこれを読めば分かるだろうという質問を受けることがあるので、ここに掲載しておきます。

余談 §

 オータムマガジンは、この「余談」があるから読者も読みに来るのだろうと思いますので、ちょっとだけ書いておきますが。

 実はこの本は出版時点で既に内容が一部古くなっていました。というのは、出版者側が「変化の激しい生もの」という認識を持たず、じっくりと良い本を作ろうと、時間を掛けてしまったのです。執筆も時間が掛かっていたのでそれも合わせて、ちょっと出遅れた内容、という感じがあるのは否めません。

 もう記憶が定かではありませんが、と学会の永瀬唯氏が内容が古いと批判した記事を書いていたという話を聞いたような気がしますが、まったくその通りです。申し訳ないです。

 ただ、ここまで古くなってしまうと、逆に「それでも変わらない基本知識はある!」という価値を「あえて開き直って」主張できる余地はありますね。特にこれ以上変わりようのない古い話は、本が古くなっても価値は変わらないでしょう。そういう歴史的な過去の経緯や基礎知識を身に付けないで知ったかぶりをするとボロが出る、というのは良くある話ですから。ストイックにやせ我慢してこういう本を買って勉強しておきましょう。結局は、勉強するのが最も楽で早い道です。

電子メールで使用できるcharsetとは? §

 ちなみに、インターネットの電子メールでシフトJISを送っていいの?というようなFAQは以下を参照することで分かります。以下は、インターネットの電子メールに限らず、インターネットに登録されたcharset名の一覧です。

CHARACTER SETS

 たとえばシフトJISは以下のように定義されています。

Name: Shift_JIS  (preferred MIME name)

MIBenum: 17

Source: This charset is an extension of csHalfWidthKatakana by

        adding graphic characters in JIS X 0208.  The CCS's are

        JIS X0201:1997 and JIS X0208:1997.  The

        complete definition is shown in Appendix 1 of JIS

        X0208:1997.

        This charset can be used for the top-level media type "text".

Alias: MS_Kanji 

Alias: csShiftJIS

 見ての通り、名前としてはShift_JISが正しく、SJISやShift-JISは誤りです。

 また、CCS(coded character set)つまり使用できる文字の集合は、JIS X0201:1997 and JIS X0208:1997と表記されている通り、この2つのJIS規格に掲載されているものに限られます。つまり、これに掲載されていない丸付き数字などは使えません。

 では、丸付き数字を書く方法がないのかというと、無いこともありません。以下のようなものもあるからです。

Name: Windows-31J

MIBenum: 2024

Source: Windows Japanese.  A further extension of Shift_JIS

        to include NEC special characters (Row 13), NEC

        selection of IBM extensions (Rows 89 to 92), and IBM

        extensions (Rows 115 to 119).  The CCS's are

        JIS X0201:1997, JIS X0208:1997, and these extensions.

        This charset can be used for the top-level media type "text",

        but it is of limited or specialized use (see RFC2278).

        PCL Symbol Set id: 19K

Alias: csWindows31J

 しかし、日本語の電子メールはISO-2022-JPを使用するという慣習が定着している現在、Shift_JISとして電子メールを送信して相手が正しく読めるか否かは確実ではなく、ましてWindows-31Jは読めない可能性が極めて高いと考えて良いと思います。

 現在、丸付き数字を電子メールで送りたい場合は、UTF-8で送信するのがお勧めです。これも確実とは言えませんが、UTF-8は次世代のインターネット標準となるもので、各種ソフトの対応はかなり進んでいます。

しかし…… §

 ここまで書いてふと気付きましたが。これを書いている今、アマゾンによると本書は「現在、在庫切れです」とのこと。これは痛いなぁ (汗

Facebook

このコンテンツを書いた川俣 晶へメッセージを送る

[メッセージ送信フォームを利用する]

メッセージ送信フォームを利用することで、川俣 晶に対してメッセージを送ることができます。

この機能は、100%確実に川俣 晶へメッセージを伝達するものではなく、また、確実に川俣 晶よりの返事を得られるものではないことにご注意ください。

このコンテンツへトラックバックするためのURL

http://mag.autumn.org/tb.aspx/20040702113436
サイトの表紙【技術関連執筆情報】の表紙【技術関連執筆情報】のコンテンツ全リスト 【技術関連執筆情報】の入手全リスト 【技術関連執筆情報】のRSS1.0形式の情報このサイトの全キーワードリスト 印刷用ページ

管理者: 川俣 晶連絡先

Powered by MagSite2 Version 0.36 (Alpha-Test) Copyright (c) 2004-2021 Pie Dey.Co.,Ltd.