[Edit][Create New]
[ IndexPage / ネットとプログラミング / web296 / No64.txt ]

No64.txt

●半角カナと機種依存文字(3回目: パソコン通信とインターネット)

前回は、現在Webで主に使われている3つの文字コード、ISO-2022-JP(一般にJIS
コードと呼ばれているもの)、EUC、Shift-JISについて半角カナの利用の可否を
調べ、EUCとShift-JISに関しては半角カナの使用に関して仕様上まったく問題が
ない、というところまで解説しました。

ではなぜ現在半角カナが嫌われているのか? これには色々な理由が考えられるの
ですが、今回はまず歴史的な側面から見ていこうと思います。

筆者が初めてインターネットに触れた1990年代初頭、世の中はまだいわゆるパソ
コン通信隆盛の時代でした。この頃のパソコン通信では、ターゲットマシンのほ
とんどで、OSの内部コードとしてShift-JISが採用されていたことから、半角カ
ナが当たり前のように使われていたものです。

ではインターネットではどうだったか。当時はMosaic(現在のWebブラウザの祖)
のリリース前だったこともあってWebはまだ普及しておらず、インターネット上
でのコミュニケーションはもっぱら電子メールを介して行われていました。

実はこの電子メールを扱うプロトコル
SMTP(RFC2821<http://www.ietf.org/rfc/rfc2821.txt>)は、英語圏で開発された
ためか、ASCIIを含む7Bit文字しか扱えません。このため8ビットを要求するEUC
やShift-JISは扱うことができません。こういった経緯から、日本語を扱う文字
コードとして、下位7ビットで表現できるISO-2022-JPが採用されたのです。

今でも電子メールでは主にISO-2022-JPが使われ続けていますが、この
ISO-2022-JPでは、半角カナは使用できないため「電子メールでは半角カナは使
用できない(*1)」は正しいということになります。

当時は電子メールと並ぶインターネット上のコミュニケーション手段として、
NetNewsというものもありましたが(今でもありますが)、これもISO-2022-JPが主
流で、インターネットコミュニティの間では半角カナを使おうとする人はほとん
どいませんでした。

しかし時は流れて1990年代中盤、MosaicのWindowsへの移植や、ISP料金の大幅な
値下げなどから、自宅にインターネット接続環境を持つ人が急激に増え、パソコ
ン通信ユーザがインターネットへの流入し始めた頃から、急に話はややこしくなっ
てきます。

何しろ、パソコン通信ユーザにとっては、今まで当たり前のように使えた半角カ
ナが突然使えなくなったのです。むりやり半角カナをメーラーやNetNewsリーダ
に組み込もうと思った開発者がいたのも仕方のなかったことなのかも知れません。

とにかく、本来半角カナが使えないはずのISO-2022-JPに、勝手な仕様拡張を加
え、半角カナを組み入れたメーラーが続出しました。一番多かったのが、
Shift-JISの半角カナ領域をそのまま使うというもの。この部分は8ビットコード
で、7ビットの文字セットであるISO-2022-JPでは丸々空いている領域なので、こ
こにむりやり詰め込んだ形です。しかし、もちろん仕様違反ですし、SMTPの仕様
(7ビットコードしか使用できない)にも反しているので、転送の際に切り落とさ
れる可能性も出てきます。

ほかにも、独自のエスケープシーケンスを組み込んだり、中にはShift-JISで送
信する無茶なものもありましたが、当然どの方法も表示できないメーラーが続出。
混乱の結果、説明するのも面倒なので、当時は、

「いいからとにかく半角カナはダメっ!!!」

といった文言が多く聞かれました。これが、現在のWebにおける「とにかく半角
カナは使用できない」という風潮の原因の一つではないかと筆者は考えています。

次回は、歴史的側面に加え、実務面において半角カナを使用することによって生
じるデメリットについて解説していこうと思います。

(*1)ISO-2022-JPやISO-2022-JP2を使う場合。文字コードにUTF-7を使った場合は
一応半角カナを扱うことができるが、対応しているメーラーは少ない。