用語解説辞典

用語解説辞典 知りたい用語はここで検索

用語解説辞典トップに戻る

【Unicode】

  • ユニコード

 最近のウィンドウズやマックOSにも採用されている、新しい文字コード体系のひとつ。

 この用語を、いきなり理解するのは難しい。まずは、文字コード、1バイト文字、2バイト文字といった項目を理解してほしい。それぞれの文字をクリックすると、解説ページへ移動できる。

 さて、つまり、アルファベットとか数字とかカナとか漢字とか、そういった文字には番号が割り振られていて、パソコンの中ではその番号で文字が識別されている。そして、どの文字を何番にするかという取り決めが文字コード体系になる。

 パソコンはアメリカ生まれなので、もともとアルファベットと数字しか扱えなかった。これらの文字は、数が少ないので1バイトで表現できた。しかし、日本語とか中国語とかアラビア語は文字の数が多いから、1バイトでは足りない。そこで2バイト文字が使われるようになった。

 しかし、最初に英語版として作られたソフトを、2バイト文字を使う各言語版に作り直す(ローカライズする)のは、なかなか手間がかかる。また、英語版の基本ソフトの上で、ほかの言語版のソフトを使えないといった制約もある。

 日本語だけで生活していると、こういった問題は気にならない。しかし、パソコンの技術やビジネスは世界中に広がっているので、かなり厄介な問題なんだ。実際、インターネットに接続すれば世界中のホームページを簡単に見られる。

 そこで、アルファベットも含めて世界中の文字をすべて2バイト文字に統一しようという動きが出てきた。そして、その結果生まれたのが、ユニコードという文字コード体系だ。

 ソフトを開発するときも、最初からユニコード対応にしておけば、あとから別の言語に対応させるための修正がいらない。英語版の基本ソフトの上で別の言語のソフトも簡単に動かせるようになる。

 というわけで、ユニコードの普及は良いことなんだけど、多少の問題点もある。たとえば日本の漢字と中国の漢字では、一見よく似ているけど細部が違うといったことがある。ところがユニコードでは、この厳密にいうと異なる文字に同じ番号が割り振られている。そのため、コンピュータ内で同じ文字になってしまったりする。すべてが解決されるまで、道のりはまだまだ遠そうだ。

Uの一覧に戻る

用語解説:下島 朗(株式会社エントラータ)監修

page top