用語解説辞典

用語解説辞典 知りたい用語はここで検索

用語解説辞典トップに戻る

【1バイト文字】

  • 2バイト文字
  • byte
  • バイト

 バイト(byte)は、コンピュータにとって基本的な単位のひとつ。

 「0 か 1 か」という情報ひとつを 1ビットという。そして、8ビットで 1バイトという単位になる。で、半角文字は 1バイトで表せるので 1バイト文字、全角文字は 2バイトで表すので 2バイト文字という。

 普通、パソコンで扱うファイルの大きさはバイトで表されている。といっても実際には、キロバイト(KB)とかメガバイト(MB)といった、より大きな単位になっていることが多い。

 コンピュータのデータ(デジタルデータ)は「0 と 1 の組合せ」といわれる。確かにその通りだけど、コンピュータの技術者でもないと実際にそれを見ることはない。しかし実際、コンピュータ上で扱うデータは、すべて「0 か 1」になっている。

 この「0 か 1 か」が 1ビットの情報。で、8ビットというと 0 と 1 が 8個並んでいる状態だ。たとえば「00101001」といった具合。16ビットというと「0010100100101001」というように16個並んでいる状態。

 数学で習った 2進法を思い出してほしい。8ビットだと 0 から 255 まで表現できる。00000000 が 0 で、11111111 が 255 にあたる。つまり 8ビットで、256種類の状態を表現できる。いまいちピンと来ない人は「にごろ」のページを参考にしてほしい。同様に 16ビットだと 65536種類の状態を表現できる。2倍ではなくて、2乗になっているところがミソだ。

 そして、8ビットのデータをひとまとめにして 1バイトという単位にしている。つまり、さっきの「00101001」といったものだ。で、ここからが大事なんだけど、半角のアルファベットと数字、1文字のデータ量は 1バイトになっている。8ビットで 256種類の情報を表現できるので、それぞれに小文字の a~z、大文字の A~Z、数字の 0~9、そして & や ! や ? といった記号類を割り当てている。

 ところが日本語は、256種類では表現しきれない。漢字は何千字もある。そこで 2バイト(16ビット)で 1文字を表現する。これが、いわゆる全角文字と呼ばれるものだ。前述のように、2バイトだと 65536種類の情報を表現できる。

 このほか、本家アメリカではアルファベットは 7ビットで表現されている(ASCIIコードの場合)とか、もっと深い世界がいろいろある。より詳しく知りたい人はコンピュータの専門書を見てほしい。

1の一覧に戻る

用語解説:下島 朗(株式会社エントラータ)監修

page top