【1バイト文字】
- 2バイト文字
- byte
- バイト
バイト(byte)は、コンピュータにとって基本的な単位のひとつ。
「0か1か」という情報ひとつを1ビットという。そして、8ビットで1バイトという単位になる。で、半角文字は1バイトで表せるので1バイト文字、全角文字は2バイトで表すので2バイト文字という。
普通、パソコンで扱うファイルの大きさはバイトで表されている。といっても実際には、キロバイト(KB)とかメガバイト(MB)といった単位になっていることが多い。
コンピュータのデータ(デジタルデータ)は「0と1の組合せ」といわれる。確かにその通りだけど、コンピュータの技術者でもないと実際にそれを見ることはない。しかし実際、コンピュータ上で扱うデータは、すべて「0か1」になっている。
この「0か1か」が1ビットの情報。で、8ビットというと0と1が8個並んでいる状態だ。たとえば「00101001」といった具合。16ビットというと「0010100100101001」というように16個並んでいる状態。
数学で習った2進法を思い出してほしい。8ビットだと0から255まで表現できる。00000000 が0で、11111111 が255にあたる。つまり8ビットで、256種類の状態を表現できる。いまいちピンと来ない人は「にごろ」のページを参考にしてほしい。同様に16ビットだと65536種類の状態を表現できる。2倍ではなくて、2乗になっているところがミソだ。
そして、8ビットのデータをひとまとめにして1バイトという単位にしている。つまり、さっきの「00101001」といったものだ。で、ここからが大事なんだけど、半角のアルファベットと数字、1文字のデータ量は1バイトになっている。8ビットで256種類の情報を表現できるので、それぞれに小文字のa〜z、大文字のA〜Z、数字の0〜9、そして&や!や?といった記号類を割り当てている。
ところが日本語は、256種類では表現しきれない。漢字は何千字もある。そこで2バイト(16ビット)で1文字を表現する。これが、いわゆる全角文字と呼ばれるものだ。前述のように、2バイトだと65536種類の情報を表現できる。
このほか、本家アメリカではアルファベットは7ビットで表現されている(ASCIIコードの場合)とか、もっと深い世界がいろいろある。より詳しく知りたい人はコンピュータの専門書を見てほしい。
用語解説:下島 朗(株式会社エントラータ)監修



















































































