コンピューターや情報処理を理解する上で、欠かせないのが「byte(バイト)」や「bit(ビット)」といった単位です。
何となく理解したような気になっていても、いざ尋ねられると答えられない人は多いのではないでしょうか。
本記事では、byteの概要やbitとの違い、さらにはbyteに深く関わる2進数について紹介します。
このページの目次
PCやスマホの容量をみるとき、「何GB(ギガバイト)か」をチェックする人は多いでしょう。
この「B」が「byte」に該当するのですが、どのようなものなのでしょうか。byteの意味や概要を紹介します。
byteはインターネット界における情報の基本単位です。もう一つよく耳にする言葉として「bit(ビット)」がありますが、こちらは情報の最小単位。
byteよりもさらに小さなものです。詳細は後に述べますが、
・1byte=8bit
と覚えておけばよいでしょう。
byteの語源は、「bite(英:一口)」にあるといわれます。
一方、bitは「小片(英)」を意味する言葉。両者はスペルが似ているので、byteはあえて「i」ではなく「y」を置き換えて使うようになりました。
それぞれの意味をインターネット界で当てはめると、bitは「情報のかけら」を示し、byteは「ひとまとまりの情報」を示すと考えられます。
PCなどで情報のやり取りをする際は「byte単位」が一般的です。
ちなみに、byte、bitを省略して記載する場合、byteは「B(大文字)」で、bitは「b(小文字)」で表わします。
単位として数値のあとに付ける場合は、「B」「b」の混同に注意してください。
私たちが日常生活で使っているのは「1~10」をベースとした「10進数(decimal number)」です。
一方、コンピューターの世界では「1,0」をベースとした「2進数(binary number)」が一般的。byteもbitも、2進数で表わされます。
byteについて理解を深めるなら、まずは2進数とはどのようなものなのか理解する必要があるでしょう。
2進数の概要を紹介します。
2進数は、「0」「1」の組み合わせのみで表わされる数字です。10進数は10の累乗で繰り上がりますが、2進数では「2」の累乗で繰り上がります。
つまり
0→1→繰り上がり
です。2進数では1桁で2種類のものしか表せないため、3つ以上のものを表わそうとする場合は桁数を増やしていくこととなります。
ちなみに、2進法で桁数が増えていく場合「ジュウ」「ヒャク」とは読みません。2を表わす「10」は「イチゼロ」、3を表わす「11は「イチイチ」と読みますので注意してください。
2進数を10進数で表わすときは、2のn乗に整数を掛け、足していけばよいのです。それでは、次の2進数の数字を10進数に置き換えるとどうなるのでしょうか。
10111
これを2×n乗で表わすと
2×4乗の位 | 2×3乗の位 | 2×2乗の位 | 2×1乗の位 | 2×0乗の位 |
1 | 0 | 1 | 1 | 1 |
となります。式にすると
(2の4乗)×1+(2の3乗)×0+(2の2乗)×1+(2の1乗)×1+(2の0乗)×1
となり、
16+0+4+2+1=23
10111を10進数で表わすと「23」となります。
私たちの日常生活で、2進数に触れることはあまりありません。1~10で表わされる10進数は圧倒的に理解しやすい上、多くの情報を表せるようにみえます。
にもかかわらず、なぜコンピューターでは2進数が使われているのでしょうか。
コンピューターで2進数が使用されるのは、コンピューターを構成する「IC(Integrated Circuit=集積回路)」にとって都合がよいからです。
コンピューターは、ICに付いているピンに電気で情報を与えることで、さまざまな動作を行います。
このピンは複数付いていますが、ひとつのピンで扱えるのは0Vと5Vの2種類の電気のみ。つまり「オンか」「オフか」の2種類しかありません。
そのため、10進数よりは2進数の方がコンピューターには合っているのです。
そのほかのメリットとしては、2進数の方がノイズが少なくなること、コンピューターを構成するハードウェアの作りがシンプルになることなどがあげられます。
一方、デメリットとしては、やはり10進数よりも桁数が多くなることです。
とはいえコンピューターにとっては、桁数が多くなったところでさほど問題はありません。デメリットよりはメリットの方が大きいとされ、コンピューターでは2進数が採用されました。
たとえば私たちが10進数でコンピューターに数値を入力したとしても、実際にはその数値は2進数に変換して処理されているのです。
1byte=8bit=256
先述のとおり、bit値は2進数で表わされます。つまり1bitなら0か1の2種類、2bitなら4種類、3bitなら8種類…と2の倍数で表せる情報が増えていくというわけです。
ここで、1byteの情報量について考えてみましょう。1byteは8bit。つまり「2の8乗」です。これを計算すると、1byteで表せる情報は256種類ということになります。
それでは、なぜ1byte=8bitと定められたのでしょうか。こちらについては諸説ありますが、処理する情報量が増加し、8bitくらいが適当と思われたためといわれます。
本来は7bitくらいでよかったそうですが、奇数は情報量の単位としては不適切。6か8かで「多めの8を取った」というわけです。
ちなみに、「1byte=8bit」と正式に統一されたのは、2008年とごく最近のこと。
ISO(国際標準化機構)やIEC(国際電気標準会議)が「1byte=1bit」を採択し、これが正式な基準として認知されるようになりました。
1byteで256種類の情報を表せるとはいえ、実際のところ1byteで表せるのは「半角英数1文字ぶん」程度。全角で文章を打った場合は、情報量は膨大なものとなります。
このように多量な情報がやりとりされる現在、情報の単位も多様化しています。どのような単位があるのか、みてみましょう。
情報の単位は、次のようになります。
一方、単位の換算についてはこちらで確認してください。
ここで注意したいのが、どの単位も「1,024」という半端な数値になっている点です。
「1km=1,000m」といった切りのよい単位になれていると、違和感を覚えるかもしれません。しかし、2進数がベースとなる情報の単位では、これが当たり前です。
たとえば、1 KBのbyte数は1の1,000倍ではなく「2の10乗」となります。つまり、
2×2×2×2×2×2×2×2×2×2=1,024
これで1,024Bという数値が出てくるのです。
このように2進数で計算すると、1 MBのbyte数は2の20乗、1 TBは2の30乗。それぞれ1,048,576B、1,099,511,627,776Bとなります。
1byteが半角英数1文字ぶん。それでは、そのほかの単位はどのくらいの情報量を扱えるのでしょうか。
まず1 KB = 1,024 Bですと、わずかな情報量しか扱えません。シンプルな文書や小さな画像などです。
次の1 MB = 1,024 KBになると、扱える情報量は増えます。高画質な画像や音楽ファイル、大きめの写真なども、1MBあれば事足りる場合が多いでしょう。
さらに大きな1 GB= 1,024 MBは、動画データも扱えます。360Pの動画なら、およそ35回程度利用できる容量です。
「B(byte)」はコンピューターで使われる単位ですが、実際にどのような使い方をされているのでしょうか。「B(byte)」を使うケースを紹介します。
パソコンの性能に大きく関わるCPU(Central Processing Unit)では、32bit、64bitといった表示がみられます。
これは、CPUが扱える情報量をbit数で表わしたもの。bit数が高いほど、扱えるメインメモリー量が多くなります。
32bitのCPUなら大体2の32乗、つまり約43億とおりの情報量を扱うことが可能。一方64bitなら2の64乗、つまり約1,844京とおりの情報を扱えます。
HDDやSSDなど内蔵ストレージでも、容量を表わすのにbyteが使われています。
ただしここで気をつけたいのが、現在主流のインターフェース「SATA規格」では、転送速度が1byte=8bitではないということ。ストレージでは、1byte=10bitとされます。
これはシステム上の都合によるもの。エラー訂正などを考慮して、1byteに10bitが割り当てられているのです。
パケットとは、インターネット上の通信データが小さく分割されたものです。語源は英語の「packet (=小包)」にあるといわれます。
パケットをbyteで表わす場合は、「1パケット=128B」。これは便宜上定められた数値ですから、そのまま覚えておきましょう。
1パケットで扱える情報量は、日本語なら64文字程度です。
普段何気なく耳にする「byte」は、情報処理において基本となる単位です。ただし、これを適切に理解するためには「2進数」を知ることが必須。
普段使っている10進数との違いや、なぜコンピューターでは2進数が重宝されるのか確認しておきましょう。
また、情報量の単位はbyteが基本ですが、このほかにもたくさんの単位があります。
情報の多様化・多量化が進む現在、より大きなデータ量を扱う機会も増えてくるかもしれません。
どのような単位があり、どのような大きさなのか概要を把握しておくことは非常に大切といえるのです。
画像出典元:Unsplash、Pixabay
2025年の崖とは?ITシステムが抱える問題と解決策を分かりやすく解説
オンデマンドとは?意味や用語解説、人気動画配信サービスも紹介!
電磁的方法とは?種類やメリット・デメリット・活用事例を詳しく解説
Stable Diffusionとは?始め方と呪文(Prompt)を徹底解説
RPAツールのシェアを徹底解説!人気ランキングTOP7・市場の今後は
中小企業がRPAを導入すべき3つの理由!得られる効果と参考事例
Optimize終了【代替ツール8選】と【乗り換え準備リスト】
RPA導入の6つの課題と解決策とは?【失敗しないオートメーション化】
データマスキングとは?必要な理由・活用シーン・機能を徹底解説!
データレプリケーションとは?目的とバックアップとの違いや2つの効果