바이트의 정의
바이트의 크기 |
SI 접두어 |
전통적 용법 |
이진 접두어 |
기호(이름) |
값 |
기호 |
값 |
기호(이름) |
V값 |
kB (킬로바이트) |
10001 = 103 |
KB |
10241 = 210 |
KiB (키비바이트) |
210 |
MB (메가바이트) |
10002 = 106 |
MB |
10242 = 220 |
MiB (메비바이트) |
220 |
GB (기가바이트) |
10003 = 109 |
GB |
10243 = 230 |
GiB (기비바이트) |
230 |
TB (테라바이트) |
10004 = 1012 |
TB |
10244 = 240 |
TiB (테비바이트) |
240 |
PB (페타바이트) |
10005 = 1015 |
PB |
10245 = 250 |
PiB (페비바이트) |
250 |
EB (엑사바이트) |
10006 = 1018 |
EB |
10246 = 260 |
EiB (엑스비바이트) |
260 |
ZB (제타바이트) |
10007 = 1021 |
ZB |
10247 = 270 |
ZiB (제비바이트) |
270 |
YB (요타바이트) |
10008 = 1024 |
YB |
10248 = 280 |
YiB (요비바이트) |
280 |
바이트의 정의는 여러 가지가 있으며, 서로 비슷한 뜻을 지니지만 섞어 쓸 경우 혼동을 부를 수도 있다.
1. 일정한 개수의 비트로 이루어진 연속된 비트열. ‘일정한 개수’가 항상 정해진 건 아니지만, 최근에는 사실상 1바이트를 8비트로 간주하는 경우가 흔하다.
2. 이진 컴퓨터의 워드 안에서 주소로 표현할 수 있는 가장 작은 단위에 해당하는 연속된 비트열. 예를 들어서 CDC 6000 계열의 메인프레임은 60비트 부동 소수점 실수를 6비트짜리 바이트 10개로 나눴으며, 따라서 대문자 로마자와 숫자만을 표현할 수 있는 천공 카드에 결과를 출력하기가 용이했다. 또한 CDC의 경우 12비트 I/O를 사용했기 때문에 12비트를 1바이트라 부르기도 했다. 이 정의 역시 최근에는 대부분 8비트를 가리키지만, 역사적으로 6비트, 7비트, 9비트 등의 바이트가 존재했다.
3. 직렬 데이터 스트림(예를 들어서 모뎀 등)에서 의미를 가지는 가장 작은 연속된 비트열. 여기에는 시작 비트, 종료 비트, 패리티 비트 등이 포함될 수 있으며, 예를 들어 7비트 ASCII 부호를 저장할 경우 최소 7비트에서 최고 12비트가 한 바이트가 될 수 있다.
4. 몇몇 프로그래밍 언어의 자료형. 예를 들어 C의 경우 한 바이트는 실행 환경에서 쓰이는 문자들을 담을 수 있을 만큼 큰 단위(C 표준 3.5항)로 정의되며, 한 바이트를 담는 char 자료형은 부호가 있느냐 없느냐와 상관 없이 적어도 8비트 이상(5.2.4.2.1항)이어야 한다. 자바의 byte 자료형은 항상 부호가 있으며 8비트로 정의된다.
한 바이트 안의 비트의 개수가 중요할 경우에는 흔히 옥텟(octet)과 같이 크기가 일정한 단위를 쓰기도 하며, 특히 컴퓨터 네트워크와 전기통신에서 흔히 쓰인다. 또한 프랑스어에서는 옥텟을 바이트의 뜻으로 쓰기도 한다.
관련 단위
• 옥텟(octet) : 한데 묶여 쓰이는 2진 이진부호모음. 바이트가 8비트를 가리킬 때 서로 같은 뜻을 갖는다. 전기통신 분야에서는 바이트란 용어 대신 옥텟이란 표현을 사용한다. 팔중수라고도 부른다.
• 니블(nibble) = 1바이트의 절반으로 보통 4비트를 가리킨다. 이때 바이트 하나는 상위 니블(상위 4비트)과 하위 니블(하위 4비트)로 나눌 수 있다.
• 비트(bit) : 비트는 전산학과 정보 이론의 정보 단위이다.
• 워드(word) : 전자통신 기기에 따라 2바이트 또는 4바이트를 묶어서 부르는 단위이다.