Система битов и байтов

Всё о Интернете, сетях, компьютерах, Windows, iOS и Android

Бит и Байт — основные единицы измерения информации

Чтобы досканально разобраться что такое Биты, что такое Байты и зачем всё это нужно, давайте сначала стоит немного остановимся на понятии «Информация», так как именно на ней построена работа вычислительной техники и сетей передачи данных, в том числе и нашего любимого Интернета.
Для человека, Информация — это некие знания или сведения, которыми обмениваются люди в процессе общения. Сначала знаниями обменивались устно, передавая друг другу, затем появилась письменность и информацию стали передавать уже с помощью рукописей, а затем уже и книг. Для вычислительных систем Информация — это данные которые собираются, обрабатываются, сохраняются и передаются дальше между звеньями системы, либо между разными компьютерными системами. Но если раньше информация помещалась в книги и её объём можно было хоть как-то наглядно оценить, например в библиотеке, то в условиях цифровых технологий она стала вирутальной и её нельзя измерить с помощью обычной и привычной метрической системы, к которой мы привыкли. Поэтому были введены единицы измерения информации — Биты и Байты.

Бит информации

В компьютере информация хранится на специальных носителях. Вот самые основные и знакомые большинству из нас:

Ваш персональный компьютер или ноутбук получает информацию, в основном в виде файлов с различным объёмом данных. Каждый из этих файлов любой носитель данных на аппаратном уровне получает, обрабатывает, хранит и передаёт в виде последовательности сигналов. Есть сигнал — единица, нет сигнала — ноль. Таким образом вся храняшаяся на жестком диске информация — документы, музыка, фильмы, игры — предствалена в виде нулей: 0 и единиц: 1. Эта система исчисления называется двоичной (используется всего два числа).
Вот одна единица информации (без разницы 0 это или 1) и называеся бит. Само слово bit пришло к нам как аббревиатура от binary digit — двоичное число. Что примечательно, в английском языке есть слово bit — немного, кусочек. Таким образом, бит — это самая наименьшая единица объёма информации.

Сколько битов в Байте

Как Вы уже поняли выше, сам по себе, бит — это самая маленькая единица в системе измерения информации. Оттого и пользоваться ею совсем неудобно. В итоге, в 1956 году Владимир Бухгольц ввёл ещё одну единицу измерения — Байт, как пучок из 8 бит. Вот наглядный пример байта в двоичной системе:

Таким образом, вот эти 8 бит и есть Байт. Он представляет собой комбинацию из 8 цифр, каждая из которых может быть либо единицей, либо нулем. Всего получается 256 комбинаций. Вот как то так.

Килобайт, Мегабайт, Гигабайт

Со временем, объёмы информации росли, причём в последние годы в геометрической прогрессии. Поэтому, решено было использовать приставки метрической системы СИ: Кило, Мега, Гига, Тера и т.п.
Приставка «кило» означает 1000, приставка «мега» подразумевает миллион, «гига» — миллиард и т.д. При этом нельзя проводить аналогии между обычным килобитом и килобайтом. Дело в том, что килобайт — это отнюдь не тысяча байт, а 2 в 10-й степени, то есть 1024 байт.

Соответственно, мегабайт — это 1024 килобайт или 1048576 байт.
Гигабайт получается равен 1024 мегабайт или 1048576 килобайт или 1073741824 байт.

Для простоты можно использовать такую таблицу:

Для примера хочу привести вот такие цифры:
Стандартный лист А4 с печатным текстом занимает в средем около 100 килобайт
Обычная фотография на простой цифровой фотоаппарат — 5-8 мегабайт
Фотографии, сделанные на профессиональный фотоаппарат — 12-18 мегабайт
Музыкальный трек формата mp3 среднего качества на 5 минут — около 10 мегабайт.
Обычный фильм на 90 минут, сжатый в обычном качестве — 1,5-2 гигабайта
Тот же фильм в HD-качестве — от 20 до 40 гигабайт.

Здравствуйте, уважаемые читатели блога Goldbusinessnet.com. В ходе развития современных компьютерных и интернет-технологий наиважнейшее значение приобретают единицы измерения, необходимые при хранении и передаче информации, коими являются бит и байт.

Все данные хранятся или передаются в закодированном цифровом формате, потому возможность измерить их объем позволяет обеспечить системность и устойчивость в работе с ними.

По аналогии с известными физическими единицами измерения, которые при большой их величине для удобства исчисления получают увеличительные приставки (1000 метров = 1 километр, 1000 грамм = 1 килограмм), байт тоже имеет свои производные (килобайт, мегабайт, гигабайт и т.д.).

Однако, в случае бита и байта существуют свои особенности, связанные с цифровой сущностью системы, которые ниже будут подробно разъяснены. Кроме того, будут рассмотрены соотношение между байтом и битом, суть понятия «машинное слово» и другие нюансы.

Единицы измерения информации бит (bit) и байт (byte)

Чтобы стало понятнее, придется изложить все поподробнее и начать, так сказать, с истоков. Однако, постараюсь донести информацию без заумных математических формул и терминов. Начнем с того, что существует несколько позиционных систем счисления. Все их перечислять нет необходимости, но для ясности остановимся на двух основных.

Десятичная и двоичная системы счисления

Самая известная из них, с которой мы все сталкиваемся ежедневно, это десятичная система. В ней любое число состоит из цифр (от 0 до 9), каждая из которых принадлежит определенному разряду. Разрядность увеличивается справа налево (единицы, десятки, сотни, тысячи и т.д.).

Читайте также:  Люди падают с высоты и разбиваются

Возьмем для примера число 249, которое можно представить в виде суммы произведений цифр на 10 в степени, соответствующей данному разряду:

Таким образом, нулевой разряд — это единицы (10 0 ), первый — десятки (10 1 ), второй — сотни (10 2 ) и так далее. В компьютере, как и в других электронных устройствах, вся информация распределяется по файлам (здесь о файловой системе подробности) и кодируется соответствующим образом в цифровом формате, причем в силу простоты использования применяется двоичная система счисления, на которой остановлюсь отдельно.

В двоичной системе числа представляются посредством всего двух цифр: 0 и 1. Попробуем записать уже рассмотренное нами число 249 в двоичной системе, чтобы понять ее суть. Для этого делим его на 2, получив целое частное с остатком 1. Эта единичка и будет самым младшим разрядом, который будет, как и в случае десятичной системы, крайним справа.

Далее продолжаем операцию деления и каждый раз целые числа также делим на 2, получая при этом в остатке 0 или 1. Их последовательно и записываем справа налево, получив в итоге 249 в двоичной системе. Деленин следует проводить до тех пор, пока в итоге не появится нуль:

Теперь записываем нули и единички в остатке последовательно справа налево и получаем наше подопытное число в двоичной системе:

Чтобы не осталось темных пятен, проведем обратное действие и попробуем перевести то же самое число из двоичной в десятичную систему, проверив заодно правильность выше изложенных действий. Для этого умножаем опять же по порядку слева направо нуль или единицу на 2 в степени, соответствующей разряду (по аналогии с десятичной системой):

Как видите все получилось, и мы смогли преобразовать число, записанное в двоичной системе, на его запись в десятичной системе счисления.

Соотношение битов и байтов в информатике

Я не зря предоставил чуть выше краткий математический экскурс, поскольку именно двоичная система служит основой измерения, используемой в электронных устройствах. Базовой единицей количества информации, равной разряду в двоичной системе, как раз и является бит.

Этот термин происходит от английского словосочетания binary digit (bit), что означает двоичное число. Таким образом, бит может принимать лишь только два возможных значения: 0 или 1. В информатике это означает два совершенно равных с точки зрения вероятности результата ("да" или "нет") и при этом не допускается никакого другого толкования.

Это очень важно с точки зрения корректной работы системы. Двигаемся дальше. Количество бит, которое обрабатывается компьютером в один момент, называется байтом (byte). 1 байт равен 8 битам и, соответственно, может принимать одно из 2 8 (256) значений, то есть от 0 до 255:

Итак, нам теперь доподлинно известно, что такое байт, и какую роль он играет в качестве единицы измерения при работе с информацией, хранящейся и обрабатываемой в цифровом виде. Кстати, в международном формате байт может обозначаться двумя способами — byte или B.

Перевести числа в десятичном формате на двоичную систему можно при помощи калькулятора. Если у вас ОС Windows 7, то вызвать этот инструмент можно так: «Пуск» – «Все программы» – «Стандартные» – «Калькулятор». В десятке это можно сделать из списка приложений либо просто введя в поисковую строку слово «Калькулятор»):

В меню «Вид» выбираете формат «Программист» и вводите желаемое число (например, 120):

Напротив опции «BIN» мы видим запись данного числа в двоичной системе:

На что здесь следует обратить внимание? Во-первых, в строке справа вверху представлены лишь семь разрядов (биты со значениями ноль или единица):

Здесь все просто. Если самый старший разряд (бит), расположенный крайним слева, принимает значение 0, то он просто не записывается. Два или более нулевых бита тоже опускаются (по аналогии с десятичными числами — ведь к сотням мы не прописываем 0 тысяч, например).

Доказательством может служить полная запись полученного числа напротив «BIN»:

Если вы внимательны, то увидите, что здесь во-вторых. Это способ записи в виде двух частей, каждая из которых состоит из четырех бит. В информатике используется еще такое понятие как полубайт, или ниббл (nibble). Это удобно тем, что ниббл можно представить как разряд в шестнадцатеричной системе, которая широко используется в программировании.

Понятие машинного слова

Выше мы поговорили о том, что байт содержит восемь бит. Это позволяет выразить 256 (два в восьмой степени) разных значений. Однако на практике в основном этого далеко не достаточно и во многих случаях приходится использовать не один, а несколько byte. В качестве примера воспользуемся еще раз калькулятором Windows и переведем число 1000 в двоичную систему:

Как видите, для этого пришлось отщипнуть пару разрядов из второго байта. На практике для обработки достаточно объемной информации в компьютерах применяется такое понятие как машинное слово, которое может содержать 16, 32, 64 bit.

С их помощью можно выразить соответственно 2 16 , 2 32 и 2 64 различных значений. Но в этом случае нельзя говорить о 2, 4 или 8 байтах, это немного разные вещи. Отсюда растут ноги из упоминания, например, 32-, 64-разрядных (-битных) процессоров или других устройств.

Сколько байт в килобайте, мегабайте, гигабайте, терабайте

А теперь самое время перейти к производным байта и представить, какие приставки увеличения здесь используются. Ведь байт как единица очень маленькая величина, и для удобства очень даже полезно использовать аналоги, которые бы обозначали 1000 B, 1 000 000 B и т.д. Здесь тоже есть свои нюансы, о которых и поговорим ниже.

Строго говоря, для представления величин корректно использовать приставки для двоичной системы счисления, которые кратны 2 10 (1024). Это кибибайт, мебибайт, гебибайт и т.д.

Читайте также:  Mass effect andromeda скриншоты

Но данные словосочетания не прижились в широком использовании. Возможно, одной из причин стала их неблагозвучность. Поэтому пользователи (и не только) повсеместно употребляют вместо двоичных десятеричные приставки (килобайты, мегабайты, гигабайты, терабайты), что является не совсем корректным, поскольку по сути (в соответствии с правилами десятичной системы счисления) это означает следующее:

Но раз уж так сложилось, ничего не поделаешь. Важно лишь помнить, что на практике часто используются килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт), терабайт (Тбайт) именно в качестве производных от байта как единицы измерения информации в двоичной системе. И в этом случае употребляют, например, термин «килобайт», имея ввиду именно 1024 байт.

Однако, очень часто производители накопителей (включая жесткие диски, флэшки, DVD- и CD-диски) при указании объема для хранения информации применяют именно десятичные приставки по прямому назначению (1 Кбайт = 1000 байт), в то время как тот же Виндовс, например, рассчитывает их размер в двоичной системе.

Отсюда и выходит некоторое несоответствие, которое может запутать простого пользователя. Скажем, в документации указана емкость диска 500 Гб, в то время как Windows показывает его объем равным 466,65 Гбайт.

По сути никакого расхождения нет, просто размер накопителя присутствует в разных системах счисления (тот же пень, только сбоку). Для неопытных юзеров это крайне неудобно, но, как я уже сказал, приходится с этим мириться.

Резюмируя, отмечу следующее. Скажем, вам зададут вопрос: сколько байт в килобайте? Теоретически корректным будет ответ: 1 килобайт равен 1000 байтам. Просто надо помнить, что на практике по большей части десятичные приставки используются в качестве двоичных, которые кратны 1024, хотя иногда они применяются по прямому назначению и кратны именно 1000.

Вот такая арифметика, надеюсь, что вы не запутались. В публикации я упомянул килобайт, мегабайт, гигабайт и терабайт, а что дальше? Какие еще более крупные единицы количества информации возможны? На этот вопрос ответит таблица, где указаны не только соотношение единиц в обеих системах, но и их обозначения в международном и российском форматах:

Из данного примера следует, что 3072 байта равно 24576 битам, 3,0720 килобайтам или 3 кибибайтам. Кроме этого, чуть ниже расположены ссылки на миникалькуляторы, где вы сможете быстро произвести конкретный перевод из одной системы единиц в другую.

Байт (англ. byte ) (русское обозначение: байт и Б; международное: B, byte) [1] — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (2 8 ) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 битов), поэтому иногда в компьютерных стандартах и официальных документах для однозначного обозначения группы из 8 битов используется термин «октет» (лат. octet ).

В большинстве вычислительных архитектур байт — это минимальный независимо адресуемый набор данных.

Содержание

История [ править | править код ]

Название «байт» было впервые использовано в июне 1956 года В. Бухгольцем (англ. Werner Buchholz ) при проектировании первого суперкомпьютера IBM 7030 Stretch для пучка одновременно передаваемых в устройствах ввода-вывода битов числом от одного до шести. Позже, в рамках того же проекта, байт был расширен до восьми бит. Слово byte было выбрано как намеренно искажённое слово bite, произносящееся так же (англ. bite — «кусок»; «часть чего-либо, отделённая за один укус»; ср. также появившееся позже название для 4-битной единицы «ниббл» от англ. nibble — «покусывать»). Изменённое написание byte через y вместо i потребовалось, чтобы избежать смешения со словом «бит» (bit) [2] . В печати слово byte впервые появилось в июне 1959 года [3] .

Ряд ЭВМ 1950-х и 1960-х годов (БЭСМ-6, М-220) использовали 6-битовые символы в 48-битовых или 60-битовых машинных словах. В некоторых моделях ЭВМ производства Burroughs Corporation (ныне Unisys) размер символа был равен 9 битам. В советской ЭВМ Минск-32 использовался 7-битный байт.

Байтовая адресация памяти была впервые применена в системе IBM System/360. В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких байтов, что затрудняло обработку текстовых данных.

Читайте также:  Ip адрес роутера asus rt n12

8-битные байты были приняты в System/360, вероятно, из-за использования BCD-формата представления чисел: одна десятичная цифра (0—9) требует 4 бита (тетраду) для хранения; один 8-битный байт может представлять две десятичные цифры. Байты из 6 битов могут хранить только по одной десятичной цифре, два бита остаются незадействованными.

По другой версии, 8-битный размер байта связан с 8-битным же числовым представлением символов в кодировке EBCDIC.

По третьей версии, из-за двоичной системы кодирования в компьютерах наиболее выгодными для аппаратной реализации и удобными для обработки данных являются длины слов, кратные степеням двойки, в том числе и 1 байт = 2 3 = 8 битов . Системы и компьютеры с длинами слов, не кратными числу 2, отпали из-за невыгодности и неудобства.

Постепенно 8-битные байты стали стандартом де-факто; с начала 1970-х в большинстве компьютеров байты состоят из 8 битов , а размер машинного слова кратен 8 битам .

Количество состояний (кодов) в байте [ править | править код ]

Количество состояний (кодов, значений), которое может принимать 1 восьмибитный байт с позиционным кодированием, определяется в комбинаторике. Оно равно количеству размещений с повторениями и вычисляется по формуле:

N p = A ¯ ( n , k ) = A ¯ n k = n k = 2 8 = 256

=<ar >(n,k)=<ar >_^=n^=2^<8>=256>возможных состояний (кодов, значений), где

  • N p

>— количество состояний (кодов, значений) в одном байте;

  • A ¯ ( n , k ) = A ¯ n k (n,k)=<ar >_^>— количество размещений с повторениями;
  • n — количество состояний (кодов, значений) в одном бите; в бите 2 состояния ( n = 2 );
  • k — количество битов в байте; в 8-битном байте k = 8 .
  • Производные единицы [ править | править код ]

    Измерения в байтах
    ГОСТ 8.417—2002 Приставки СИ Приставки МЭК
    Название Обозначение Степень Название Степень Название Символ Степень
    байт Б 10 0 10 0 байт B Б 2 0
    килобайт Кбайт 10 3 кило- 10 3 кибибайт KiB КиБ 2 10
    мегабайт Мбайт 10 6 мега- 10 6 мебибайт MiB МиБ 2 20
    гигабайт Гбайт 10 9 гига- 10 9 гибибайт GiB ГиБ 2 30
    терабайт Тбайт 10 12 тера- 10 12 тебибайт TiB ТиБ 2 40
    петабайт Пбайт 10 15 пета- 10 15 пебибайт PiB ПиБ 2 50
    эксабайт Эбайт 10 18 экса- 10 18 эксбибайт EiB ЭиБ 2 60
    зеттабайт Збайт 10 21 зетта- 10 21 зебибайт ZiB ЗиБ 2 70
    йоттабайт Ибайт 10 24 йотта- 10 24 йобибайт YiB ЙиБ 2 80

    Кратные и дольные приставки для образования производных единиц для байта применяются не как обычно. Уменьшительные приставки не используются совсем, а единицы измерения информации, меньшие, чем байт, называются специальными словами — ниббл (тетрада, полубайт) и бит. Увеличительные приставки кратны либо 1024 = 2 10 , либо 1000 = 10 3 : 1 кибибайт равен 1024 байтам , 1 мебибайт — 1024 кибибайтам или 1024×1024 = 1 048 576 байтам и т. д. для гиби-, теби- и пебибайтов. В свою очередь 1 килобайт равен 1000 байтам , 1 мегабайт — 1000 килобайтам или 1000×1000 = 1 000 000 байтам и т. д. для гига-, тера- и петабайт. Разница между ёмкостями (объёмами), выраженными в кило = 10 3 = 1000 и выраженными в киби = 2 10 = 1024 , возрастает с ростом веса приставки. МЭК рекомендует использовать двоичные приставки — кибибайт, мебибайт, йобибайт и т. п.

    Иногда десятичные приставки используются и в прямом смысле, например, при указании ёмкости жёстких дисков: у них гигабайт (гибибайт) может обозначать не 1 073 741 824 = 1024 3 байтов , а миллион килобайтов (кибибайтов), то есть 1 024 000 000 байтов , а то и просто миллиард байтов.

    Обозначение [ править | править код ]

    Использование русской прописной буквы «Б» для обозначения байта регламентирует Межгосударственный (СНГ) стандарт ГОСТ 8.417-2002 [4] («Единицы величин») в «Приложении А» и Постановление Правительства РФ от 31 октября 2009 г. № 879. Кроме того, констатируется традиция использования приставок СИ вместе с наименованием «байт» для указания множителей, являющихся степенями двойки ( 1 Кбайт = 1024 байт , 1 Мбайт = 1024 Кбайт , 1 Гбайт = 1024 Мбайт и т. д., причём вместо строчной «к» используется прописная «К»), и упоминается, что подобное использование приставок СИ не является корректным. По ГОСТ IEC 60027-2-2015 строчная «к» соответствует 1000 и «Ки» — 1024, так 1 КиБ = 1024 Б, 1 кБ = 1000 Б.

    Использование прописной буквы «Б» для обозначения байта соответствует требованиям ГОСТ и позволяет избежать путаницы между сокращениями от байт и бит. Запись со строчной буквой в виде «Кб» (Мб, Гб) для обозначения байта будет не соответствовать международному стандарту IEC (и локализованному по нему ГОСТ). Однако авторы орфографического словаря [5] приводят строчную форму «б» (и «Кб», «Мб», «Гб») для байта, как не образованную от фамилии.

    Следует учитывать, что в ГОСТ 8.417, кроме «бит», для бита нет однобуквенного обозначения, поэтому использование записи вроде «Мб» как синонима для «Мбит» не соответствует этому стандарту. Но в некоторых документах используется сокращение b для bit: IEEE 1541-2002, IEEE Std 260.1-2004, в нижнем регистре: ГОСТ Р МЭК 80000-13—2016, ГОСТ IEC 60027-2-2015.

    В международном стандарте МЭК IEC 60027-2 от 2005 года [6] для применения в электротехнической и электронной областях рекомендуются обозначения:

    • bit — для бита;
    • o, B — для октета, байта. Причём о — единственное указанное обозначение во французском языке.

    Склонение [ править | править код ]

    Кроме обычной формы родительного падежа множественного числа (байтов, килобайтов, битов) существует счётная форма «байт» [7] , которая используется в сочетании с числительными: 8 байт , 16 килобайт . Счётная форма является разговорной. Точно так же, например, с килограммами: обычная форма родительного падежа употребляется, если нет числительного, а в сочетании с числительным могут быть варианты: 16 килограммов (стилистически нейтральная обычная форма) и 16 килограмм (разговорная счётная форма).

    “>