Народна Освіта » Інформатика » Двоичное кодирование

НАРОДНА ОСВІТА

Двоичное кодирование

1.    В чем заключаются процессы кодирования и декодирования сообщений?

2.    Какие таблицы кодов символов используют для кодирования текстовых сообщений?

3.    Что означают приставки кило, мега, гига?

ДВОИЧНОЕ КОДИРОВАНИЕ. БИТ И БАЙТ

 

Как вы уже знаете, для кодирования данных используют различные наборы сигналов. Для кодирования звуков речи используют буквы алфавита. В украинском языке букв 33, в английском - 26. Набор сигналов для кодирования числовых значений состоит из 10 цифр. Для кодирования команд, регулирущих порядок движения на пешеходных переходах, используют 3 цвета светофора. Наименьшее количество сигналов для кодирования сообщений имеет азбука Морзе - лишь 2 сигнала: точка и тире.

С 1844 года азбуку, предложенную американским художником Сэмюэлем Морзе (1791-1872) (рис. 1.7), впоследствии названную в его честь, ис-

пользовали для передачи сообщений по телеграфу. В азбуке Морзе буквы текстовых сообщений кодируются последовательностями точек и тире. Примеры кодирования букв русского алфавита приведены в таблице 1.3.

Таблица 1.3

Примеры кодирования букв в азбуке Морзе

Например, слово парта кодируется с использованием азбуки Морзе последовательностью сигналов «·--· · — · — · — · —».

Кодирование сообщений с использованием сигналов только двух видов называют двоичным кодированием. Сообщение, полученное в результате двоичного кодирования, называют двоичным кодом сообщения.

Двоичное кодирование используется и в современных компьютерах. В них сообщения кодируются последовательностями сигналов двух видов. Каждый сигнал одного вида условно обозначается цифрой 0, а второго вида - цифрой 1.

Цифру 0 или 1 в двоичном коде сообщения называют бит (англ. binary digit - двоичная цифра).

Из таблицы 1.3 видно, что в азбуке Морзе для кодирования буквы «т» используется 1 сигнал - тире, для кодирования буквы «а» - два, а для буквы «п» - четыре сигнала. Во время передачи сообщений по телеграфу одну букву от другой отделяют промежутками в подаче сигналов. Для обработки данных с использованием компьютера это не удобно. Проще отделить одну букву от другой, когда для их кодирования будет использовано одинаковое количество сигналов.

Если для кодирования сообщения используется 1 сигнал (бит) 0 или 1, то можно закодировать, например:

•    вывод о правильности утверждения: ложное - 0 или истинное - 1;

•    пол человека: женский - 0 или мужской - 1;

•    состояние выключателя: выключен - 0 или включен - 1

и т. п.

Из двух битов можно составить 4 (22) разных кода (00, 01, 10 и 11). Ими можно закодировать, например, четыре стороны горизонта: 00 - север, 01 - восток, 10 - юг, 11 - запад.

Из трех битов можно составить уже 8 (23) разных кодов (000, 001, 010, 011, 100, 101, 110, 111). Ими можно закодировать, например, номера строк или столбцов на шахматной доске.

Из четырех битов можно составить 24 = 16 кодов, из пяти - 25 = 32 кода и т. д.

Из восьми битов можно составить 28 = 256 кодов, и этого количества кодов достаточно, чтобы закодировать все буквы английского и русского (или какого-либо другого) алфавита, арабские цифры, знаки препинания, знаки арифметических действий, а также некоторые другие символы. Именно такое количество кодов содержится, например, в таблице кодов символов Windows-1251.

Последовательность из восьми битов называют байт.

1 байт = 8 бит.

ДЛИНА ДВОИЧНОГО КОДА СООБЩЕНИЙ

Если символ сообщения кодируется последовательностью из 8 бит, то длина двоичного кода этого символа равна 8 бит, или 1 байт.

Длина двоичного кода сообщения - это количество байтов в двоичном коде этого сообщения.

Например, сообщение Информатика - интересный предмет! содержит 33 символа (включая символы пробелов, тире, восклицательный знак). Если каждый символ кодировать двоичным кодом длиной 1 байт, то длина двоичного кода такого сообщения будет равна 33 байтам.

Как вы знаете, в таблице кодов символов Windows-1251 каждому символу соответствует целое число от 0 до 255. Каждое из этих чисел может быть закодировано одним байтом. Примеры такого кодирования приведены в таблице 1.4.

Таблица 1.4

Примеры двоичного кодирования

Таким образом, каждому символу в таблице кодов символов Windows-1251 соответствует двоичный код длиной 1 байт.

Чтобы выполнить двоичное кодирование текстового сообщения, можно каждый его символ заменить двоичным кодом, который соответствует числу из таблицы Windows-1251. Именно так кодируются текстовые документы, созданные в текстовом редакторе Блокнот, при их сохранении на носителе данных, если при сохранении используется кодировка ANSI (англ. American National Standards Institute - Американский национальный институт стандартов). Длина двоичного кода сообщения, содержащегося в таком документе, будет равняться в байтах количеству символов в текстовом документе. Следует учесть, что каждое нажатие клавиши Enter кодируется двумя специальными символами - символом перехода на новую строку и символом возвращения в начало строки.

Графические, звуковые, видеосообщения для их обработки компьютером также кодируются двоичными кодами.

Длину двоичного кода сообщений называют объемом данных.

КРАТНЫЕ ЕДИНИЦЫ ИЗМЕРЕНИЯ ДЛИНЫ ДВОИЧНОГО КОДА

Для обозначения длины двоичного кода сообщения используют кратные единицы измерения, образующиеся с использованием приставок кило, мега, гига, тера и др. Перечень этих приставок для обозначения кратных единиц измерения определен в Международной системе единиц (СИ). Там также приведены соответствующие множители. Но исторически сложилось так, что эти приставки (кило, мега, гига, тера) в информатике трактуются иначе, чем, например, в физике. С шестого класса вам известно, что:

1 Кбайт (килобайт)= 210 байт = 1024 байт;

1 Мбайт(мегабайт) = 210 Кбайт = 220 байт = 1 048 576 байт;

1 Гбайт (гигабайт)= 210 Мбайт = 220 Кбайт = 230 байт;

1 Тбайт(терабайт) = 210 Гбайт = 220 Мбайт = 230 Кбайт = 240 байт.

Так произошло потому, что в компьютере используются двоичные коды, для обработки которых удобно оперировать степенями числа 2, а не степенями числа 10. И поскольку 210 = 1024, что приблизительно равно 1000, то именно 210 байт = 1024 байт и стали называть килобайт. Аналогично, 210 килобайт стали называть мегабайт и т. д.

ПЕРЕВОД ОДНИХ ЕДИНИЦ ИЗМЕРЕНИЯ ДЛИНЫ ДВОИЧНОГО КОДА В ДРУГИЕ

Длину двоичного кода сообщений можно указывать в битах, байтах и в кратных им единицах. Рассмотрим несколько задач на перевод одних единиц измерения в другие при определении длины двоичного кода сообщения.

Задача 1. Длина двоичного кода сообщения составляет 4,5 Мбайт. Выразить это значение в байтах.

Решение. Для перехода от мегабайтов к байтам сначала выразим длину двоичного кода этого сообщения в килобайтах. Учитываем, что 1 Мбайт = = 1024 Кбайт.

4,5 Мбайт · 1024 = 4608 Кбайт.

Переведем килобайты в байты, учитывая, что 1 Кбайт = 1024 байт.

4608 Кбайт · 1024 = 4 718 592 байт.

Ответ: 4,5 Мбайт = 4 718 592 байт.

Задача 2. Двоичный код сообщения состоит из 4 194 304 000 бит. Выразить длину двоичного кода этого сообщения целым числом в наибольших возможных единицах.

Решение. Переведем биты в байты, учитывая, что 1 байт = 8 бит.

4 194 304 000 бит : 8 = 524 288 000 байт.

Полученное число больше множителя 1024, который используется для перехода от байтов к килобайтам в определении длины двоичного кода. Поэтому переведем байты в килобайты.

524 288 000 байт : 1024 = 512 000 Кбайт.

Аналогично рассуждая, переведем килобайты в мегабайты.

512 000 Кбайт : 1024 = 500 Мбайт.

Полученное значение меньше чем 1024, поэтому перейти к большей единице с сохранением целого результата невозможно.

Ответ: 4 194 304 000 бит = 500 Мбайт.

Задача 3. Вычислить приблизительно длину двоичного кода текста учебника по информатике (не считая форматирования и рисунков).

Решение. Будем считать, что текст закодирован с использованием таблицы кодов символов Windows-1251, то есть длина двоичного кода каждого символа составляет 1 байт.

В каждой строке текста содержится около 60 символов, то есть длина двоичного кода строки составляет приблизительно 60 байт. На каждой странице размещено около 50 строк. Итак, длина двоичного кода страницы составляет примерно 60 · 50 = 3000 (байт). В учебнике около 250 страниц, то есть длина двоичного кода учебника составляет примерно 3000 · 250 = 750 000 (байт).

Перейдем к более крупной единице измерения длины двоичного кода.

750 000 байт : 1024 « 732,4 Кбайт.

Ответ: длина двоичного кода текста учебника по информатике примерно 732,4 Кбайт.

Самое важное в этом пункте

Кодирование сообщений с использованием сигналов только двух видов называют двоичным кодированием. Сообщение, полученное в результате двоичного кодирования исходного сообщения, называют двоичным кодом сообщения.

Цифру 0 или 1 в двоичном коде сообщения называют бит.

Последовательность из восьми битов называют байт.

1 байт = 8 бит.

Длина двоичного кода сообщения - это количество байт в двоичном коде этого сообщения.

Каждому символу в таблице кодов символов Windows-1251 соответствует двоичный код длиной 1 байт.

1 Кбайт (килобайт) = 22 байт = 1024 байт;

1 Мбайт (мегабайт) = 22 Кбайт = 220 байт = 1 048 576 байт;

1 Гбайт (гигабайт) = 22 Мбайт = 220 Кбайт = 230 байт;

1 Тбайт (терабайт) = 22 Гбайт = 220 Мбайт = 230 Кбайт = 240 байт.

Дайте ответы на вопросы

5°. Какова длина двоичного кода каждого символа в таблице кодов символов Windows-1251?

6*. Какой будет длина двоичного кода сообщения, созданного в текстовом редакторе Блокнот и сохраненном в кодировке ANSI?

7*. На сколько будет отличаться длина двоичного кода сообщения, в котором указано ваше имя, если его создать в текстовом редакторе Блокнот и сохранить в кодировке ANSI в двух вариантах: записанным в одну строку и записанным в столбик по одной букве на строку?

8*. Чему равен 1 килобайт, 1 мегабайт, 1 гигабайт, 1 терабайт?

9*. Какую математическую операцию необходимо выполнить для перевода длины двоичного кода сообщений:

а)    из битов в байты;

б)    из байтов в килобайты;

в)    из мегабайтов в килобайты?

1°. Приведите примеры, где используется двоичное кодирование сообщений.

2*. Закодируйте с использованием азбуки Морзе слова порт, рота, торт. Сравните количество сигналов в двоичном коде этих слов. 3*. Определите длину двоичного кода сообщений при условии, что сообщения закодированы с использованием таблицы кодов символов Windows-1251:

а)    Таблица кодов символов Windows-1251;

б)    В азбуке Морзе два символа - точка и тире.

4*. Сравните длину двоичного кода текстового сообщения Человек без друзей - что дерево без корней, созданного в текстовом редакторе Блокнот, при сохранении его с использованием различных кодовых таблиц.

5*. Заполните пропуски:

а) 5 байт =_бит

б) 4096 байт =_Кбайт

в) 10 Кбайт =_бит

г) 3 Мбайт =_байт

6*. Заполните пропуски:

а) 2 байт =_бит

б)    8192 байт =_Кбайт

в)    2 Кбайт =_бит

г) 100 Мбайт =_Кбайт

7*. В одной строке некоторого текста размещается в среднем 60 символов, а на одной странице - 40 строк. Сколько закодированных страниц этого текста можно взять, чтобы длина двоичного кода не превысила 8 Мбайт, если для кодирования использовать таблицу Windows-1251?

ПРАКТИЧЕСКАЯ РАБОТА № 1

«Решение задач на определение длины двоичного кода текстовых данных»

Внимание! Работая с компьютером, соблюдайте правила безопасно-ти и санитарно-гигиенические нормы.

1.    Вычислите длину двоичного кода некоторого текста при условии, что символы текста закодированы с использованием таблицы кодов символов Windows-1251. В тексте 32 страницы, каждая страница содержит 48 строк, в каждой строке в среднем 56 символов. Выразите длину двоичного кода этого текста целым числом в наибольших возможных единицах.

2.    Определите, используя текстовый редактор Блокнот, длину двоичного кода сообщения Практическая работа № 1 при условии, что сообщение закодировано с использованием таблицы кодов символов:

а)    Windows-1251;

б)    Юникод.

Сохраните текстовые документы с сообщением в файлах с именами практическая 1 Windows.txt и практическая 1 ЮникодДхС

3.    Заполните в табличном процессоре таблицу:

Сохраните результат в файле с именем практическая І.хіях.

 

Это материал учебника Информатика 8 класс Ривкинд

 

Категорія: Інформатика

Автор: admin от 16-10-2016, 02:19, Переглядів: 6075