Народна Освіта » Інформатика » Двійкове кодування

НАРОДНА ОСВІТА

Двійкове кодування

1.    У чому полягають процеси кодування та декодування повідомлень?

2.    Які таблиці кодів символів використовують для кодування текстових повідомлень?

3.    Що означають префікси кіло, мега, гіга?

ДВІЙКОВЕ КОДУВАННЯ. БІТ І БАЙТ

 

Як ви вже знаєте, для кодування даних використовують різні набори сигналів. Для кодування звуків мови використовують букви алфавіту. В українській мові літер 33, в англійській - 26. Набір сигналів для кодування числових значень складається з 10 цифр. Для кодування команд, що регулюють порядок руху на пішохідних переходах, використовують 3 кольори світлофора. Найменшу кількість сигналів для кодування повідомлень має азбука Морзе - лише 2 сигнали: крапка і тире.

З 1844 року азбуку, запропоновану американським художником Семюелем Морзе (1791-1872) (мал. 1.7), згодом названу на його честь, використовували для передавання повідомлень телеграфом. В азбуці Морзе літери текстових повідомлень кодуються послідовностями крапок і тире. Приклади кодування літер українського алфавіту наведено в таблиці 1.3.

Приклади кодування літер в азбуці Морзе

Таблиця 1.3

Літера

Значення коду в азбуці Морзе

а

• -

о

п

р

т

-

Наприклад, слово парта кодується з використанням азбуки Морзе послідовністю сигналів «·--· · — · — · — · —».

Кодування повідомлень з використанням сигналів лише двох видів називають двійковим кодуванням. Повідомлення, отримане в результаті двійкового кодування повідомлення, називають двійковим кодом повідомлення.

Двійкове кодування використовується і в сучасних комп’ютерах. У них усі повідомлення кодуються послідовностями сигналів двох видів. Кожний сигнал одного виду умовно позначається цифрою 0, а другого виду - 1.

Цифру 0 або 1 у двійковому коді повідомлення називають біт (англ. binary digit - двійкова цифра).

З таблиці 1.3 видно, що в азбуці Морзе для кодування літери «т» використовується 1 сигнал - тире, для кодування літери «а» - два, а для літери «п» - чотири сигнали. Під час передачі повідомлень телеграфом одну літеру від іншої відокремлюють проміжками в подачі сигналів. Для опрацювання даних з використанням комп’ютера це не зручно. Простіше відокремити одну літеру від іншої, коли на їх кодування буде використано однакову кількість сигналів.

Якщо для кодування повідомлення використовується 1 сигнал (біт)

0    або 1, то можна закодувати, наприклад:

• висновок про правильність твердження: хибне - 0 або істинне - 1;

•    стать людини: жіноча - 0 або чоловіча - 1;

•    стан вимикача: вимкнено - 0 або увімкнено - 1

тощо.

З двох бітів можна скласти 4 (22) різних коди (00, 01, 10 і 11). Ними можна закодувати, наприклад, чотири сторони горизонту: 00 - північ,

01 - схід, 10 - південь, 11 - захід.

Із трьох бітів можна скласти вже 8 (23) різних кодів (000, 001, 010, 011, 100, 101, 110, 111). Ними можна закодувати, наприклад, номери рядків або стовпців шахівниці.

Із чотирьох бітів можна скласти 24 = 16 кодів, з п’яти - 25 = 32 коди і т. д.

З восьми бітів можна скласти 28 = 256 кодів, і цієї кількості кодів достатньо, щоб закодувати всі літери англійського та українського (або якогось іншого) алфавіту, арабські цифри, розділові знаки, знаки арифметичних дій, а також деякі інші символи. Саме така кількість кодів міститься, наприклад, у таблиці кодів символів Windows-1251.

Послідовність із восьми бітів називають байт.

1 байт = 8 бітів.

ДОВЖИНА ДВІЙКОВОГО КОДУ ПОВІДОМЛЕНЬ

Якщо символ повідомлення кодується послідовністю з 8 бітів, то довжина двійкового коду цього символу дорівнює 8 бітів, або 1 байт.

Довжина двійкового коду повідомлення - це кількість байтів у двійковому коді цього повідомлення.

Наприклад, повідомлення Інформатика - цікавий предмет! містить 30 символів (включаючи символи пропусків, тире, знак оклику). Якщо

кожний символ кодувати двійковим кодом довжиною 1 байт, то довжина двійкового коду такого повідомлення дорівнюватиме 30 байтам.

Як ви знаєте, у таблиці кодів символів Windows-1251 кожному символу ставиться у відповідність ціле число від 0 до 255. Кожне із цих чисел може бути закодоване одним байтом. Приклади такого кодування наведено в таблиці 1.4.

Приклади двійкового кодування

Таблиця 1.4

Символ

Числовий код символу

Відповідний байт

!

33

00100001

@

64

01000000

W

103

01100111

ю

254

11111110

я

255

11111111

Отже, кожному символу в таблиці кодів символів Windows-1251 відповідає двійковий код довжиною 1 байт.

Щоб виконати двійкове кодування текстового повідомлення, можна кожний його символ замінити двійковим кодом, що відповідає числу з таблиці Windows-1251. Саме так кодуються текстові документи, створені в текстовому редакторі Блокнот, під час їх збереження на носії даних, якщо під час збереження використовувати кодування ANSI (англ. American National Standards Institute - Американський національний інститут стандартів). Довжина двійкового коду повідомлення, що міститься в такому документі, буде дорівнювати в байтах кількості символів у текстовому документі. Треба врахувати, що кожне натискання клавіші Enter кодується двома спеціальними символами - символом переходу на новий рядок і символом повернення на початок рядка.

Графічні, звукові, відеоповідомлення для їх опрацювання комп’ютером також кодуються двійковими кодами.

Довжину двійкового коду повідомлень називають обсягом даних.

КРАТНІ ОДИНИЦІ ВИМІРЮВАННЯ ДОВЖИНИ ДВІЙКОВОГО КОДУ

Для позначення довжин двійкового коду повідомлень використовують кратні одиниці вимірювання, які утворюються з використанням префіксів кіло, мега, гіга, тера та ін. Перелік цих префіксів для позначення кратних одиниць вимірювання визначено у Міжнародній системі одиниць (СІ). Там також наведено відповідні множники. Але історично склалось так, що ці префікси (кіло, мега, гіга, тера) в інформатиці трактуються інакше, ніж, наприклад, у фізиці. Із шостого класу вам відомо, що:

1 Кбайт (кілобайт) = 210 байтів = 1024 байти;

1 Мбайт (мегабайт) = 210 Кбайт = 220 байтів = 1 048 576 байтів;

1 Гбайт (гігабайт) = 210 Мбайт = 220 Кбайт = 230 байтів;

1 Тбайт (терабайт) = 210 Гбайт = 220 Мбайт = 230 Кбайт = 240 байтів.

Так сталося тому, що в комп’ютері використовуються двійкові коди, для опрацювання яких зручно оперувати степенями числа 2, а не степенями числа 10. І оскільки 210 = 1024, що приблизно дорівнює 1000, то саме 210 байтів = 1024 байти і стали називати кілобайт. Аналогічно, 210 кілобайт стали називати мегабайт і т. д.

ПЕРЕВЕДЕННЯ ОДНИХ ОДИНИЦЬ ВИМІРЮВАННЯ ДОВЖИНИ ДВІЙКОВОГО КОДУ В ІНШІ

Довжину двійкового коду повідомлень можна вказувати в бітах, байтах та у кратних їм одиницях. Розглянемо кілька задач на переведення одних одиниць вимірювання в інші під час визначення довжини двійкового коду повідомлення.

Задача 1. Довжина двійкового коду повідомлення складає 4,5 Мбайта. Виразити це значення в байтах.

Розв’язання. Для переходу від мегабайтів до байтів спочатку виразимо довжину двійкового коду цього повідомлення в кілобайтах. Враховуємо, що 1 Мбайт = 1024 Кбайт.

4,5 Мбайта · 1024 = 4608 Кбайт.

Переведемо кілобайти в байти, враховуючи, що 1 Кбайт = 1024 байти.

4608 Кбайт · 1024 = 4 718 592 байти.

Відповідь: 4,5 Мбайта = 4 718 592 байти.

Задача 2. Двійковий код повідомлення складається з 4 194 304 000 бітів. Виразити довжину двійкового коду цього повідомлення цілим числом у найбільших можливих одиницях.

Розв’язання. Переведемо біти в байти, враховуючи, що 1 байт = 8 бітів.

4 194 304 000 бітів : 8 = 524 288 000 байтів.

Отримане число більше за множник 1024, який використовується для переходу від байтів до кілобайтів у визначенні довжини двійкового коду. Тому переведемо байти в кілобайти.

524 288 000 байт : 1024 = 512 000 Кбайт.

Аналогічно міркуючи, переведемо кілобайти в мегабайти.

512 000 Кбайт : 1024 = 500 Мбайт.

Отримане значення менше ніж 1024, тому перейти до більшої одиниці зі збереженням цілого результату неможливо.

Відповідь: 4 194 304 000 бітів = 500 Мбайт.

Задача 3. Обчислити наближено довжину двійкового коду тексту підручника з інформатики (не враховуючи форматування та малюнки).

Розв’язання. Уважатимемо, що текст закодовано з використанням таблиці кодів символів Windows-1251, тобто довжина двійкового коду кожного символу складає 1 байт.

У кожному рядку тексту міститься близько 60 символів, тобто довжина двійкового коду рядка складає приблизно 60 байтів. На кожній сторінці розміщено близько 50 рядків. Отже, довжина двійкового коду сторінки складає приблизно 60 · 50 = 3000 (байтів). У підручнику близько 250 сторінок, тобто довжина двійкового коду підручника складає приблизно 3000 · 250 = 750 000 (байтів).

Перейдемо до крупнішої одиниці вимірювання довжини двійкового коду.

750 000 байтів : 1024 « 732,4 Кбайта.

Відповідь: довжина двійкового коду тексту підручника з інформатики приблизно 732,4 Кбайта.

Кодування повідомлень з використанням сигналів лише двох видів називають двійковим кодуванням. Повідомлення, отримане в результаті двійкового кодування початкового повідомлення, називають двійковим кодом повідомлення.

Цифру 0 або 1 у двійковому коді повідомлення називають біт.

Послідовність із восьми бітів називають байт.

1 байт = 8 бітів.

Довжина двійкового коду повідомлення - це кількість байт у двійковому коді цього повідомлення.

Кожному символу в таблиці кодів символів Windows-1251 відповідає двійковий код довжиною 1 байт.

1 Кбайт (кілобайт) = 210 байтів = 1024 байти;

1 Мбайт (мегабайт) = 210 Кбайт = 220 байтів = 1 048 576 байтів;

1 Гбайт (гігабайт) = 210 Мбайт = 220 Кбайт = 230 байтів;

1 Тбайт (терабайт) = 210 Гбайт = 220 Мбайт = 230 Кбайт = 240 байтів.

Дайте відповіді на запитання

1°. У чому полягає двійкове кодування повідомлень?

2°. Що таке 1 біт?

3°. Чому дорівнює 1 байт?

4*. Що розуміють під довжиною двійкового коду повідомлення?

5°. Якою є довжина двійкового коду кожного символу в таблиці кодів символів Windows-1251?

6*. Якою буде довжина двійкового коду повідомлення, створеного в текстовому редакторі Блокнот і збереженому в кодуванні ANSI, у кодуванні Юнікод?

7*. На скільки відрізнятиметься довжина двійкового коду повідомлення, у якому зазначене ваше ім’я, якщо його створити в текстовому редакторі Блокнот і зберегти в кодуванні ANSI у двох варіантах: записаним в один рядок та записаним у стовпчик по одній л ітері на рядок?

8*. Чому дорівнює 1 кілобайт, 1 мегабайт, 1 гігабайт, 1 терабайт?

9*. Яку математичну операцію потрібно виконати для переведення довжини двійкового коду повідомлень:

а)    з бітів у байти;

б)    з байтів у кілобайти;

в)    з мегабайтів у кілобайти?

Виконайте завдання

1°. Наведіть приклади, де використовується двійкове кодування повідомлень.

2*. Закодуйте з використанням азбуки Морзе слова порт, рота, торт.

Порівняйте кількість сигналів у двійковому коді цих слів.

3*. Визначте довжину двійкового коду повідомлень за умови, що повідомлення закодовані з використанням таблиці кодів символів Windows-1251:

а)    Таблиця кодів символів Windows-1251;

б)    В алфавіті азбуки Морзе два символи - крапка та тире.

4*. Порівняйте довжину двійкового коду текстового повідомлення Людина без друзів - що дерево без коріння, створеного в текстовому редакторі Блокнот, під час збереження його з використанням різних кодових таблиць.

5*. Заповніть пропуски:

а) 5 байтів =_бітів

б)    4096 байтів =_Кбайт

в) 10 Кбайт =_бітів

г) 3 Мбайти =_байтів

6*. Заповніть пропуски:

а) 2 байти =_бітів

б) 8192 байти =_Кбайт

в) 2 Кбайт =_бітів

г) 100 Мбайт =_Кбайт

7*. В одному рядку деякого тексту розміщується в середньому 60 символів, а на одній сторінці - 40 рядків. Скільки закодованих сторінок цього тексту можна взяти, щоб довжина двійкового коду не перевищила 8 Мбайт, якщо для кодування використати таблицю Windows-1251?

ПРАКТИЧНА РОБОТА № 1

«Розв’язування задач на визначення довжини двійкового коду

текстових даних»

Увага! Під час роботи з комп’ютером дотримуйтеся правил безпеки та санітарно-гігієнічних норм.

1. Обчисліть довжину двійкового коду деякого тексту за умови, що символи тексту закодовані з використанням таблиці кодів символів Windows-1251. У тексті 32 сторінки, кожна сторінка містить 48 рядків, у кожному рядку в середньому 56 символів. Виразіть довжину двійкового коду цього тексту цілим числом у найбільших можливих одиницях.

2.    Визначте, використовуючи текстовий редактор Блокнот, довжину двійкового коду повідомлення Практична робота № 1 за умови, що повідомлення закодоване з використанням таблиці кодів символів:

а)    Windows-1251;

б)    Юнікод.

Збережіть текстові документи з повідомленням у файлах з іменами практична 1 Windows.txt та практична 1 ЮнікодЛхВ

3.    Заповніть у табличному процесорі таблицю:

Бітів

Байтів

Кілобайт

Мегабайт

614 400

     
 

524 288

   
   

256

 
     

4

Збережіть результат у файлі з іменем практична І.хівх.

 

Це матеріал з підручника Інформатика 8 клас Ривкінд

 

Категорія: Інформатика

Автор: admin от 16-10-2016, 15:47, Переглядів: 27769