Народна Освіта » Інформатика » Вимірювання інформації

НАРОДНА ОСВІТА

Вимірювання інформації

ЯК ВИМІРЯТИ ІНФОРМАЦІЮ

Якщо спробувати записати па CD-диск кінофільм з високою якістю зображення, зробити це не вдасться, оскільки фільм не поміститься на CD. А якщо, користуючись «повільним» іптерпет-підключеппям, переглядати онлайнове відео, воно буде «гальмувати». Щоб уникнути таких ситуацій, слід врахов(увати, який обсяг інформації бере участь в інформаційному процесі.

Інформація, за визначенням, — це щось корисне і зрозуміле користувачеві. Виходить, що текстовий файл, який містить 100 літер «А» або пробілів і займає на диску певний простір, не несе інформації. Отже, до вимірювання інформації мають існувати принаймні два підходи — такий, що враховує зміст повідомлення, і такий, що дає змоіу оцінити обсяг його даних. Окрім цього, потрібно ввести еталонну одиницю, подібно до того, як для вимірювання маси введено еталонну одиницю кілограм, для вимірювання довжини — метр.

ЗМІСТОВИЙ ПІДХІД

Основою змістового підходу до вимірювання інформації є зміст інформаційного повідомлення. Згідно з цим підходом, кількість інформації розглядається як ступінь зменшення невизначеності знань у результаті отримання повідомлення.

Розглянемо процес підкидання монети. Вона може впасти на один з двох боків («орел» чи «решка»), отже, перед її підкиданням невизначеність дорівнює 2. Невизначеність перед підкиданням грального кубика дорівнює 6 (у кубика шість граней), невизначеність того, скільки балів молена отримати за відповідь па уроці, становить 12 (за дванадцятибаль-ної системи оцнпованпя), а невизначеність того, який колір вибере користувач із шістпадцятиколірної палітри програми Paint, — 16 (рис. 1.11).

Невизначеність знання про результат певної події дорівнює кількості можливих результатів цієї події.

Якщо ми не знаємо значення жодного розряду коду кольору палітри, невизначеність кольору дорівнює 16. Коли нам стане відомий старший (четвертий) розряд, невизначеність зменшиться в два рази, оскільки кіль-

кість варіантів буде дорівнювати 8, адже ми точно знатимемо, з якої частини таблиці обрано колір — лівої чи правої. Якщо на додаток до цього знати третій розряд, стане відомо, в якій половині стовпця міститиметься обраний колір — верхній чи нижній.

Код

0

Повідомлення

Орел

1

Решка

 

Рис. 1.11

 

Код

Колір

Код

Колір

0000

1

1000

9

0001

2

1001

10

0010

3

1010

11

0011

4

1011

12

0100

5

1100

13

0101

6

1101

14

0110

7

1110

15

0111

8

1111

16

 

Таким чином, щоб дізнатися, який колір обрав користувач, достатньо задати чотири запитання (кожне про значення відповідного розряду коду) та отримати у відповідь чотири повідомлення, що містять відповідь «так» чи «ні» (0 або 1). Згідно зі змістовим підходом, кожне таке повідомлення містить один біт інформації.

Один біт інформації — це кількість інформації, що зменшує невизначеність у два рази.

Отже, двійковий код кольору ішстнадцятиколірної палітри містить 4 біти інформації, а повідомлення про те, яким боком впала монетка, — 1 біт.

Як ви вже знаєте, біт с мінімальною одиницею вимірювання інформації.

Наступна за величиною одиниця — байт, за ним йдуть кілобайт, мегабайт, гігабайт і терабайт.

 

1 байт = 8 біт = 23 біт;

1 кілобайт (Кбайт) = 210 = 1024 байт;

1 мегабайт (Мбайт) = 210 Кбайт = 1024 Кбайт;

1 гігабайт (Гбайт) = 210 Мбайт = 1024 Мбайт;

1 терабайт (Тбайт) = 210 Гбайт = 1024 Гбайт.

Зверніть увагу на те, що в інформатиці система утворення кратних одиниць відрізняється від прийнятої в інших науках. У традиційних метричних системах як множники кратних одиниць застосовуються кратні 10 коефіцієнти 1000, 100 000, 100 000 000 і т. д. та відповідні префікси «кіло», «мега», «гіга» і т. д.

Оскільки в комп’ютері застосовз'сться двійкове кодування, в кратних одиницях вимірювання використовуються коефіцієнти, кратні 2. Щоб відрізняти десяткові та двійкові коефіцієнти, двійкові домовилися писати з великої літери.

Приклад 1. Під час відгадування цілого числа, значення якого знаходиться в діапазоні від 1 до IV, було отримано 5 біт інформації. Чому дорівнює число N7

Розв ’язання

Визначимо невизначеність повідомлення з довжиною 5 біт: 2й = 32. За допомогою такого повідомлення можна закодувати будь-яке з 32 різних чисел. Якщо це числа з діапазону від 1 до 32, то N = 32.

Відповідь: N = 32.

Приклад 2. Світлове табло складається з лампочок, кожна з яких може перебувати в одному з двох станів: «увімкнена» або «вимкнена». Яку найменшу кількість лампочок мас містити табло, щоб з його допомогою можна було передати 140 різних сигналів?

Розв ’яванця

Визначимо, скільки двійкових розрядів потрібно для кодування 140 різних сигналів:

128 < 140 < 256 ^ 27 < 140 < 2й.

Отже, щоб табло могло відтворити 140 різних сигналів, воно мас містити 8 лампочок.

Відповідь: 8 лампочок.

АЛФАВІТНИЙ ПІДХІД

З допомогою алфавітного підходу можна виміряти кількість інформації в тексті, поданому будь-якою мовою. Водночас не враховуються такі її властивості, як корисність, актуальність або повнота. Кількість інформації не пов’язана зі змістом тексту, а залежить від інформаційної ваги символу в алфавіті.

Алфавіт — це весь набір букв, символів пунктуації та інших символів і знаків (включаючи пробіли), що застосовуються в тексті. Загальна кількість символів алфавіту визначає його потужність.

Інформаційна вага символу та потужність алфавіту пов’язані між собою такою формулою: N = 2?', де N — потужність алфавіту, Ь — інформаційна вага символу.

Найменшу потужність (рівну 1) мас алфавіт з двома символами (2 = = 2і). Саме такий аіфавіт — двійковий — застосовується в комп’ютері.

Інформаційна вага символу двійкового алфавіту прийнята за одиницю інформації, і називається ця одиниця також бітом. Як і в разі змістового підходу, від неї утворюються більші одиниці (байт, кілобайт і т. д.).

Якщо, наприклад, алфавіт містить 256 символів, то інформаційна вага одного його символу становитиме 8 біт (28 = 256). Згадайте принципи кодування тексту: саме за такої довжини двійкового коду можна закодувати всі символи зазначеного алфавіту.

У цьому випадку складене з символів повідомлення можна буде декодувати однозначно, тобто видобути з нього точну інформацію. Якщо зменшити кількість бітів, то деякі символи закодувати не вдасться, у повідомленні може з’явитися, скажімо, слово «<кр*к», і не буде зрозуміло, яке це слово: «крик» чи «крок».

За алфавітного підходу кількість інформації в тексті визначається так, як це робиться в разі обчислення загальної ваги певної кількості однакових предметів.

Кількість інформації в текстовому повідомленні дорівнює кількості символів у ньому, помноженій на інформаційну вагу символу.

Приклад 3. Визначити кількість інформації в текстовому повідомленні, що містить 96 символів. Для запису повідомлення використано алфавіт, що складається з 128 символів.

 

Роле ’язання

Визначаємо потужність алфавіту: 128 = 27.

Отже інформаційна вага символу становить 7 біт. Обчислюємо кількість інформації: 96 • 7 = 672 біт = $4 байти.

Відповідь: 672 біти, або 84 байти.

Приклад 4. На клавіатурі набрано текст: «Наше життя — це наші думки». Визначити кількість інформації в ньому в бітах і байтах.

Роле’язання

Приймемо, що інформаційна вага символів, використаних для набору тексту, дорівшос 8, оскільки, швидше за все, йдеться про набір символів ASCII.

Полічимо кількість символів у повідомленні: 27 (з урахуванням пробілів і знаків пунктуації).

Визначаємо кількість інформації у повідомленні: 27 • 8 = 216 біт = = 27 байт.

Відповідь: 216 біт, або 27 байт.

Висновки

Вимірюючи інформацію, використовзчоть змістовий та алфавітний підходи. Згідно зі змістовим підходом, кількість інформації розглядається як ступінь зменшення невизначеності знань у результаті отримання повід омлешія.

Невизначеність знання про результат певної події дорівнює кількості можливих результатів цієї події.

Один біт інформації — це кількість інформації, що зменшує невизначеність у два рази.

В алфавітному підході кількість інформації залежить від інформаційної ваги символу в алфавіті.

Алфавіт — це весь набір букв, символів пунктуації та інших символів і знаків, що застосовуються у тексті. Загальна кількість символів визначає його потужність.

Інформаційна вага символу та потужність алфавіту пов’язані між собою такою формулою: N = 2Ь, де N — потужність алфавіту, а Ь — інформаційна вага символу.

Кьгькість інформації в текстовому повідомленні дорівнює кількості символів у ньому, помноженій на інформаційну ваіу символу.

Контрольні запитання та завдання

1.    Які підходи використовують для вимірювання інформації?

2.    Які одиниці вимірювання інформації ви знаєте?

3е. Поясніть принцип змістового підходу вимірювання інформації.

4.    Що таке інформаційна вага символу в алфавіті?

5.    Що таке алфавіт?

6.    Як вимірюється кількість інформації текстового повідомлення?

Питання для роздумів

Iе. У басейні 4 доріжки для плавання. Інструктор повідомив школярів, що вони будуть плавати на другій доріжці. Скільки інформації отримали школярі?

2е*. Марійка задумала число від 1 до 100. Яку найменшу кількість спроб мас зробити Андрій, щоб відгадати число, яке задумала Марійка?

З**. Повідомлення про те, що Івасик живе на 12 поверсі, несе 4 біти інформації. Скільки поверхів у будинку?

Завдання для досліджень

1". Дізнайтеся про ілші способи вимірювання інформації. Поясніть їх принцип.

Розв'язування задач на визначення довжини двійкового коду даних різних типів

Завдання. Розв’язати задачі на визначення довжини двійкового коду.

З метою вдосконалення практичних умінь і навичок роботи з електронним процесором рекомендуємо розв’язувати пропоновані задачі, використовуючи електронні таблиці. Для цього слід завантажити файл nP1.xls з папки Files на диску, що містить шаблони задач (у файлі шаблону до клітинок зафарбованих жовтим кольором введіть дані задачі, до клітинок зафарбованих зеленим кольором — формули для виконання обчислень).

Задача 1. У телевізійному шоу «Таланти України» телеглядачам потрібно обрати одного з чотирьох найкращих учасників. Організаційний комітет шоу отримав інформацію від 151552 телеглядачів. Який обсяг інформації в кілобайтах необхідно опрацювати оргкомітету?

Задача 2. Швидкість передавання даних каналом зв'язку становить 256 Кбіт/с. Файл було передано через канал за 2 хв. Визначте обсяг файла в мегабайтах.

Задача 3. Текст, що має довжину 100 символів, записаний з використанням алфавіту потужністю 64 символи. Який інформаційний обсяг тексту в байтах?

Задача 4. Інформаційний обсяг набраного на комп'ютері тексту становить 3,5 Кбайт. Скільки символів містить цей текст? Врахуйте, що інформаційна вага символу становить 8 біт.

Задача 5. Середня швидкість читання учня 8-го класу становить 500 символів за хвилину. Визначте, скільки байтів інформації він встигне опрацювати за ЗО хв безперервного читання. Врахуйте, що інформаційна вага символу становить 8 біт.

Щоб краще зрозуміти спосіб виконання завдання, в MS Excel книга ПР1. xls містить також розв’язання прикладів 3 і 4, представлених у даному параграфі вище (рис. 1.12).

Рис. 1.12. Зразок виконання Прикладу 2 в середовищі MS Excel

Після виконання завдання збережіть файл під назвою ПР1_Прізвище.хІз.

 

Це матеріал з підручника Інформатика 8 клас Казанцева

 

Категорія: Інформатика

Автор: admin от 19-12-2016, 20:03, Переглядів: 7724