Народна Освіта » Інформатика » Кодування символів

НАРОДНА ОСВІТА

Кодування символів

1.    Що таке кодування повідомлень? З якою метою кодують повідомлення?

2.    Наведіть приклади кодування повідомлень.

3.    Що таке декодування повідомлень?

КОДУВАННЯ СИМВОЛІВ ТЕКСТУ

Для опрацювання текстових повідомлень з використанням комп’ютера символи повідомлення кодують числами.

Телетайп (лат. tele - віддалений, англ. type - друкування) - електромеханічна друкуюча машина, яку використовують для передавання текстових повідомлень дротами.

Для кодування тексту використовують таблиці кодів символів, у яких для кожного символа, що може бути використаний у текстовому повідомленні, ставиться у відповідність деяке число. У 1963 р. у США було розроблено набір таких кодів символів для передавання повідомлень телетайпом. Пізніше він став стандартом для використання в комп’ютерній техніці й отримав назву таблиці кодів символів ASCII (англ. American Standard Code for Information Interchange - американський стандартний код для обміну інформацією).

У таблиці ASCII літерам англійського алфавіту, цифрам, розділовим знакам, символам редагування та форматування тексту ставляться у відповідність числа від 0 до 127 (табл. 1.1).

Таблиця 1.1

Групи кодів символів таблиці ASCII

Діапазон

кодів

Група символів

Приклад

коду

Відповідний символ

Від 0 до 31, 127

Спеціальні

символи

10

Символ, що відповідає перенесенню курсора на новий рядок

13

Символ, що відповідає поверненню курсора на початок рядка

27

Символ, що відповідає натисканню клавіші Ебс

Продовження таблиці 1.1

Діапазон

кодів

Група символів

Приклад

коду

Відповідний символ

Від 32 до 64,

від 91 до 96, від 123 до 126

Розділові знаки та цифри

32

пропуск

48

цифра 0

123

{

Від 65 до 90

Великі літери англійського алфавіту

65

А

66

В

90

Z

Від 97 до 122

Малі літери англ і й-ського алфавіту

97

а

98

ь

122

2

 

Текстові символи, що кодуються в таблиці А8СІІ числами від 32 до 127, наведено у додатку 1, який можна переглянути на сайті Інформатика для всіх (allinf.at.ua) у розділі Матеріали до підручників. 8 клас. Підручник.

Кирилиця - алфавіт для групи слов’янських мов, до яких належать українська, російська, білоруська, болгарська та інші мови.

Англійська мова та деякі інші західноєвропейські мови мають алфавіт, який називають латиницею.

 

Таблиця кодів символів А8СІІ містить коди літер лише англійського алфавіту. Для кодування літер інших алфавітів було розроблено інакші таблиці кодів символів. Наприклад, таблиці КОІ8-Н (КОІ - код обміну інформацією) і Windows-1251 містять без змін усі коди таблиці А8СІІ, а також - коди літер кирилиці. Цим літерам ставляться у відповідність натуральні числа від 128 до 255.

Таблиця кодів символів Windows-1251 є стандартом для кодування літер кирилиці в операційній системі Windows. У ній, наприклад, літері «а» українського алфавіту ставиться у відповідність число 224, літері «і» -число 179, літері «ґ»- число 180 та ін. Текстові символи, що кодуються у таблиці Windows-1251 числами від 128 до 255, наведені в додатку 2. Додаток можна знайти на сайті Інформатика для всіх (allinf.at.ua) у розділі Матеріали до підручників. 8 клас. Підручник.

Цілих чисел від 0 до 255 вистачає, щоб закодувати символи двох алфавітів - латиниці й кирилиці та деякі інші символи. Але для кодування символів інших алфавітів (грецького чи арабського алфавітів, ієрогліфів тощо) потрібно значно більше значень кодів. Для них розроблено таблицю кодів символів Юнікод (англ. Ппісойв - уніфіковане кодування).

Таблиця Юнікод складається з 17 наборів по 65 536 значень кодів у кожному та дає можливість закодувати 1 114 112 різних символів, тобто майже всі символи писемності всіх світових мов. Як і в інших таблицях кодів, у Юнікоді незмінними залишаються перші 128 значень кодів, що відповідають таблиці А8СІІ. Окремий розділ у таблиці Юнікод містить коди літер кирилиці. Наприклад, літері «а» українського алфавіту ставиться у відповідність код 53 424, літері «і» - код 53 654, літері «ґ» -код 53 905 та ін.

Наразі у новітніх операційних системах використовується таблиця кодів Юнікод.

Порівняння структур різних таблиць кодів символів наведено в таблиці 1.2.

Таблиця 1.2

Порівняння структури таблиць кодів символів

Таблиця кодів символів

Кількість кодів символів

Символи з кодами від 0 до 127

Символи з кодами від 128 до 255

Символи з кодами, більшими за 255

ASCII

128

Літери англійського алфавіту, цифри, розділові знаки, спеціальні символи

Немає

Немає

KOI8-U

256

Як у таблиці ASCII

Символи кирилиці та деякі інші символи

Немає

Windows-1251

256

Як у таблиці ASCII

Символи кирилиці та деякі інші символи

Немає

Юнікод

1 114 112

Як у таблиці ASCII

Символи алфавітів різних мов світу та деякі інші символи

У таблиці Юнікод містяться коди не лише літер та цифр, а й символів, які позначають торговельні марки, грошові одиниці, символи транскрипцій, ідеограми тощо. Наприклад, кодом символу української грошової одиниці гривні % є число 8 372, кодом ідеограми чоловік ^ є число 10080, а ідеограми жінка ^ - число 10 081 тощо.

Ідеограма (давньогрец. Ιδέα - ідея, γράμμα - писемний знак, буква) -писемний знак, що передає, на відміну від букви, не звук певної мови, а деяке поняття, ідею.

 

Для вставлення символів у документ можна застосовувати їх коди з таблиці Юнікод. Для цього потрібно натиснути та утримувати клавішу АП і набрати код символу на додатковій цифровій клавіатурі. Так можуть бути вставлені, наприклад, символи сніговик - код 9731, серце у вигляді квітки - код 10087, нота £ - код 9834, шахова фігура кінь ^-код 9822 та інші. Знайти символ та відповідний йому код можна на сайті Таблица символов Юникода (unicode-table.com).

Але якщо вибраний вами символ відсутній серед шрифтів на вашому комп'ютері, то він не буде відображатися в документі.

Особливості кодування тексту з використанням різних таблиць кодів символів можна побачити також під час перегляду веб-сторінок. Іноді під час відкриття веб-сторінки таблиця кодів символів обирається браузером неправильно. У такому випадку текст веб-сторінки непридатний для розуміння (мал. 1.4).

У кожного веб-браузера є інструменти для вибору таблиці кодів символів користувачами. Наприклад, у браузері Google Chrome для зміни таблиці кодів символів потрібно:

1.    Вибрати кнопку Налаштування та керування Google Chrome , = |.

2.    Виконати Інші інструменти ^ Кодування.

3. Вибрати таблицю кодів символів, при якій текст веб-сторінки буде придатним для розуміння.

Для україномовних веб-сторінок найчастіше застосовують таблицю кодів символів Юнікод (UTF-8), але для окремих веб-сторінок може бути використане кодування Кирилиця (Windows-1251) або Кирилиця (KOI8-U).

Таблиця символів в операційній системі Windows

Серед службових програм в операційній системі Windows є програма Таблиця символів, що призначена для перегляду, пошуку та вставлення в текстові документи різноманітних символів, у тому числі тих, які відсутні на клавіатурі. Для запуску потрібно виконати Пуск ^ Усі програми ^ Стандартні ^ Службові ^ Таблиця символів, після чого відкриється вікно програми (мал. 1.5).

Використовуючи цю програму, можна побачити різні групи символів, що призначені для вставлення в документи. Для цього потрібно:

1.    Встановити позначку прапорця Додаткові параметри перегляду у вікні програми.

2.    У полі Набір символів у нижній частині вікна вибрати Юнікод.

3.    У полі Групування вибрати Діапазони Юнікоду.

4.    У списку вікна Групування, що відкриється, вибрати діапазон кодів, символи з якого потрібно вставити в документ (мал. 1.6).

Якщо в таблиці вибрати деякий символ, то в рядку статусу вікна програми ліворуч буде відображено код цього символу в таблиці кодів символів Юнікод та його опис англійською мовою, а праворуч - сполучення клавіш, яке потрібно натиснути для вставлення цього символу в документ. Наприклад, на малюнку 1.6 вибрано символ © - знак авторського права, у рядку статусу вікна наведено його опис -U+00A9 Copyright Sign та сполучення клавіш Alt+0169 для вставлення цього символу в документ.

Вибрані в таблиці символи можна вставити в документи, що створюються в різних програмах - текстовому процесорі, редакторі презентацій, табличному процесорі та ін. Для вставлення символу в документ потрібно:

1.    Вибрати символ у таблиці із символами.

2.    Виконати Вибрати ^ Копіювати.

3.    Вибрати місце в документі.

4.    Вставити скопійований символ з Буферу обміну.

Після вибору кнопки Вибрати символ виводиться в поле Для копіювання. Якщо вибрати ще один символ та кнопку Вибрати, то в полі відобразяться обидва символи. Таким способом можна підготувати для копіювання кілька символів. Усі вони разом будуть скопійовані та вставлені в документ.

Для опрацювання текстових повідомлень з використанням комп’ютера символи повідомлення кодують числами. Для цього можуть використовуватися різні таблиці кодів символів, наприклад А8СІІ, КОІ8-и, Windows-1251, Юнікод.

Таблиця кодів символів А8СІІ містить коди 128 символів, КОІ8-и, Windows-1251 - 256 символів, Юнікод - 1 114 112 символів. У всіх таблицях кодів символів незмінними залишаються перші 128 кодів, що відповідають таблиці А8СІІ.

У кожного веб-браузера є інструменти для вибору таблиці кодів символів, з використанням якої будуть відображатися символи на веб-сторінці.

Службова програма Таблиця символів операційної системи Windows призначена для перегляду, пошуку та вставлення в документи символів з різних шрифтів, поданих з використанням різних таблиць кодів символів.

 

Дайте відповіді на запитання

1*. Як кодують символи текстових повідомлень під час опрацювання їх з використанням комп’ютера?

2°. Які таблиці кодів символів ви знаєте?

3*. Які символи можуть бути закодовані з використанням таблиць кодів символів ASCII, KOI-8U, Windows-1251, Юнікод?

4*. Що спільного та чим відрізняються таблиці кодів символів ASCII, KOl-8U, Windows-1251, Юнікод?

5°. У яких ситуаціях потрібно змінювати таблицю кодів символів під час перегляду веб-сторінок?

6*. Як вибрати таблицю кодів символів під час перегляду веб-сторінок у браузері Google Chrome?

7°. Яке призначення програми Таблиця символів?

8°. Як запустити на виконання програму Таблиця символів?

9*. Як уставити до документа символи з використанням програми Таблиця символів?

Виконайте завдання

1*. Повідомлення закодовано з використанням таблиці кодів символів ASCII. Декодуйте його (скористайтеся додатком 11): а) 83 117 110;    б) 104 111 109 101.

2*. Закодуйте повідомлення з використанням таблиці кодів символів Windows-1251 (скористайтеся додатком 21): а) Підручник «Інформатика»;    б) ваше прізвище та ім’я.

3*. Окремі слова в повідомленні закодовані з використанням таблиці кодів символів Юнікод. Знайдіть символи за їх кодами в таблиці та декодуйте повідомлення. Запишіть отриманий текст. Для пошуку символів можна використовувати сайт Таблица символов Юникода (unicode-table.com).

Сьогодні з ранку 9925. Синоптики обіцяють 9928. Збираючись у 127979, не забудьте взяти з собою 9730.

4*. Перегляньте веб-сторінку ІТ в Україні: історії та особистості (ua. uacomputing.com) з використанням таблиць кодів символів Кирилиця (Windows-1251) та Кирилиця (КОІ8-П). Установіть, за вибору якої таблиці кодів символів текст веб-сторінки придатний для розуміння.

5*. Уставте до текстового документа всі символи, що є позначеннями грошових одиниць, використовуючи програму Таблиця символів. Збережіть створений документ у вашій папці у файлі з іменем завдання 1.2.5 та розширенням імені, що відповідає версії текстового процесора.

Додатки можна переглянути на сайті Інформатика для всіх (allinf.at.ua) у розділі Матеріали до підручників. 8 клас. Підручник.

Уставте до текстового документа буквоподібні символи, використовуючи програму Таблиця символів. Збережіть створений документ у вашій папці у файлі з іменем завдання 1.2.6 та розширенням імені, що відповідає версії текстового процесора.

7

 

Визначте, які символи будуть уставлені до текстового документа шляхом введення їх коду за натиснутої клавіші ЛИ, для кодів 1234, 3754, 8986, 9708, 9415, 10001, 10239.

 

Це матеріал з підручника Інформатика 8 клас Ривкінд

 

Категорія: Інформатика

Автор: admin от 16-10-2016, 15:45, Переглядів: 8729