Народна Освіта » Інформатика » Кодирование символов

НАРОДНА ОСВІТА

Кодирование символов

1.    Что такое кодирование сообщений? С какой целью кодируют сообщения?

2.    Приведите примеры кодирования сообщений.

3.    Что такое декодирование сообщений?

КОДИРОВАНИЕ СИМВОЛОВ ТЕКСТА

Для обработки текстовых сообщений с использованием компьютера символы сообщения кодируют числами.

Телетайп (лат. tele - удаленный, англ. type - печать) - электромеханическая печатная машина, которую используют для передачи текстовых сообщений по проводам.

 

Для кодирования текста используют таблицы кодов символов. В них каждому символу, который может быть использован в текстовом сообщении, соответствует некоторое число. В 1963 г. в США был разработан набор таких кодов символов для передачи сообщений по телетайпу. Позже он стал стандартом для использования в компьютерной технике и получил название таблицы кодов символов ASCII (англ. American Standard Code for Information Interchange - американский стандартный код для обмена информацией).

В таблице ASCII буквам английского алфавита, цифрам, знакам препинания, символам редактирования и форматирования текста соответствуют числа от 0 до 127 (табл. 1.1).

Текстовые символы, которые кодируются в таблице ASCII числами от 32 до 127, приведены в приложении 1. Его можно найти на сайте Інформатика для всіх (allinf.at.ua) в разделе Матеріали до підручників. 8 клас. Підручник.

Группы кодов символов таблицы ASCII

Таблица 1.1

Диапазон

кодов

Группа.

символов

Пример

кода

Соответствующий символ

От 0 до 31, 127

Специальные символы

10

Символ, соответствующий переносу курсора на новую строку

13

Символ, соответствующий возврату курсора в начало строки

27

Символ, соответствующий нажатию клавиши Ебс

От 32 до 64, от 91 до 96, от 123 до 126

Знаки препинания и цифры

32

пробел

48

цифра 0

123

{

От 65 до 90

Большие буквы английского алфавита

65

А

66

В

90

Z

От 97 до 122

Малые буквы английского алфавита

97

а

98

ь

122

г

Кириллица - алфавит для группы славянских языков, к которой относятся украинский, русский, белорусский, болгарский и другие языки.

Английский и некоторые другие западноевропейские языки используют алфавит, который называют латиницей.

Таблица кодов символов А8СП содержит коды букв только английского алфавита. Для кодирования букв других алфавитов были разработаны другие таблицы кодов символов. Например, таблицы КОИ-8 (КОИ - код обмена информацией) и Windows-1251 содержат без изменений все коды таблицы А8СИ, а также - коды букв кириллицы. Этим буквам соответствуют натуральные числа от 128 до 255.

Таблица кодов символов Windows-1251 является стандартом для кодирования букв кириллицы в операционной системе Windows. В ней, например, букве «а» русского алфавита ставится в соответствие число 224, букве «б» -число 225, букве «я» - число 255 и др. Текстовые символы, которые кодируются в таблице Windows-1251 числами от 128 до 255, приведены в приложении 2. Его можно найти на сайте Інформатика для всіх (allinf.at.ua) в разделе Матеріали до підручників. 8 клас. Підручник.

Целых чисел от 0 до 255 достаточно, чтобы закодировать символы двух алфавитов - латиницы и кириллицы, а также некоторые другие символы. Но для кодирования символов других алфавитов (греческого или арабского, иероглифов и т. п.) требуется значительно больше значений кодов. Для них разработана таблица кодов символов Юникод (англ. ипіеойв - унифицированное кодирование).

Таблица Юникод состоит из 17 наборов по 65 536 значений кодов в каждом и дает возможность закодировать 1 114 112 разных символов, то есть почти все символы письменности всех мировых языков. Как и в других таблицах кодов, в Юникоде неизменными остаются первые 128 значений кодов, соответствующих таблице Л8СП. Отдельный раздел в таблице Юникод содержит коды букв кириллицы. Например, букве «а» русского алфавита соответствует код 53 424, букве «б» - код 53 425, букве «я» - код 53 455 и др.

Сейчас в новейших операционных системах используется таблица кодов Юникод.

Сравнение структур различных таблиц кодов символов приведено в таблице 1.2.

Сравнение структуры таблиц кодов символов

Таблица 1.2

Таблица

кодов

символов

Количество кодов символов

Символы с кодами от 0 до 127

Символы с кодами от 128 до 255

Символы с кодами, большими, чем 255

ASCII

128

Буквы английского алфавита, цифры, знаки препинания, специальные символы

Нет

Нет

КОИ-8

256

Как в таблице ЛБСП

Символы кириллицы и некоторые другие символы

Нет

Windows-1251

256

Как в таблице ЛБСП

Символы кириллицы и некоторые другие символы

Нет

Юникод

1 114 112

Как в таблице ЛБСП

Символы алфавитов разных языков мира и некоторые другие символы

Для тех, кто хочет знать больше

В таблице Юникод содержатся коды не только букв и цифр, но и символов, которые обозначают торговые марки, денежные единицы, символы транскрипций, идеограммы и т. п. Например, кодом символа украинской денежной единицы гривни % является число 8 372, кодом идеограммы мужчина ^ является число 10 080, а кодом идеограммы женщина ^ - число 10 081 и т. п.

Для вставки символов в документ можно применять их коды из таблицы Юникод. Для этого следует нажать и удерживать клавишу АН и набрать код символа

код 9 822 и др. Найти символ и соответствующий ему код можно на сайте Таблица символов Юникода (unicode-table.com). Но если выбранный вами символ отсутствует среди шрифтов на вашем компьютере, то он не будет отображаться в документе.

Идеограмма (древнегреч. ίδέα -идея, γράμμα - письменный знак, буква) - письменный знак, передающий, в отличие от буквы, не звук какой-либо речи, а некоторое понятие, идею.

 

КОДИРОВАНИЕ СИМВОЛОВ ВЕБ-СТРАНИЦ

Особенности кодирования текста с использованием различных таблиц кодов символов можно увидеть также при просмотре веб-страниц. Иногда при открытии веб-страницы таблица кодов символов выбирается браузером неправильно. В таком случае текст веб-страницы непригоден для понимания (рис. 1.4).

 

У каждого веб-браузера есть инструменты для выбора таблицы кодов символов пользователями. Например, в браузере Google Chrome для изменения таблицы кодов символов следует:

1.    Выбрать кнопку Настройка и управление Google Chrome , = |.

2.    Выполнить Дополнительные инструменты ^ Кодировка.

3.    Выбрать таблицу кодов символов, при которой текст веб-страницы будет пригодным для понимания.

Для русскоязычных веб-страниц чаще всего применяют таблицу кодов символов Юникод (UTF-8), но для отдельных веб-страниц может быть использована кодировка Кириллица (Windows-1251) или Кириллица (КОИ-8).

Для тех, кто хочет знать больше

Таблица символов в операционной системе Windows

Среди служебных программ в операционной системе Windows есть программа Таблица символов, предназначенная для просмотра, поиска и вставки в текстовые документы разнообразных символов, в том числе отсутствующих на клавиатуре. Для запуска этой программы необходимо выполнить Пуск ^ Все программы ^ Стандартные ^ Служебные ^ Таблица символов, после чего откроется окно программы (рис. 1.5).

Используя эту программу, можно увидеть различные группы символов, предназначенные для вставки в документы. Для этого необходимо:

1.    Установить отметку флажка Дополнительные параметры в окне программы.

2.    В списке Набор символов в нижней части окна выбрать Юникод.

3.    В списке Группировка выбрать Диапазоны Юникода.

4.    В списке открывшегося окна Группировка выбрать диапазон кодов, символы которого необходимо вставить в документ (рис. 1.6).

Если в таблице выбрать некий символ, то в строке статуса окна программы слева отображается код этого символа в таблице кодов символов Юникод и его описание на английском языке, а справа - клавиши, которые следует нажать для вставки этого символа в документ. Например, на рисунке 1.6 выбран символ © -знак авторского права, в строке статуса окна приведено его описание -U+00A9 Copyright Sign и клавиши Alt+0169 для вставки этого символа в документ.

Выбранные в таблице символы можно вставить в документы, создаваемые в различных программах - текстовом процессоре, редакторе презентаций, табличном процессоре и др. Для вставки символа в документ необходимо:

1.    Выбрать символ в таблице с символами.

2.    Выполнить Выбрать ^ Копировать.

3.    Выбрать место в документе.

4.    Вставить скопированный символ из Буфера обмена.

После выбора кнопки Выбрать символ выводится в поле Для копирования. Если выбрать еще один символ и кнопку Выбрать, то в поле отобразятся оба символа. Таким образом можно подготовить для копирования несколько символов. Все вместе они будут скопированы и вставлены в документ.

Для обработки текстовых сообщений с использованием компьютера символы сообщения кодируют числами. Для этого могут использоваться разные таблицы кодов символов, например, АвСП, КОИ-8, \¥т(1о\У8-1251, Юникод.

Таблица кодов символов Л8СП содержит коды 128 символов, КОИ-8, Windows-1251 - 256 символов, Юникод - 1 114 112 символов. Во всех таблицах кодов символов неизменными остаются первые 128 кодов, соответствующих таблице Л8СИ.

У каждого браузера есть инструменты для выбора таблицы кодов символов, с использованием которой будут отображаться символы на вебстранице.

I Служебная программа Таблица символов операционной системы Windows предназначена для просмотра, поиска и вставки в документы символов из разных шрифтов, представленных с использованием различных таблиц кодов символов.

1*. Как кодируют символы текстовых сообщений при их обработке с использованием компьютера?

2°. Какие таблицы кодов символов вы знаете?

3*. Какие символы могут быть закодированы с использованием таблиц кодов символов ASCII, КОИ-8, Windows-1251, Юникод?

4*. Что общего содержат и чем различаются таблицы кодов символов ASCII, КОИ-8, Windows-1251, Юникод?

5°. В каких ситуациях следует менять таблицу кодов символов при просмотре веб-страниц?

6*. Как выбрать таблицу кодов символов при просмотре веб-страниц в браузере Google Chrome?

7°. Каково назначение программы Таблица символов?

8°. Как запустить на выполнение программу Таблица символов?

9*. Как вставить в документ символы с использованием программы Таблица символов?

1*. Сообщение закодировано с использованием таблицы кодов символов ASCII. Декодируйте его (воспользуйтесь приложением 11): а) 83 117 110;    б) 104 111 109 101.

2*. Закодируйте сообщение с использованием таблицы кодов символов Windows-1251 (воспользуйтесь приложением 21): а) Учебник «Информатика»;    б) ваши фамилия и имя.

3*. Отдельные слова в сообщении закодированы с использованием таблицы кодов символов Юникод. Найдите символы по их кодам в

таблице и декодируйте сообщение. Запишите полученный текст. Для поиска символов можно использовать сайт Таблица символов Юникода (unicode-table.com).

Сегодня с утра 9925. Синоптики обещают 9928. Собираясь в 127979, не забудьте взять с собой 9730.

4*. Просмотрите веб-страницу ИТ в Украине: истории и личности (ru.uacomputing.com) с использованием таблиц кодов символов Кириллица (Windows-1251) и Кириллица (КОИ-8). Установите, при выборе какой таблицы кодов символов текст веб-страницы пригоден для понимания.

5*. Вставьте в текстовый документ все символы, обозначающие денежные единицы, используя программу Таблица символов. Сохраните созданный документ в вашей папке в файле с именем задание 1.2.5 и расширением имени, соответствующим версии текстового процессора.

6*. Вставьте в текстовый документ буквоподобные символы, используя программу Таблица символов. Сохраните созданный документ в вашей папке в файле с именем задание 1.2.6 и расширением имени, соответствующим версии текстового процессора.

7*. Определите, какие символы будут вставлены в текстовый документ путем ввода их кода при нажатой клавише ЛИ, для кодов 1234, 3754, 8986, 9708, 9415, 10001, 10239.

 

Это материал учебника Информатика 8 класс Ривкинд

 

Категорія: Інформатика

Автор: admin от 16-10-2016, 02:14, Переглядів: 3024