Понятие кодирования Кодирование чисел

КОДИРОВАНИЕ информации
Понятие кодирования
Как отмечалось, практически во всех информационных процессах значительные преимущества дает дискретная
форма представления информации. Поэтому в тех случаях, когда первичный сигнал имеет аналоговую форму,
производится его преобразование к дискретному виду. В дальнейшем дискретный сигнал подвергается кодированию.
Кодирование — это отображение дискретного сообщения в виде определенных
сочетаний символов. Совокупность правил, по которым выполняется кодирование,
называется кодом (от французского слова соdе — кодекс, свод законов). Другими
словами, код — это правило отображения информации.
Благодаря кодированию компьютер может обрабатывать различного рода информацию: числовую, текстовую,
графическую, звуковую, видео. Все эти виды информации после кодировки приводятся к одному виду –
последовательности электрических импульсов, в которой наличие импульса обозначается единицей, а его отсутствие –
нулем.
Кодирование чисел
Поскольку компьютер оперирует
с двоичными числами, любая
вводимая в него информация
должна быть представлена в виде
двоичного кода. Например, когда
пользователь вводит с клавиатуры
десятичные числа, они сразу
преобразуются в двоичные числа
(это процесс кодирования). Над
этими
числами
компьютер
выполняет
необходимые
арифметические
операции.
Полученный результат компьютер
может вывести на экран монитора
или на принтер. Чтобы пользователь
смог
понять
выводимую
информацию, числа должны быть
снова представлены в десятичной
системе (процесс декодирования).
Пусть требуется перевести в
двоичную систему число 47.
Выполним
последовательные
деления на 2, а остатки запишем в
круглых скобках:
Существуют различные методы
преобразования чисел из одной
системы в другую. Мы рассмотрим
самый простой из них, который
называется делением на основание.
Выполним теперь по описанной
схеме обратный перевод числа
101111 в десятичную систему
счисления, помня, что основание
«новой» системы равно 10 = (1010)2:
Теперь выпишем полученные
остатки в последовательности снизу
вверх (ведь каждое деление
означает переход к более старшему
разряду). В результате получим
двоичное число 101111. Можете
проверить, что оно действительно
равно 47.
Выражая остатки в десятичных
числах: 100 = 4 и 111 = 7, получим
десятичное представление числа:
47.
Отметим, что максимальное
число, которое может обрабатывать
компьютер,
определяется
разрядностью процессора
(см.
следующую главу). Процессоры
первых персональных компьютеров
(ПК), появившихся в начало 80-х
годов, являлись 8-разрядными.
Поэтому
максимальное
обрабатываемое число не — 255.
Впоследствии
разрядность
процессоров выросла: появились 16, 32- и, наконец 64-разрядные
процессоры.
Соответственно,
возросли и возможности ПК по
обработке числовой информации.
1|С т ран ица
КОДИРОВАНИЕ информации
Кодирование текстовой информации
Для
кодирования
текста,
вводимого
в
компьютер,
используется самый простой способ
кодировки:
каждому
знаку
(символу) ставится в соответствие
двоичное
число.
Правила
соответствия
или
правила
кодировки записываются в таблицу,
которая называется кодовой.
Кодовая таблица — это таблица,
которая устанавливает соответствие
между символами алфавита и
двоичными числами. Эти числа
называются кодами символов и
отвечают
внутреннему
Сколько
символов
можно
закодировать
в
семиразрядной
кодовой таблице? Поскольку с
помощью одного разряда (О или 1)
можно присвоить номера только двум
символам, семиразрядные числа дают
представлению
компьютере.
символов
в
Кодовую таблицу называют
также кодовой страницей. Как
«работает» кодовая таблица? Когда
вы нажимаете какую-либо клавишу,
электронная схема клавиатуры
формирует
определенный
двоичный код. Так, при нажатии на
клавишу «1» формируется двоичный
код 00110001, а при нажатии на
клавишу «2» — код 00110010. В
зависимости от нажатой клавиши
получается тот или иной двоичный
код, задаваемый кодовой таблицей.
возможность
перенумеровать
27 = 128 символов. Этого достаточно
для кодирования в таблице ASCII букв
одного алфавита (английского), и
остаются еще свободные коды для
За основу кодировки символов в
персональных компьютерах взята
кодовая таблица ASCII (по-русски
аббревиатура звучит как «а-с-ц-и»,
или просто «аски»). ASCII — это
сокращение от American Standard
Code for lnformation Intcrchange
(американский стандарт кодов для
обмена информацией). В этой
таблице (см. ниже) каждый символ
кодируется двоичным
числом,
состоящим из 7 разрядов.
управляющих
и
различных
специальных символов: %, #, & и др.
Если в компьютере нужно
поддерживать
два
алфавита,
например, английский и русский, то
2|С т ран ица
КОДИРОВАНИЕ информации
семи разрядов кода (128 символов)
уже недостаточно. Поэтому для
кодирования символов используется
код длиной 8 бит или 1 байт. Старшие
разряды в кодовой таблице пробегают
ряд значений от 0 до 15 (а не от 0 до 7,
как в случае ASCII). Однобайтным
кодом можно закодировать 28 = 256
символов. Каждому символу ставится
в соответствие своя уникальная
последовательность из восьми нулей
и единиц, которая может принимать
значения от обычно для каждого
алфавита
разрабатывается
своя
кодовая страница.
Первые 128 кодов (первая
половина таблицы) предназначаются
для таблицы ASCII — эта часть кодов
является стандартной и обязательной
для
всех
кодовых
страниц.
Последующие коды, начиная с кода
128 до 255 (вторая половина таблицы),
отдаются под национальный стандарт,
то есть под алфавит того или иного
языка.
В 90-х годах был разработан
стандарт Unicode, согласно которому
для представления каждого символа
используются
два
байта.
Это
позволяет
закодировать
очень
большое число символов из разных
алфавитов (теоретически 216 = 65536
символов). В документах Unicode
могут
соседствовать,
например,
математические символы, кириллица,
латинские, греческие буквы и даже
китайские
иероглифы.
При
использовании стандарта Unicode
отпадает необходимость в кодовых
страницах.
До сих пор шла речь о
преобразовании
символов
(или
текста) в двоичные коды, которое
выполняется в устройстве ввода. При
выводе информации из компьютера
выполняется
обратное
преобразование:
двоичный
код
каждого символа переводится в
обычное
(графическое)
представление
так,
чтобы
эта
информация могла быть прочитана
человеком.
Формирование изображения в компьютере
Изображение на экране монитора очень напоминает лист бумаги в клеточку (рис. 4.1). Каждая такая клеточка
закрашена своим цветом и называется пикселом.
Пиксел — это минимальный элемент изображения,
формируемого на экране монитора.
Чем
плотнее
расположены
пикселы, тем лучше выглядит
изображение на экране монитора.
Обратите
внимание,
что
на
приведенном рисунке границы
объектов выглядят ступеньками. Это
связано с тем, что плотность
пикселов не высока. Чем выше
плотность пикселов, тем более
четкими будут границы объектов
получаться изображения.
Плотность пикселов измеряется
как количество пикселов на единицу
длины. Наиболее распространены
единицы, называемые кратко как dpi
(dots рег inch — количество точек на
дюйм, 1 дюйм = 2,54 см). Единица
dpi
общепринята
в
области
компьютерной
графики
и
издательского
дела.
Обычно
плотность пикселов для экранного
изображения составляет 72 dpi или
96 dpi.
Простейшим видом изображения является черно-белое изображение, состоящее из белых и черных пикселов. Его
также называют битовым, поскольку оно кодируется с помощью двух цифр: 0 (белый цвет) и 1 (черный цвет). То есть в
черно-белом изображении одному пикселу отвечает один бит информации.
Чтобы пикселы отображали цвета, с каждым пикселом связывается более одного бита информации о цвете.
Например, если каждому пикселу приписать 4 бита цветовой информации, можно будет отобразить 2 4 = 16 цветов.
3|С т ран ица
КОДИРОВАНИЕ информации
Смешивание цветов
Удобнее
всего
цвета
представлять
как
результат
смешивания основных (базовых)
цветов. В качестве таких цветов
используются
красный
(red),
зеленый (grееn) и синий (blue) цвета.
Еще одна компонента, которая
участвует в создании цветного
изображения, — это яркость
(intensity — интенсивность).
Смешивание цветов на экране
монитора аналогично смешиванию
акварельных красок на бумаге, но с
одним отличием. Цвет акварельных
красок получается в результате
отражения падающего на них света,
в то время как цвет на экране
формируется в результате излучения
света.
Поэтому,
когда
вы
смешиваете на бумаге три основные
краски (красную, зеленую и синюю),
то получаете черный цвет. А при
смешивании этих же цветов
максимальной яркости на экране
получается белый цвет.
При смешивании максимально
ярких красного и зеленого цветов
получается желтый цвет. Если же
яркость красного и зеленого цветов
невелика, получится коричневый
цвет.
Смешивание
четырех
основных компонент цвета можно
описать с помощью таблицы.
Таблица. Кодирование цветов в 4-битной палитре
Цвет
Черный
Серый
Синий
Светло-синий
Зеленый
Светло-зеленый
Голубой
Светло-голубой
Красный
Розовый
Коричневый
Желтый
Пурпурный
Светло-серый
Белый
Рассмотрим
возможности
цветовых палитр большего размера.
С помощью 8 битов можно
отобразить всего 256 цветов (28 256).
Этого количества цветов маловато,
чтобы
получить
качественную
картинку на экране. Однако вполне
Яркость
0
1
0
1
0
1
0
1
0
1
0
1
0
0
1
Красный
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
достаточно,
чтобы
отобразить
различные оттенки серого цвета
(всего 256 оттенков). Пример
картинки, полученной в серых
цветах, показан на рисунке.
Для отображения большего
количества цветов каждый пиксел
должен содержать больше битов
информации. Число доступных
цветов N выражается в виде
следующей формулы: где d —
показатель
степени,
равный
количеству битов в пикселе. При d=4
могут быть отображены 16 цветов.
Показатель d называется также
глубиной цвета. Чем больше глубина
Зеленый
0
0
0
0
1
1
1
1
0
0
1
1
0
1
1
Синий
0
0
1
1
0
0
1
1
0
0
0
0
1
1
1
цвета, тем больше оттенков цветов
можно отобразить на экране. Если
глубина цвета составляет 16, то
можно отобразить 65536 цветов.
Для
высококачественного
воспроизведения цвета требуются
уже как минимум 24 бита в каждом
пикселе.
В этом случае поддерживается
до 16 миллионов цветов. Такая
глубина
цвета
применяется,
например,
при
обработке
высококачественных фотографий, а
также изображений для журналов и
иллюстрированных книг.
4|С т ран ица
КОДИРОВАНИЕ информации
Кодирование звука
Напомним,
что
звуки,
создаваемые любым объектом
(человеком, автомобилем, собакой
и проч.), представляют собой
колебания воздуха. Область сжатого
воздуха следует за областью
разреженного воздуха, и эти области
распространяются в пространстве.
Звуковые
колонки,
подключенные к компьютеру, также
воспроизводят колебания воздуха.
Эти
колебания
получаются
благодаря тому, что к колонкам
подводится электрический сигнал,
заставляющий колонки звучать.
Сигнал, подводимый к колонке, по
форме
напоминает
сигнал,
созданный
первоначально
источником
звука:
диктором,
певцом,
музыкальным
инструментом. Однако сигнал в
колонке — это не точная копия
сигнала от микрофона, поскольку
сигнал на своем пути претерпевает
несколько преобразований.
Непрерывный
электрический
сигнал
от
источника
звука
(например, микрофона) должен
быть преобразован в дискретный
сигнал. Такое преобразование мы
уже рассматривали ранее. Величина
импульсов дискретного сигнала
выбирается равной
амплитуде
аналогового сигнала от источника
звука. Чтобы преобразование в
дискретный сигнал получилось
достаточно
точным,
импульсы
должны часто следовать друг за
другом.
Амплитуды импульсов затем
приближенно представляются в
виде двоичных чисел. Весь диапазон
изменения амплитуды разбивается
па множество дискретных значений
(обычно это 2n = 65 536 значений). И
амплитуде импульса присваивается
ближайшее дискретное значение. В
результате
всех
этих
преобразований для звукового
сигнала
получается
последовательность
двоичных
чисел.
Обратное
преобразование
дискретного сигнала в аналоговый
сигнал выполняется в специальных
устройствах,
подключаемых
к
компьютеру, — звуковых платах. При
наличии звуковой платы вы можете
прослушивать
па
компьютере
цифровые музыкальные диски.
Современные
звуковые
платы
работают
со
звуком,
представляемым в виде 16-битных
двоичных
чисел
(отсюда
и
количество значений амплитуд
звукового
сигнала,
равное
2n = 65 536).
Контрольные вопросы
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Что такое код и в чем состоит кодирование информации?
В какой системе счисления производится обработка чисел в компьютере?
Что такое кодировка ASCII?
Найдите методом деления на основание двоичные коды чисел 40, 123, 51З.
Переведите в десятичный код числа (10010010) 2, и (100101011)2.
Как формируется картинка на экране монитора?
Что такое пиксел?
Чем определяется четкость границ объектов, отображаемых на экране?
Что такое базовые цвета и глубина цвета?
Как кодируются различные цвета?
Как выполняется кодирование звука?
Упражнения
1.
2.
3.
Найдите количество пикселов в строке изображения, если длина строки равна 29 см, а разрешение экрана
— 72 dpi.
Каков будет размер изображения на экране монитора (в сантиметрах), если известно, что разрешение
составляет 72 dpi, ширина изображения – 800 пикселов, а высота — 600 пикселов?
Вычислите количество цветов, которые поддерживает система при глубине цвета d = 24 и d = 32.
5|С т ран ица