Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Кодирование текстовой информации





 

Нажатие клавиш на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Informational Interchange - американский стандартный код информационного обмена).

Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 28 = 256. Следовательно, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти коды и составляют таблицу ASCII (табл. 4.4).

Например, при нажатии клавиши с буквой «H» в память компьютера записывается код 01001000, а для слова

HELLO - 01001000 01000101 01001100 01001100 01001111.

При выводе буквы «H» на экран компьютер выполняет декодирование - на основании этого двоичного кода строится изображение символа.

Примечание. Цифры кодируются по стандарту ASCII в двух случаях - при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование двоичный код по правилам перевода чисел из одной системы счисления в другую.

Для сравнения рассмотрим число 27 для двух вариантов кодирования.

При использовании в тексте это число потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе – 00110010 00110111.

При использовании в вычислениях код этого числа будет получен по специальным правилам перевода и представлен в виде 8-разрядного двоичного числа 00011011, на что потребуется 1 байт.

В системе ASCII закреплены две таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127: цифры, буквы латинского алфавита, знаки препинания, управляющие символы (см. табл. 4.4). Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. Расширенная таблица (символы с номерами от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Таблица 4.4

Базовая таблица кодировки ASCII

32 пробел       @   Р   *   p
33!       А   Q   а   q
34 "       В   R   b   r
35 #       С   S   с   s
36 $       D   Т   d   t
37 %       Е   U   е   u
38 &       F   V   f   v
39 '       G   W   g   w
40 (       Н   X   h   x
41)       I   Y   i   y
42 *   :   J   Z   J   z
43 +   ;   К   [   k   {
44,   <   L   \   I   |
45 -   =   М   ]   m   }
46.   >   N   ^   n   ~
47 /   ?   О   _   o    

 

Отсутствие единого стандарта расширенной таблицы ASCII кодов привело к множественности одновременно действующих кодировок. Только в России можно указать несколько действующих стандартов кодировки. Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» - компанией Microsoft, но, учитывая широкое распространение программных продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows. Де-факто она стала стандартной в российском секторе World Wide Web.


Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный). Сегодня кодировка КОИ-8 (табл. 4.5) имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета. В частности, в России она де-факто является стандартной в сообщениях электронной почты и телеконференций.

Таблица 4.5

Кодировка КОИ-8

  144 ░ 160 - 176 ╟ 192 ю   п   Ю   П
129 | 145 ▒ 161 Ё 177 ╠ 193 a   я   А   Я
130 ┌ 146 ▓ 162 ╒ 178 ╡ 194 б   р   Б   Р
131 ┐ 147 ó 163 ё 179 Ё 195 ц   с   Ц   С
132 148 ■ 164 ╓ 180 ╢ 196 д   т   Д   Т
133 ┘ 149 • 165 ╔ 181 ╣ 197 e   у   Е   У
134 ├ 150 √ 166 ╕ 182 ╤ 198 ф   ж   Ф   Ж
135 ┤ 151 ≈ 167 ╖ 183 ╥ 199 г   в   Г   В
136 ┬ 152 ≤ 168 ╗ 184 ╦ 200 x   ь   X   Ь
137 ┴ 153 ≥ 169 ╘ 185 ╧ 201 и   ы   И   Ы
138 ┼   170 ╙ 186 ╨ 202 й   з   Й    
139 ▀ 155 ⌡ 171 ╚ 187 ╩ 203 к   ш   К   Ш
140 ▄ 156 ° 172 ╛ 188 ╪ 204 л   э   Л   Э
141 █ 157 ² 173 ╜ 189 ╫ 205 м   щ   М   Щ
142 ▌ 158 · 174 ╝ 190 ╬ 206 н   ч   Н   Ч
143 ▐ 159 ¸ 175 ╞ 191 ё 207 о   ъ   О   Ъ

 







Date: 2015-07-17; view: 511; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.01 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию