Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Кодирование текстовой информации





Кодирование текста – это соответствие между символами и их номерами в специальной таблице. Каждый символ кодируется определенным числом, которое называется кодом символа. Значения кодов символов хранятся в специальных таблицах, называемых кодовыми таблицами. В настоящее время существует несколько широко распространенных схем кодирования: КОИ-7 – семибитная кодировка; ANSI, ASCII, КОИ-8R и CP1251 – 8-битные кодировки; Unicode, UTF-16 – 16-битные кодировки.

ANSI (AmericanNationalStandardsInstitute – Американский национальный институт стандартов) – кодировка символов 8-разрядными двоичными числами в Windows. Обеспечивается представление 256 символов.

Кодировка CodePage1251, CP1251Windows-1251 или WindowsCyrilic разработана компанией Microsoft для поддержки русского языка в системе Windows (на один символ отводится 8 бит).

Пример. Вычислите количество информации во фразе «Я знаю информатику на отлично.», при кодировке 8-разрядными числами.

Решение: Х = 8 бит, т.к. кодировка 8-разрядными числами. Количество символов в фразе К = 30, тогда Хк = 8 × 30 = 240 бит (по формуле (4)).

Ответ: 240 бит.

Пример. Книга содержит 100 страниц, на каждой странице – 35 строк, в каждой строке – 50 символов. Найти объем информации, содержащейся в книге (принять однобайтный код символов).

Решение: книга содержит 35 × 50 ×100 = 175000 байт информации.

Ответ: 175000 байт.

Unicode – кодировка символов 16-разрядными двоичными числами, в результате использования которой удается представить 65536 различных знаков, что достаточно для одновременного представления всех букв основных языков и всевозможных буквенных символов. В более компактных ANSI и ASCII-кодировках могут одновременно представляться буквы только двух алфавитов – например, латинского и русского. Кодировку Unicode имеют шрифты, имена папок и файлов.







Date: 2015-12-11; view: 596; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.005 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию