Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Теорія інформації
Навчальний посібник
Дизайн обкладинки Р.С. Волкова Редактори: Н.З.Козак, Т.Г. Чернишова Комп’ютерне верстання Н.О. Тулякової
Підп. до друку 23.06.2008. Формат 60х84/16. Папір офс. Гарнітура Times New Roman Cyr. Друк офс. Ум. друк. арк. 12,32. Обл.-вид арк. 11,26. Тираж 150 пр. Вид. № 282 Зам. №
Видавництво СумДУ при Сумському державному університеті 40007, Суми, вул. Римського-Корсакова,2 Свідоцтво про внесення суб'єкта видавничої справи до Державного реєстру ДК № 3062 від 17.12.2007. Надруковано у друкарні СумДУ 40007, Суми, вул. Римського-Корсакова, 2. ПЕРЕДМОВА У даному посібнику подано теоретичний матеріал, приклади розв'язання практичних завдань з навчальної дисципліни „ Теорія інформації ” для студентів спеціальності „ Інформатика ” напряму „ Прикладна математика ”.До кожного з розділів навчального курсу підібрані задачі, наводяться зразки їх розв'язання і відповіді до задач. Наприкінці кожного розділу подаються контрольні запитання для самоперевірки отриманих знань і вмінь. Навчальний посібник складається з трьох частин. У першій частині розглянуто фундаментальні положення теорії інформації за Шенноном: способи вимірювання та передачі інформації, поняття кількості інформації та ентропії випадкових подій, основні властивості кількості інформації і ентропії, характеристики дискретного каналу зв ' язку. У другій частині подано основи економного кодування інформації, розглядаються статистичні та словникові алгоритми стиснення даних; класифікація і загальна характеристика систем стиснення інформації. Третя частина присвячена основним принципам та методам завадостійкого кодування інформації, наводяться загальні властивості завадостійких (коригувальних) кодів, принципи побудови і способи задання лінійних блокових кодів, що виправляють помилки, та основні типи цих кодів. Опанування базових знань та набуття практичних навичок при вивченні курсу „ Теорія інформації ” створять засади для подальшого засвоєння спеціалізованих дисциплін у сфері інформатики, комп'ютерних систем, автоматики та керування, телекомунікацій і т. ін. і буде суттєвим підґрунтям для подальшого вдосконалення професійної майстерності спеціалістів у цих галузях.
Розділ 1 ОСНОВНІ ПОЛОЖЕННЯ ТЕОРІЇ ІНФОРМАЦІЇ
1.1 Предмет курсу. Види інформації. Теорема дискретизації
Теорія інформації - це розділ кібернетики, в якому за допомогою математичних методів вивчаються способи вимірювання інформації та методи її кодування з метою стиснення інформації і надійної передачі каналами зв'язку. При формальному поданні знань кожному досліджуваному об'єкту ставиться у відповідність числовий код, зв'язки між об'єктами так само подаються кодами. Для переведення неформальних даних у формальний цифровий вигляд використовуються спеціальні таблиці кодування. Найпростіший приклад такої таблиці - ASCII (American Standard Code for Information Interchange), що зіставляє друкованим та керуючим символам числа від 0 до 127. Інформація може бути двох видів: дискретна(цифрова) і неперервна(аналогова). Неперервна інформація – це дані, що одержані при неперервному за часом процесі змінювання деякої випадкової величини і описуються неперервними (аналоговими) функціями. Дискретна інформація – це цифрові дані, одержані у результаті квантування (дискретизації) неперервної величини за часом, рівнем або тим і іншим одночасно (рис.1.1). Дискретну інформацію зберігати і обробляти набагато простіше, оскільки вона являє собою послідовність чисел. У двійковій системі числення дискретна інформація являє собою послідовність 0 та 1.
За найменшу одиницю ємності цифрової інформації беруть біт (bit, binary digit) – одну позицію для двійкової цифри. Складені одиниці: 1 Кб = 210 = 1024 б; 1 Мб = 220 ≈ 106 б; 1 Гб = 230 ≈ 109 б; 1 Тб = 240 ≈ 1012 б; 1 Пб = 250 ≈ 1015 б. Для переведення неперервної інформації в дискретну і навпаки використовуються спеціальні пристрої модуляції/демодуляції - модеми. Швидкість передачі інформації вимірюється в кількості переданих за одну секунду бітів – бодах (baud): 1 бод = 1 біт/с (bps). Пристрій, що реалізовує процес дискретизації неперервного сигналу, називається аналогово-цифровим перетворювачем (АЦП). Частота, з якою АЦП проводить виміри аналогового сигналу і видає його цифрові значення, називається частотою дискретизації. Пристрій, що інтерполює дискретний сигнал у неперервний називається цифро-аналоговим перетворювачем. Чим вища частота дискретизації, тим точніше переведення неперервної інформації в дискретний сигнал. Проте із зростанням частоти зростає і розмір дискретних даних і, отже, складність їхнього оброблення, передачі і зберігання. При всіх якісних відмінностях між неперервною і дискретною величинами існує чіткий зв'язок, встановлюваний теоремоюдискретизації Шеннона-Котельникова. Як відомо з відповідного розділу математичного аналізу, будь-яка неперервна функція S(t) може бути розкладеною на скінченному проміжку в ряд Фур’є. Суть цього розкладання полягає в тому, що функція подається у вигляді суми ряду синусоїд з різними амплітудами і фазами, і з кратними частотами. Коефіцієнти (амплітуди) при синусоїдах називаються спектром функції. У гладких функцій спектр швидко спадає (із зростанням номера коефіцієнти швидко прямують до нуля). Для швидко змінюваних функцій спектр спадає поволі, оскільки в сумі гармонічного ряду таких функцій переважають синусоїди з високими частотами. Вважається, що сигнал має обмежений спектр, якщо після певного номера всі коефіцієнти спектру прямують до нуля. Іншими словами, на заданому проміжку часу сигнал подається у вигляді скінченної суми ряду Фур’є. В цьому випадку говорять, що спектр сигналу знаходиться нижче за граничну частоту fм, де fм - частота синусоїди при останньому ненульовому коефіцієнті. Теорема дискретизації формулюється так: Неперервна інформація S(t) з обмеженим спектром, тобто така, що має в своєму спектрі складові з частотами, що не перевищують деяку максимальну частоту спектру fм,, повністю відтворюється послідовністю відліків S(ti), узятих в дискретні моменти часу з інтервалом .
1.2 Базові поняття теорії інформації
У найзагальнішому розумінні інформація – це передавання, відображення певного різноманіття. В теорії інформації інформацію розглядають як кількісну міру усунення невизначеності, що зменшується у результаті отримання якихось відомостей. Отже, інформація – це об'єктивно існуючий зміст, який характеризує стан і поведінку певної системи загалом або її окремих елементів та зменшує ступінь невизначеності у процесі його пізнання і переробки. Інформація протилежна невизначеності. Кодування - перетворення інформації на впорядкований набір символів, елементів, знаків. При кодуванні кожному повідомленню з деякої множини, що називається ансамблем повідомлень, ставиться у відповідність зумовлена кодова комбінація - набір символів (елементів, знаків). Множина повідомлень називається алфавітом повідомлень, або первинним алфавітом, а множина символів (елементів, знаків) називається алфавітом джерела,або вторинним алфавітом. Побудована відповідно до певної схеми кодування множина кодових комбінацій називається кодом. Залежно від алфавіту, що використовується для побудови кодових комбінацій, розрізняють двійкові (бінарні) коди, алфавіт яких складається з двох символів: 0 і 1 і недвійкові (багатопозиційні, q-коди), алфавіт яких містить більшу кількість символів. За функціональним призначенням коди поділяють на безнадмірні (некоригувальні, первинні, прості ) і надмірні (коригувальні, завадостійкі). Перша група кодів призначена для економного кодування інформації – стиснення. Друга використовується для виявлення та/чи виправлення помилок, що виникають у процесі передачі даних каналом зв'язку із завадами. Коди можуть бути рівномірними і нерівномірними - з постійною і змінною кількістю розрядів. Канал зв'язку - це середовище передачі інформації, що характеризується максимально можливою для нього швидкістю передачі даних – пропускною здатністю, або ємністю каналу. Пропускну здатність каналу зв'язку без шуму можна наближено обчислити, знаючи максимальну частоту хвильових процесів, допустимих у цьому каналі. Вважається, що швидкість передачі даних може бути не менше цієї частоти. Типові канали зв'язку: телеграфний, телефонний, оптоволоконний, цифровий телефонний. Найбільш поширені телефонні лінії зв'язку, для яких досягнута швидкість передачі даних, >50 Кбод. Шум - це завади в каналі зв'язку. Узагальнена схема системи передачі інформації має такий вигляд (рис. 1.2).
1.3 Способи вимірювання інформації
Припустимо, що стан деякого об'єкта або системи наперед відомий. Тоді повідомлення про цей стан не несе ніякої інформації для її одержувача. Якщо ж стан об'єкта змінився і джерелом передане якесь інше повідомлення про стан спостережуваного об'єкта, то це повідомлення несе нові відомості, які додадуть знання про об'єкт. Тоді можна говорити, що таке повідомлення містить деяку кількість інформації для її одержувача. Отже, на якісному інтуїтивному рівні інформацію можна визначити як нове, наперед невідоме знання про стан деякого об'єкта або системи, а кількість інформації - кількість цього знання. Зрозуміло, що якщо нове знання збільшує загальний рівень знань про стан спостережуваного об'єкта, то кількість інформації накопичується і має адитивний характер. До передачі джерелом повідомлення для його одержувача має місце деяка невизначеність щодо стану об'єкта спостереження. Після вибору повідомлення джерелом утворюється певна кількість інформації, що якоюсь мірою зменшує цю невизначеність. В основу теорії інформації покладено запропонований Клодом Шенноном спосіб вимірювання кількості інформації, що міститься в одній випадковій величині щодо іншої випадкової величини[1]. Цей спосіб дозволяє виразити кількість інформації числом і надає можливість об'єктивно оцінити інформацію, що міститься у повідомленні. Коротко розглянемо основні викладки ймовірностного підходу Шеннона до визначення кількості інформації. Нехай дискретне джерело інформації видає послідовність повідомлень xi, кожне з яких вибирається з алфавіту x 1, x 2, …, xk, де k - об'єм алфавіту джерела. У кожному елементарному повідомленні для його одержувача міститься інформація як сукупність відомостей про стан деякого об'єкта або системи. Для того щоб абстрагуватися від конкретного змісту інформації, тобто її смислового значення, і отримати саме загальне визначення кількості інформації, кількісну міру інформації визначають без урахування її смислового змісту, а також цінності і корисності для одержувача. До того як зв'язок відбувся, є деяка невизначеність щодо того, яке з повідомлень з можливих буде передане. Ступінь невизначеності передачі хi можна визначити його апріорною імовірністю pi. Отже, кількість інформації I(Xi) буде деякою функцією від pi: I(Xi)=f(pi). Визначимо вид цієї функції. Вважатимемо, що міра кількості інформації I(Xi) відповідає двом інтуїтивним властивостям: 1) якщо вибір повідомлення джерела xi наперед відомий (немає невизначеності), тобто маємо достовірний випадок, імовірність якого pi= 1, то I(Xi)=f( 1 )= 0; 2) якщо джерело послідовно видає повідомлення xi і xj, і імовірність такого вибору pij - сумісна імовірність подій xi і xj, то кількість інформації в цих елементарних повідомленнях дорівнює сумі кількості інформації в кожному з них.
Ймовірність сумісного випадання двох випадкових подій xi і xj дорівнює добутку ймовірності однієї з цих подій на ймовірність іншої за умови, що перша подія відбулася, тобто pij=pi×pj/i=P×Q. Тоді, з властивості 2 кількості інформації випливає, що
I (Xi, Xj)= I (Xi)+ I (Xj)= f (P ∙ Q)= f (P)+ f (Q).
Звідси випливає, що функції f (pi) логарифмічна. Таким чином, кількість інформації зв'язана з апріорною імовірністю співвідношенням , при цьому коефіцієнт k і основа логарифма можуть бути довільними. Для того щоб кількість інформаціївизначалася невід'ємним числом, взяте k =-1, а основу логарифма найчастіше вибирають 2, тобто . (1.1)
У цьому випадку за одиницю кількості інформації так само береться біт. У такий спосіб біт – це кількість інформації в повідомленні дискретного джерела, алфавіт якого складається з двох альтернативних подій, які є апріорно рівноймовірними. Якщо кількість апріорно рівноймовірних подій дорівнює 28, то за одиницю інформації береться байт. Якщо джерело інформації видає послідовність взаємозалежних повідомлень, то отримання кожного з них змінює ймовірність появи наступних і відповідно кількість інформації у них. У такому випадку кількість інформаціївиражається через умовну ймовірність вибору джерелом повідомлення xi за умови, що до цього були обрані повідомлення xi-1, xi-2 …, тобто
. (1.2)
Кількість інформації I (X) є випадковою величиною, оскільки самі повідомлення випадкові. Закон розподілу ймовірностей I (X) визначається розподілом ймовірностей P (X) ансамблю повідомлень джерела. Натомість сам Шеннон зазначав, що смисловий зміст (семантика) повідомлень не має ніякого відношення до його теорії інформації, яка цілком базується на положеннях теорії ймовірності. Його спосіб вимірювання інформації наводив на думку про можливість існування способів вимірювання інформації з урахуванням її змісту, тобто семантичної інформації. Одним із таких способів вимірювання кількості інформації є функція inf (S)=-log2 p (S), де S - висловлювання, смисловий зміст якого вимірюється; p (S) - ймовірність істинності S. Властивості цієї функції: 1) якщо S 1 S 2 істинно, то inf(S1) ≥ inf(S2); 2) якщо S істинно, то inf(S)= 0; 3) Inf(S) ≥ 0; 4) Inf(S1, S2) = inf(S1) + inf(S2) p(S1, S2)=p(S1) + p(S2), тобто S1, S2 незалежні. Приклад. S1 = “a>3”, S2 = “a=7”; S2 S1, inf(S2) > inf(S1). Значення цієї функції-міри більше для висловлювань, що виключають більшу кількість можливостей.
1. 4 Ентропія джерела. Властивості кількості інформації та ентропії Кількість інформації, що міститься в одному елементарному повідомленні xi, не повністю характеризує джерело. Джерело дискретних повідомлень може бути охарактеризовано середньою кількістю інформації, що припадає на одне елементарне повідомлення, і називається ентропією джерела, тобто питомою кількістю інформації
, i =1… k, (1.3)
де k - об'єм алфавіту джерела. Фізичний зміст ентропії - це середньостатистична міра невизначеності знань одержувача інформації щодо стану спостережуваного об'єкта. У формулі (1.3) статистичне усереднювання (тобто обчислювання математичного сподівання випадкової величини) виконується за всім ансамблем повідомлень джерела. При цьому необхідно враховувати всі імовірнісні зв'язки між різними повідомленнями. Чим вища ентропія джерела, тим більша кількість інформації в середньому закладається в кожне повідомлення, тим важче її запам'ятати (записати) або передати каналом зв'язку. Необхідні втрати енергії на передачу повідомлення пропорційні ентропії (середній кількості інформації на одне повідомлення). Звідси випливає, що кількість інформації в послідовності з N повідомлень визначається кількістю цих повідомлень і ентропією джерела, тобто I (N)= N×H (X). Ентропія як кількісна міра інформаційності джерела має такі властивості: 1) ентропія дорівнює нулю, якщо хоча б одне з повідомлень достовірне; 2) ентропія завжди більша або дорівнює нулю, є величиною дійсною і обмеженою; 3) ентропія джерела з двома альтернативними подіями може змінюватися від 0 до 1; 4) ентропія - величина адитивна: ентропія джерела, повідомлення якого складаються з повідомлень декількох статистично незалежних джерел, дорівнює сумі ентропій цих джерел; 5) ентропія максимальна, якщо всі повідомлення мають однакову імовірність. Таким чином,
. (1.4)
Вираз (1.4) називається формулою Хартлі. ЇЇ легко вивести з формули Шеннона (1.3), припустивши, що pi =1/ k, де i= 1… k. При нерівноймовірних елементарних повідомленнях xi ентропія зменшується. У зв'язку з цим вводиться така міра джерела, як статистична надлишковість
, (1.5)
де H (X) - ентропія джерела повідомлень; H (X) max = log 2 k - максимально досяжна ентропія даного джерела. Надлишковість джерела (1.5) свідчить про інформаційний резерв повідомлень, елементи яких нерівноймовірні. Вона показує, яка частка максимально можливої при заданому об'ємі алфавіту невизначеності (ентропії) не використовується джерелом. Існує поняття семантичної надлишковості, яке випливає з того, що будь-яку думку можна сформулювати коротше. Вважається, що якщо яке-небудь повідомлення можна скоротити без втрати його смислового змісту, то воно має семантичну надлишковість. Розглянемо дискретні випадкові величини (д. в. в.) Х і Y, що задані законами розподілів їхніх ймовірностей P (X=Xi)= pi, P (Y=Yi)= qj та розподілом сумісних ймовірностей системи д. в. в. P (X=Xi, Y=Yj )= pij. Тоді кількість інформації, що міститься в д. в. в. Х щодо д. в. в. Y – взаємна інформація,визначається так:
(1.6)
Для неперервних випадкових величин (в. в.) X і Y, безумовні та сумісна щільності розподілів ймовірностей яких відповідно rX (t1), rY (t2) та rXY (t1, t2), взаємну кількість інформації шукають так само, як і в разі д. в. в.:
. Очевидно, що і, отже, , тобто приходимо до виразу (1.3) знаходження ентропії H (X). Таким чином, ентропія випадкової величиниX: . Наведемо властивостікількості інформації і ентропії: 1) I(X, Y)≥0; I(X, Y)=0 Û X і Y незалежні (одна в. в. нічим не описує іншу); 2) I(X, Y) = I(Y, X); 3) НХ =0 Û X=const; 4) I(X, Y)=HX+HY-H(X, Y), де ; 5) I (X, Y) ≤ I(X, X); якщо I(X, Y)=I(X, X) Þ X=f(Y).
Зразки розв'язування задач до розділу 1 Приклад 1 Дискретні випадкові величини (д. в. в.) X1 та X2 визначаються підкиданням двох гральних кубиків. Д. в. в. Y = X1 + X2. Знайти кількість інформації I (Y, X1), I (X1, X1), I (Y, Y). Date: 2015-11-15; view: 656; Нарушение авторских прав |