Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Загальна характеристика задач кластерного аналізу





Терміном кластерний аналіз прийнято позначати сукупність методів, підходів і процедур, розроблених для вирішення проблеми формування однорідних класів в довільній проблемній області. Методи аналізу даних, складовою частиною яких є методи кластерного аналізу, не використовують апріорних припущень про імовірнісну природу вихідної інформації і керуються лише евристичними міркуваннями про характер і особливості досліджуваної сукупності об’єктів. Кластерний аналіз (або автоматична класифікація, розпізнавання образів без вчителя) займає одне з центральних місць серед методів аналізу даних і є сукупністю підходів, методів і алгоритмів, призначених для знаходження деякого розбиття досліджуваної сукупності об’єктів на підмножини схожих між собою об’єктів. При цьому вихідним припущенням для виділення таких підмножин, що отримали спеціальну назву кластерів, служить лише неформальне припущення про те, що об’єкти, які відносяться до одного кластера, повинні мати більшу схожість між собою, чим з об’єктами з інших кластерів. Вихідною інформацією для кластеризації є матриця спостережень:   кожний рядок якої є значеннями n ознак одного з S об’єктів кластеризації. Кластеризація полягає в розбитті об’єктів з Xна декілька підмножин (кластерів), в яких об’єкти між собою більш схожі, ніж з об’єктами з інших кластерів. У метричному просторі «схожість» зазвичай визначають через відстань. Відстань може розраховуватися як між вихідними об’єктами – рядками матриці X, так і від цих об’єктів до прототипів центрів кластерів. Часто координати прототипів заздалегідь невідомі, їх знаходять одночасно з розбиттям даних на кластери. Кластерний аналіз (кластеризація) – це технологія, що дозволяє розподілити вхідні дані на класи – групи однотипних екземплярів вибірки, або кластери – компактні області групування екземплярів вибірки у просторі ознак. Вихідною інформацією для кластеризації є вибірка спостережень x ={ xsj }, де xsj – значення j -ої ознаки s -го екземпляра вибірки, s = 1, 2, …, S; j =1, 2, …, N, S – кількість екземплярів вибірки, N – кількість ознак, що характеризують екземпляри вибірки. Задача кластеризації полягає в розбитті об’єктів з x на декілька кластерів, у яких об’єкти більш схожі між собою, ніж з об’єктами інших кластерів. У метричному просторі «схожість» звичайно визначають через відстань. Методи кластеризації можна класифікувати на чіткі та нечіткі. Чіткі методи кластеризації розбивають вихідну множину об’єктів x на декілька непересічних підмножин. При цьому будь-який об’єкт із x належить тільки одному кластеру. Нечіткі методи кластерного аналізу дозволяють будь-якому екземпляру одночасно належати до всіх визначених кластерів, але з різним ступенем. Концептуальний взаємозв’язок між кластерним аналізом і теорією нечітких множин заснований на тій обставині, що при вирішенні завдань структуризації складних систем більшість формованих класів об’єктів розмиті за своєю природою. Ця розмитість полягає в тому, що перехід від приналежності до неприналежності елементів до даних класів швидше поступовий, чим стрибкоподібний. Тому найбільш адекватну відповідь в подібного роду випадках слід шукати не на питання: “Чи належить даний елемент тому або іншому класу?”, а на питання: “У якій мірі даний елемент належить даному класу?”. Вимога знаходження однозначної кластеризації елементів досліджуваної проблемної області є досить грубою і жорсткою, особливо при рішенні задач системного аналізу, що слабо структуруються. Методи нечіткої кластеризації послабляють цю вимогу. Послаблення вимоги здійснюється за рахунок введення в розгляд нечітких кластерів і відповідних їм функцій приналежності, що набувають значень з інтервалу [0, 1]. В загальному випадку завданням нечіткої кластеризації є знаходження нечіткого розбиття множини елементів досліджуваної сукупності, які утворюють структуру нечітких кластерів, присутніх у вхідних даних. Це завдання зводиться до знаходження мір приналежності елементів універсуму шуканим нечітким кластерам, які в сукупності і визначають нечітке розбиття вихідної множини елементів. Приклад 1. «Метелик» представляє собою 15 об’єктів, двовимірне зображення яких нагадує однойменну комаху (рис. 1а). При чіткій кластеризації (рис. 1б і в) отримуємо два кластери з семи і восьми об’єктів.   Рис. 1 – Порівняння чіткої та нечіткої кластеризації «метелика» а – вхідні дані; б – чітка кластеризація I; в – чітка кластеризація II; г – нечітка кластеризація На рисунку об’єкти першого кластера позначені трикутниками, а другого – квадратами. Симетричний «метелик» при чіткій кластеризації розбивається на два несиметричні кластери. При нечіткій кластеризації (рис.6.1г) проблемний восьмий об’єкт, розташований в центрі «метелика», одночасно належить двом симетричним кластерам з однією і тією ж мірою. На цьому малюнку розмір маркерів пропорційний мірі приналежності об’єкта кластеру.  

Date: 2015-09-25; view: 473; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.006 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию