Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Заполнение пропусков

Если присутствуют пропуски в матрице, необходим специальный механизм заполнения этих пропусков, чтобы они не могли исказить реальные закономерности.

В исследованиях одним из этапов исследования является этап верификации (проверки) и коррекции данных (удаление неправдоподобных, ошибочных, замена пропущенных значений).

 

В статистических программах используется специальный механизм Missing Values (пропущенные данные – при наличии пропуска вместо него вставляется специальный код, который идентифицирует ситуацию и позволяет скорректировать алгоритмы вычислений).

 

Методы правдоподобного заполнения пропусков (некоторые)

- метод экспертной оценки пропущенного значения

- метод сглаживания (замена пропущенного значения одной из статистик центральной тенденции – среднее, медиана, мода, выбор зависит от шкалы и параметров распределения)

- метод одномерной регрессии (значение переменной прогнозируется по значению переменной, которая имеет достаточно сильную корреляцию с искомой методом одномерной - однофакторной регрессии – далее мы остановимся на этом методе)

- метод множественной регрессии

- метод, основанный на подборе ближайшего соседа без пропусков (находим объект без пропусков, который наиболее близок к объекту с пропуском – например, с помощью кластерного анализа)

 

Основные схемы формирования данных типа «объект–признак»

Формирование матрицы измерений связано с определенным временным периодом и тем, как собирались данные

Синхронная схема – наблюдение и фиксация значений происходит в определенный момент времени, считающийся достаточно коротким (в более общей постановке – с неизменным сдвигом по времени), данные получаются одномоментно. Под моментом времени подразумевается такой период времени, в течение которого не может произойти изменение объекта исследования, его параметров.

Диахронная схема – учитывается изменение данных от времени при этом различают фиксацию во времени одного признака объекта, всех признаков объекта и всех признаков всех объектов.

Виды схем формирования данных

Схема Название Число объектов Число переменных Число моментов времени
  Синхронная Несколько Несколько Один
  Диахронная (одна пер-ая) Несколько Одна Несколько
  Диахронная (один объект) Один Несколько Несколько
  Полная Несколько Несколько Несколько

 

Временные ряды – один из вариантов диахронного анализа, выделение одной строки в схеме 1. Получаем временной ряд вида (ti, xi), при этом каждому из моментов времени соответствует значение переменной для фиксированного объекта.

Модель может быть расширена за счет введения в рассмотрение нескольких объектов, фиксации нескольких значений переменных.

Предполагается, что наблюдения доступны в дискретные (равноотстоящие?) моменты времени. Например, в проблеме прогнозирования сбыта сбыт zt в текущем месяце t и сбыт zt-1, zt-2, zt-3 в предыдущие месяцы могут быть использованы для прогноза сбыта с упреждением l=1,2,3,…12 месяцев. Обозначим через сделанный в момент t прогноз сбыта zt+l в некоторый момент t+l в будущем, т. е. с упреждением l.

 

 

Функция , l = 1, 2,… дающая в момент времени прогнозы для всех будущих времен упреждения, будет называться прогнозирующей функцией в момент времени t. Наша цель – получить такую прогнозирующую функцию, у которой среднее значение квадрата отклонения истинного от прогнозируемого значения является наименьшим для каждого упреждения l.

В дополнение к вычислению наилучшего прогноза необходимо также указать его точность, чтобы, например, можно было оценить риск, связанный с решениями, основанными на прогнозировании. Точность прогноза может быть выражена вероятностными пределами по обе стороны от каждого прогнозируемого значения, Эти пределы можно вычислить для любого удобного набора вероятностей, например для 50 и 90%. Смысл этих пределов в том, что значения временного ряда, которое появится в соответствующее время, с указанной вероятностью будет лежать внутри этих пределов. Для иллюстрации на рис. 1.1. показаны 20 последних значений временного ряда, обрывающегося на времени t. Там же показаны прогнозируемые величины на момент t для упреждений l=1,2,…,13 вместе с 50%-ными вероятностными пределами.

 


<== предыдущая | следующая ==>
Типы женских фигур: какая одежда вам подойдет? | Типы фигур

Date: 2015-09-05; view: 620; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию