Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Статистика в пространствах общей природы
Пусть -элементы пространства , не являющегося линейным. Как определить среднее значение для ? Поскольку нельзя складывать элементы , сравнивать их по величине, то необходимы подходы, принципиально новые по сравнению с классическими. В работе [37] предложено использовать показатель различия (содержательный смысл: чем больше , тем больше различаются и ) и определять среднее как решение экстремальной задачи . (1) Таким образом - это совокупность всех тех , для которых функция достигает минимума на . Для классического случая при имеем , а при среднее совпадает с выборочной медианой (при нечетном объеме выборки; а при четном - является отрезком с концами в двух средних элементах вариационного ряда). Для ряда конкретных объектов среднее как решение экстремальной задачи вводилось рядом авторов. В 1929 г. Джини и Гальвани [38] применили такой подход для усреднения точек на плоскости и в пространстве (см. также [39]). Кемени [40-42] решение задачи (1) называл медианой или средним для выборки, состоящей из ранжировок. При моделировании лесных пожаров, согласно выражению (1), было введено "среднеуклоняемое множество" [43]. Общее определение среднего (1) рассмотрено нами в работах [2, 37]. Основной результат, связанный со средними (1) - аналог закона больших чисел. Пусть. - независимые одинаково распределенные случайные элементы со значениями в пространстве общей природы (определения здесь и далее - согласно Математической Энциклопедии [44]). Теоретическим средним, или математическим ожиданием, назовем [37] . (3) Закон больших чисел состоит в сходимости. к . при .Поскольку и эмпирическое, и теоретическое средние - множества, то понятие сходимости требует уточнения. Одно из возможных уточнений таково [46]: для функции (4) введем понятие " -пятки" ( >0) . (5) Очевидно, -пятка - это окрестность (если он достигается), заданная в терминах минимизируемой функции. Тем самым снимается вопрос о выборе метрики в пространстве (позже подобная идея была использована в работе [45]). Тогда при некоторых условиях регулярности для любого >0 вероятность события (6) стремится к 1 при. , т.е. справедлив закон больших чисел [46]. Естественное обобщение рассматриваемой задачи позволяет построить общую теорию оптимизационного подхода в статистике. Как известно [47], большинство задач прикладной статистики может быть представлено в качестве оптимизационных. Как себя ведут решения экстремальных задач? Частные случаи этой постановки: как ведут себя при росте объема выборки оценки максимального правдоподобия, минимального контраста (в том числе робастные в смысле Тьюки-Хьюбера [1, 48-50]), оценки нагрузок в факторном анализе и методе главных компонент при отсутствии нормальности, оценки метода наименьших модулей в регрессии [51] и т.д. Обычно легко устанавливается, что для некоторых пространств и последовательности случайных функций. при найдется функция такая, что (7) для любого (сходимость по вероятности). Требуется вывести отсюда, что , (8) т.е. решения экстремальных задач также сходятся. Понятие сходимости в соотношении (8) уточняется с помощью -пяток, как это сделано выше для закона больших чисел. Условия регулярности, при которых справедливо предельное соотношение (8), приведены в исследовании [46]; применения, в частности, к методу главных компонент, рассмотрены в работе [4]. Отметим, что закон больших чисел позволил установить устойчивость медианы Кемени и изучить ее поведение при увеличении объема выборки [1]. Начиная с классической статьи Вальда [52], различные постановки, связанные с решениями экстремальных статистических задач, изучались многими авторами (см., например, [53-55]). Одна из наиболее общих постановок рассмотрена в работе [46]. Применения к теории классификации рассмотрел К.А.Пярна [119]. Как оценить распределение случайного элемента в пространстве общей природы? Поскольку понятие функции распределения неприменимо, естественно использовать непараметрические оценки плотности, т.е. функции. .такой, что для любого измеримого множества , (9) где. - некоторая мера в . Ряд непараметрических оценок плотности был предложен и изучен в работе [56]. Например, аналогом ядерных оценок Парзена-Розенблатта [57,58] является оценка , (10) где - показатель различия; - ядерная функция; - последовательность положительных чисел; - нормирующий множитель. Оказалось, что статистики типа (10) обладают такими же свойствами, по крайней мере при фиксированном , что и их классические аналоги при . Некоторые изменения необходимы при рассмотрении дискретных , каковыми являются многие пространства конкретных объектов нечисловой природы. С помощью непараметрических оценок плотности можно развивать регрессионный анализ, дискриминантный анализ и другие направления в пространствах общей природы ([1-5],[59]). Для проверки гипотез согласия, однородности, независимости в пространствах общей природы могут быть использованы статистики интегрального типа , (11) где -последовательность случайных функций на ; - последовательность случайных распределений (или зарядов).Обычно при сходится по распределению к некоторой случайной функции , а - к распределению . Тогда распределение статистики интегрального типа (11) сходится к распределению случайного элемента . (12) Условия, при которых это справедливо, даны в работе [60].(Хотя они сформулированы для конечномерного случая, переход в пространства общей природы не представляет принципиальных трудностей.) Пример применения - вывод предельного распределения статистики типа омега-квадрат для проверки симметрии распределения [61] (см. также [1, гл.2]). Перейдем к статистике конкретных видов объектов нечисловой природы.
|