Статистическое оценивание
Материал из MachineLearning.
Содержание
Постановка задачи
Различают два основных типа оценок: точечные оценки и доверительные интервалы.
Точечное оценивание
К общим методам построения точечных оценок параметров относятся: метод максимального правдоподобия, метод моментов, метод квантилей.
Ниже приводятся некоторые свойства, которыми могут обладать или не обладать точечные оценки.
Состоятельность
Когда употребляют просто термин состоятельность, то обычно имеется в виду слабая состоятельность, т.е. сходимость по вероятности.
Условие состоятельности является практически обязательным для всех используемых на практике оценок. Несостоятельные оценки используются крайне редко.
Несмещенность и асимптотическая несмещенность
Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра:
Более слабым условием является асимптотическая несмещенность, которая означает, что математическое ожидание оценки сходится к истинному значению параметра с ростом объема выборки:
Сравнение оценок и эффективность
Для сравнения между собой различных оценок одного и того же параметра применяют следующий метод: выбирают некоторую функцию риска, которая измеряет отклонение оценки от истинного значения параметра, и лучшей считают ту, для которой эта функция принимает меньшее значение.
Чаще всего в качестве функции риска рассматривают математическое ожидание квадрата отклонения оценки от истинного значения
Существует нижняя граница на данную функцию риска, называемая неравенство Крамера-Рао.
(Несмещенные) оценки, для которых достигается эта нижняя граница (т.е. имеющие минимально возможную дисперсию), называются эффективными. Однако существование эффективной оценки есть довольно сильное требование на задачу, которое имеет место далеко не всегда.
Достаточные статистики
(Несмещенная) эффективная оценка параметра всегда является достаточной статистикой.
Доверительные интервалы
Другим типом оценок статистических параметров являются доверительные интервалы.
Доверительные интервалы используются, когда нам нужны надежные границы, в которые попадает значение оцениваемого параметра.
Часто вместе с точечной оценкой параметра строят доверительный интервал, середина которого равна этой оценке. Его ширина является наглядной характеристикой того, насколько точна может быть данная точечная оценка.
Иногда бывает наоборот: естественным образом строится некоторый доверительный интервал, а в качестве точечной оценки параметра рассматривают его середину.
Математическая статистика
Точечные оценки
Свойства точечных оценок
Пусть x1. xn – выборка наблюдений случайной величины X, имеющей распределение FX(x). При проведении ряда статистических исследований вид функции распределения наблюдаемой случайной величины зачастую предполагается известным (например, случайная величина имеет нормальное или биномиальное распределение). Неизвестными же являются параметры этого распределения.
Одной из задач математической статистики является оценка неизвестных параметров распределения наблюдаемой случайной величины X по выборке x1. xn её наблюдений.
Параметром θ∈Θ распределения FX(x) случайной величины X называется любая числовая характеристика этой случайной величины (математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения FX(x).
Напомним, что любая выборка наблюдений x1. xn является реализацией случайной выборки X1. Xn. Статистикой Z в математической статистике называется произвольная функция случайной выборки, не зависящая от неизвестных параметров распределения:
В связи с тем, что статистика Z является функцией случайных аргументов, Z является случайной величиной. Для каждой реализации x1. xn случайной выборки X1. Xn получим соответствующую ей реализацию z статистики Z:
называемую выборочным значением статистики Z.
Основные свойства точечных оценок.
1. Состоятельность (Consistency)
$\forall \varepsilon >0\ \ \ P\left( \left| <<<\tilde<\theta >>>_
3. Эффективность (Efficiency)
Для оценки параметра θ может быть предложено несколько несмещённых оценок. Вследствие несмещённости различные реализации этих оценок будут группироваться относительно их математического ожидания, равного θ, однако разброс этих значений может быть различным. Как известно, мерой разброса значений случайной величины относительно математического ожидания является её дисперсия.
Оценка параметра θ, имеющая минимально возможную дисперсию среди всех оценок, называется эффективной оценкой параметра θ. В математической статистике наряду с термином «эффективная оценка» используют и другие: «несмещённая оценка с минимальной дисперсией», «оптимальная оценка».
При выполнении условий регулярности каждый элемент независимой случайной выборки X1. Xn вносит равный вклад в информацию Фишера In(θ), т.е.
где I(θ) – количество информации по Фишеру о параметре θ, содержащееся в одном выборочном наблюдении.
Величина информации по Фишеру зависит от вида распределения генеральной совокупности X. Так, выборки, полученные из генеральных совокупностей с разными распределениями (например, нормальным и биномиальным) будут содержать различное количество информации о неизвестных математическом ожидании или дисперсии.
Чем больше информации по Фишеру о параметре θ содержится в выборочных наблюдениях, тем меньший разброс имеют реализации эффективной оценки этого параметра, а следовательно, являются более точными.
Формально информация по Фишеру о параметре θ, содержащаяся в одном выборочном наблюдении из генеральной совокупности с функцией плотности распределения fX(x, θ), рассчитывается по формуле
называется вкладом выборки.
Математическая статистика
Точечные оценки
Методы получения точечных оценок
Точечной оценкой неизвестного параметра θ, вообще говоря, может являться любая статистика. Однако на практике интерес представляют лишь наиболее «качественные» оценки, для которых вероятность того, что при реализации случайной выборки они примут значение максимально близкое к неизвестному значению θ наибольшая. Такие оценки должны быть несмещёнными, состоятельными и эффективными. Возникает вопрос, как получить качественную оценку для произвольного параметра θ наблюдаемой случайной величины X?
1. Метод подстановки
Например, согласно методу подстановки оценкой математического ожидания будет выборочное среднее, а оценкой дисперсии – выборочная дисперсия.
Все оценки, рассчитанные по методу подстановки, являются состоятельными, однако их несмещённость и эффективность не гарантированы. Примером смещённой оценки, рассмотренной ранее, является выборочная дисперсия.
Метод моментов состоит нахождении такого вектора параметров θ, при котором теоретические моменты равны выборочным моментам, т.е. в разрешении системы уравнений вида:
Число уравнений в системе (1) равно числу неизвестных параметров k. Для получения оценок по методу моментов, вообще говоря, могут быть выбраны любые моменты произвольных порядков, однако, как правило, на практике используют лишь моменты низших порядков.
Все оценки, рассчитанные по методу моментов, являются состоятельными, однако их несмещённость и эффективность, так же, как и в случае метода подстановки, не гарантированы.
Точечные оценки, полученные по методу моментов, называются ММ-оценками.
Пример 1
3. Метод максимального правдоподобия
Метод максимального правдоподобия (maximum likelihood estimation, MLE) является наиболее популярным методом оценивания неизвестных параметров распределений.
Учитывая, что компоненты X1,…, Xn случайной выборки, реализациями которых являются выборочные значения x 1,…,xn, независимы, многомерная функция плотности есть произведение одномерных функций плотностей:
В (2) учтено, что все компоненты X1,…, Xn имеют одинаковое распределение, совпадающее с распределением генеральной совокупности X.
Функция правдоподобия выборки x1,…, xn является функцией только вектора неизвестных параметров θ.
Запишем необходимое условие экстремума функции правдоподобия:
На практике бывает удобно вместо системы уравнений (3) составить систему уравнений
Все оценки, рассчитанные по методу максимального правдоподобия, являются состоятельными и, по крайней мере, асимптотически несмещёнными и асимптотически эффективными. Если для неизвестного параметра существует эффективная оценка, то метод максимального правдоподобия даёт именно эту оценку.
Точечные оценки, полученные по методу максимального правдоподобия, называются МП-оценками.
Точечная оценка параметров распределения
Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.
Естественно, что замена исследования генеральной совокупности исследованием выборки порождает ряд вопросов:
1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?
2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?
3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характеристикам, которые могут быть получены из генеральной совокупности.
Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обычно не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом приближенного статистического оценивания значений этих параметров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.
Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значение.
Различают оценки точечные и оценки интервальные.
Точечная оценка параметров распределения
Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).
Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.
Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.
Точечной называют статистическую оценку, которая определяется одним числом.
Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.
Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.
Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..


где хi – варианта выборки, ni – частота варианты хi, – объем выборки.
Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

Более удобна формула 
Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.
Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.
Доверительный интервал
Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.
Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.
Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.
Доверительный интервал для математического ожидания имеет вид: 

Доверительный интервал для дисперсии имеет вид
где 
ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.
Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны
Стандартное отклонение 
По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: 
Получаем доверительный интервал для математического ожидания


Доверительный интервал для дисперсии

Статистические оценки параметров генеральной совокупности
Определение статистической оценки. Точечные статистические оценки: смещенные и несмещенные, эффективные и состоятельные. Интервальные статистические оценки. Точность и надежность оценки; определение доверительного интервала; построение доверительных интервалов для средней при известном и неизвестном среднеквадратическом отклонении.
Определение статистической оценки
Точечные статистические оценки
Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам. Поэтому нужно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Соблюдение требования устраняет систематические ошибки.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки ) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается также состоятельной.
Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию.
Пусть изучается дискретная генеральная совокупность относительно количественного признака. Генеральной средней называется среднее арифметическое значений признака генеральной совокупности. Она вычисляется по формуле
где — значения признака генеральной совокупности объема ; — соответствующие частоты, причем
где — значения, признака в выборочной совокупности объема ; — соответствующие частоты, причем
Если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит- от объема выборки: чем больше объем выборки, тем меньше выборочная средняя отличается от генеральной.
Интервальные оценки
Наряду с точечным оцениванием, статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.
Доверительный интервал для генеральной средней при известном значении среднего квадратического отклонения и при условии, что случайная величина (количественный признак ) распределена нормально, задается выражением
где — наперед заданное число, близкое к единице, а значения функции приведены в таблице прил. 2.
Доверительный интервал для генеральной средней нормального распределения признака при неизвестном значении среднего квадратического отклонения задается выражением








