Точечные оценки параметров нормального распределения
Точечная оценка параметров распределения
Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки
Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.
Естественно, что замена исследования генеральной совокупности исследованием выборки порождает ряд вопросов:
1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?
2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?
3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характеристикам, которые могут быть получены из генеральной совокупности.
Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обычно не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом приближенного статистического оценивания значений этих параметров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.
Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значение.
Различают оценки точечные и оценки интервальные.
Точечная оценка параметров распределения
Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).
Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.
Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.
Точечной называют статистическую оценку, которая определяется одним числом.
Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.
Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.
Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.
Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..


где хi – варианта выборки, ni – частота варианты хi, – объем выборки.
Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

Более удобна формула 
Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.
Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.
Доверительный интервал
Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.
Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.
Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.
Доверительный интервал для математического ожидания имеет вид: 

Доверительный интервал для дисперсии имеет вид
где 
ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.
Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны
Стандартное отклонение 
По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: 
Получаем доверительный интервал для математического ожидания


Доверительный интервал для дисперсии

Точечные оценки параметров нормального распределения
Методы математической статистики используются при анализе явлений, которые обладают свойством статистической устойчивости. Сущность данного свойства заключается в том, что результат Х определённого опыта не может быть предсказан с большой точностью, где значение функции 
В математической статистике применяются следующие оценки [3, 7]:
– несмещённые (значение математического ожидания оценки совпадает со значением оценивающего параметра, то есть 
– смещённые (оценка 
– эффективные (оценка, которая имеет при заданном объёме выборки n наименьшую дисперсию);
– состоятельные (оценка, которая стремится при 
Точечной оценкой называют некоторую функцию результатов наблюдения 
Часто, по результатам наблюдений количественного признака X требуется оценить следующие параметры распределения генеральной совокупности:
– генеральная средняя M(X);
– генеральная дисперсия D(X);
В качестве точечных оценок этих параметров выступают выборочная средняя и выборочная дисперсия 
Генеральная средняя – среднее арифметическое значений генеральной совокупности 

Выборочная средняя – среднее арифметическое значение выборки [3, 8].
То есть, имеется выборка объёма n, тогда выборочная средняя равна:

Выборочная средняя по данным одной выборки является определённым числом. Также выборочная средняя является несмещённой оценкой математического ожидания.
При увеличении объёма выборки n вся выборочная система стремится к генеральной средней [6, 9].
Генеральной дисперсией называют среднеарифметическое квадратное отклонение значений генеральной совокупности от их среднего значения.
Кроме дисперсий для характеристики рассеивания значений генеральной совокупности вокруг своего среднего также можно пользоваться средним квадратическим отклонением [10].
Выборочная дисперсия – среднее арифметическое квадратов отклонений, наблюдаемых значений выборки от их среднего значения.
Справедлива также формула:

Для исправления выборочной дисперсии необходимо умножить её на дробь:

Получаем исправленную выборочную дисперсию, которая является несмещённой оценкой генеральной дисперсии.

Для оценки рассеивания выборки служит выборочное среднеквадратическое отклонение.
Теперь рассмотрим, как применяются перечисленные данные при решении задач.
Из генеральной совокупности извлечена выборка объёма n=30;
Точечные оценки параматров распределения
Мы подошли к решению вопроса о том, как на основании полученной в эксперименте группы результатов наблюдений оценить истинное значение, т.е. найти результат измерений, как оценить его точность, т.е. меру его приближения к истинному значению.
Рассмотренные в рамках предыдущей лекции функции распределения описывают поведение непрерывных случайных величин, т.е. величин, возможные значения которых неотделимы друг от друга и непрерывно заполняют некоторый конечный или бесконечный интервал. На практике все результаты измерений и случайные погрешности являются величинами дискретными, т.е. величинами xi возможные значения которых отделимы друг от друга и поддаются счету.
При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределения на основании выборок – ряда значений хi принимаемых случайной величиной х в n независимых опытах. Используемая выборка должна быть репрезентативной (представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности.
Оценка параметра называется точечной, если она выражается одним числом. Задача нахождения точечных оценок – частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.
Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к истинному значению числовой характеристики.
Несмещенной называется оценка, математическое ожидание которой равно оцениваемой числовой характеристике (параметру).
Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра, т.е. наиболее эффективной считают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию.
Требование несмещенности на практике не всегда целесообразно, так как оценка с небольшим смещением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не всегда удается удовлетворить одновременно все три этих требования, однако выбору оценки должен предшествовать ее критический анализ со всех перечисленных точек зрения.
Наиболее распространенным методом получения оценок является, метод наибольшего (максимального) правдоподобия, теоретически обоснованный математиком Р. Фишером, который приводит к асимптотически несмещенным и эффективным оценкам с приближенно нормальным распределением. Среди других методов можно назвать методы моментов и наименьших квадратов.
Точечной оценкой математического ожидания результата измерений является среднее арифметическое значение измеряемой величины:

При любом законе распределения оно является состоятельной и несмещенной оценкой, а также наиболее эффективной по критерию наименьших квадратов.
Точечная оценка дисперсии, определяемая по формуле:

является несмещенной и состоятельной.
Среднеквадратическое отклонение случайной величины х определяется как корень квадратный из дисперсии. Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта операция является нелинейной процедурой, приводящей к смещенности получаемой таким образом оценки. Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблюдений n.
Он изменяется от k(3) = 1,13 до k(∞) = 1,03. Оценка среднего квадратического отклонения:

Оценка СКО среднего квадратического отклонения:
Отсюда следует, что относительная погрешность определения СКО может быть оценена как:
Она зависит только от эксцесса и числа наблюдений в выборке и не зависит от СКО, т.е. той точности, с которой производятся измерения. Ввиду того, что большое число измерений проводится относительно редко, погрешность определения, а может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадратного корня и устраняемой поправочным множителем k(n).
В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле:

Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:


Точечные оценки других параметров распределений используются значительно реже.
Оценки коэффициента асимметрии и эксцесса находятся по формулам:


Определение рассеяния оценок коэффициента асимметрии и эксцесса описывается различными формулами в зависимости от вида распределения.
Математическая статистика
Точечные оценки
Свойства точечных оценок
Пусть x1. xn – выборка наблюдений случайной величины X, имеющей распределение FX(x). При проведении ряда статистических исследований вид функции распределения наблюдаемой случайной величины зачастую предполагается известным (например, случайная величина имеет нормальное или биномиальное распределение). Неизвестными же являются параметры этого распределения.
Одной из задач математической статистики является оценка неизвестных параметров распределения наблюдаемой случайной величины X по выборке x1. xn её наблюдений.
Параметром θ∈Θ распределения FX(x) случайной величины X называется любая числовая характеристика этой случайной величины (математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения FX(x).
Напомним, что любая выборка наблюдений x1. xn является реализацией случайной выборки X1. Xn. Статистикой Z в математической статистике называется произвольная функция случайной выборки, не зависящая от неизвестных параметров распределения:
В связи с тем, что статистика Z является функцией случайных аргументов, Z является случайной величиной. Для каждой реализации x1. xn случайной выборки X1. Xn получим соответствующую ей реализацию z статистики Z:
называемую выборочным значением статистики Z.
Основные свойства точечных оценок.
1. Состоятельность (Consistency)
$\forall \varepsilon >0\ \ \ P\left( \left| <<<\tilde<\theta >>>_
3. Эффективность (Efficiency)
Для оценки параметра θ может быть предложено несколько несмещённых оценок. Вследствие несмещённости различные реализации этих оценок будут группироваться относительно их математического ожидания, равного θ, однако разброс этих значений может быть различным. Как известно, мерой разброса значений случайной величины относительно математического ожидания является её дисперсия.
Оценка параметра θ, имеющая минимально возможную дисперсию среди всех оценок, называется эффективной оценкой параметра θ. В математической статистике наряду с термином «эффективная оценка» используют и другие: «несмещённая оценка с минимальной дисперсией», «оптимальная оценка».
При выполнении условий регулярности каждый элемент независимой случайной выборки X1. Xn вносит равный вклад в информацию Фишера In(θ), т.е.
где I(θ) – количество информации по Фишеру о параметре θ, содержащееся в одном выборочном наблюдении.
Величина информации по Фишеру зависит от вида распределения генеральной совокупности X. Так, выборки, полученные из генеральных совокупностей с разными распределениями (например, нормальным и биномиальным) будут содержать различное количество информации о неизвестных математическом ожидании или дисперсии.
Чем больше информации по Фишеру о параметре θ содержится в выборочных наблюдениях, тем меньший разброс имеют реализации эффективной оценки этого параметра, а следовательно, являются более точными.
Формально информация по Фишеру о параметре θ, содержащаяся в одном выборочном наблюдении из генеральной совокупности с функцией плотности распределения fX(x, θ), рассчитывается по формуле
называется вкладом выборки.
Статистики, их выборочные распределения и точечные оценки параметров распределений в EXCEL
history 26 ноября 2016 г.
В статье напомним некоторые понятия математической статистики: выборка, статистика, точечная оценка, выборочное распределение. Продемонстрируем в MS EXCEL сходимость некоторых распределений статистик к нормальному распределению, распределению ХИ-квадрат, распределению Стьюдента и F — распределению.
Сначала напомним основные понятия математической статистики, необходимые для оценки параметров.
О выборке
После того, как выборка была получена, следующим вопросом является то, каким образом получить информацию о неизвестном распределении:
Примечание : Для некоторых распределений дисперсия и стандартное отклонение случайной величинымогут быть одновременно показателями и параметрами распределения (например, для нормального распределения ).
О статистиках и точечной оценке параметров распределения
Примечание : Про оценку параметров конкретного распределения можно прочитать в статье, относящейся к этому распределению (см. заглавную статью о распределениях ).
Выборочные распределения статистик
Выборочное распределение среднего
Пусть выборка извлекается из нормального распределения с параметрами N(μ;σ 2 ). Рассмотрим статистику Х ср ( среднее выборки ):
Из Центральной предельной теоремы известно, что выборочное распределение статистики Х ср ( выборочное распределение среднего ) при достаточно большом размере выборки n стремится к нормальному распределению с параметрами N(μ;σ 2 /n).
Проверим это утверждение в MS EXCEL (см. файл примера Лист Нормальное ). Для этого возьмем 60 значений выборочных средних (Хср), вычисленныхна основе 60 случайных выборок, взятых из нормального распределения с параметрами N(μ;σ 2 ). Размер выборки n взят равным 50.
Как видно из рисунка выше, средние значения выборок хорошо укладываются на прямой, что позволяет сделать вывод о нормальности распределения. Параметры этого распределения можно, например, с помощью линии регрессии, которые близки к расчетным.
Выборочное распределение статистики 
Известно, что выборочное распределение статистики при достаточно большом размере выборки стремится к распределению Стьюдента с n-1 степенью свободы.
Выборочное распределение статистики (n-1)s 2 /σ 2
Известно, что Выборочное распределение статистики (n-1)s 2 /σ 2 при достаточно большом размере выборки стремится к распределению ХИ-квадрат с n-1 степенью свободы.
Выборочное распределение статистики 
Пусть из двух нормальных распределений с параметрами N(μ 1 ;σ 1 2 ) и N(μ 2 ;σ 2 2 ) извлекается по одной выборке (в общем случае разного размера n 1 и n 2 ) .
В файле примера на листе F-расп построен График вероятности для проверки этого утверждения.



















