Точечные оценки параметров нормального распределения

Точечная оценка параметров распределения

Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.

Естественно, что замена исследования генеральной совокупно­сти исследованием выборки порождает ряд вопросов:

1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?

2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?

3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характе­ристикам, которые могут быть получены из генеральной сово­купности.

Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обыч­но не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом при­ближенного статистического оценивания значений этих парамет­ров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.

Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значе­ние.

Различают оценки точечные и оценки интервальные.

Точечная оценка параметров распределения

Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).

Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.

Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.

Точечной называют статистическую оценку, которая определяется одним числом.

Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.

Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..

Точечные оценки параметров нормального распределения Точечные оценки параметров нормального распределенияВ математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное средне:

где хi – варианта выборки, ni – частота варианты хi, – объем выборки.

Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

Точечные оценки параметров нормального распределения,

Более удобна формула Точечные оценки параметров нормального распределения.

Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.

Точечные оценки параметров нормального распределения

Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Доверительный интервал

Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.

Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.

Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.

Доверительный интервал для математического ожидания имеет вид: Точечные оценки параметров нормального распределениягде S – СКО, Точечные оценки параметров нормального распределения— критическое значение распределения Стьюдента (Смотри ПРИЛОЖЕНИЕ 1 к Теме 7)

Доверительный интервал для дисперсии имеет вид

Точечные оценки параметров нормального распределения

где Точечные оценки параметров нормального распределения— обратное распределение хи-квадрат (Смотри ПРИЛОЖЕНИЕ 2 к Теме 7)

ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.

Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны

Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения

Стандартное отклонение Точечные оценки параметров нормального распределения.

По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: Точечные оценки параметров нормального распределения, Точечные оценки параметров нормального распределенияТочечные оценки параметров нормального распределения

Получаем доверительный интервал для математического ожидания

Точечные оценки параметров нормального распределенияили Точечные оценки параметров нормального распределения.

Доверительный интервал для дисперсии

Точечные оценки параметров нормального распределенияили Точечные оценки параметров нормального распределения

Источник

Точечные оценки параметров нормального распределения

Методы математической статистики используются при анализе явлений, которые обладают свойством статистической устойчивости. Сущность данного свойства заключается в том, что результат Х определённого опыта не может быть предсказан с большой точностью, где значение функции Точечные оценки параметров нормального распределенияот результатов наблюдений при увеличении объёма выборки теряет своё свойство случайности и сходится по вероятности с неслучайной величиной θ [9].

В математической статистике применяются следующие оценки [3, 7]:

– несмещённые (значение математического ожидания оценки совпадает со значением оценивающего параметра, то есть Точечные оценки параметров нормального распределения);

– смещённые (оценка Точечные оценки параметров нормального распределенияТочечные оценки параметров нормального распределения);

– эффективные (оценка, которая имеет при заданном объёме выборки n наименьшую дисперсию);

– состоятельные (оценка, которая стремится при Точечные оценки параметров нормального распределенияпо вероятности к оцениваемому параметру);

Точечной оценкой называют некоторую функцию результатов наблюдения Точечные оценки параметров нормального распределения, значение которой принимается за более приближенное в данных условиях к значению самого параметра θ, то есть оценку, определяющую одним числом [5, 2].

Часто, по результатам наблюдений количественного признака X требуется оценить следующие параметры распределения генеральной совокупности:

– генеральная средняя M(X);

– генеральная дисперсия D(X);

В качестве точечных оценок этих параметров выступают выборочная средняя и выборочная дисперсия Точечные оценки параметров нормального распределенияи Dв соответственно [1, 4].

Генеральная средняя – среднее арифметическое значений генеральной совокупности Точечные оценки параметров нормального распределения:

Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения– с повторениями

Выборочная средняя – среднее арифметическое значение выборки [3, 8].

То есть, имеется выборка объёма n, тогда выборочная средняя равна:

Точечные оценки параметров нормального распределения.

Выборочная средняя по данным одной выборки является определённым числом. Также выборочная средняя является несмещённой оценкой математического ожидания.

При увеличении объёма выборки n вся выборочная система стремится к генеральной средней [6, 9].

Генеральной дисперсией называют среднеарифметическое квадратное отклонение значений генеральной совокупности от их среднего значения.

Точечные оценки параметров нормального распределения

Кроме дисперсий для характеристики рассеивания значений генеральной совокупности вокруг своего среднего также можно пользоваться средним квадратическим отклонением [10].

Выборочная дисперсия – среднее арифметическое квадратов отклонений, наблюдаемых значений выборки от их среднего значения.

Точечные оценки параметров нормального распределения

Справедлива также формула:

Точечные оценки параметров нормального распределения.

Для исправления выборочной дисперсии необходимо умножить её на дробь:

Точечные оценки параметров нормального распределения.

Получаем исправленную выборочную дисперсию, которая является несмещённой оценкой генеральной дисперсии.

Точечные оценки параметров нормального распределения– с повторениями.

Для оценки рассеивания выборки служит выборочное среднеквадратическое отклонение.

Теперь рассмотрим, как применяются перечисленные данные при решении задач.

Из генеральной совокупности извлечена выборка объёма n=30;

Источник

Точечные оценки параматров распределения

Точечные оценки параметров нормального распределения Точечные оценки параметров нормального распределения Точечные оценки параметров нормального распределения Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения

Мы подошли к решению вопроса о том, как на основании полученной в эксперименте группы результатов наблюдений оценить истинное значение, т.е. найти результат измерений, как оценить его точность, т.е. меру его приближения к истинному значению.

Рассмотренные в рамках предыдущей лекции функции распределения описывают пове­дение непрерывных случайных величин, т.е. величин, возможные значения которых неотделимы друг от друга и непрерывно запол­няют некоторый конечный или бесконечный интервал. На прак­тике все результаты измерений и случайные погрешности являют­ся величинами дискретными, т.е. величинами xi возможные зна­чения которых отделимы друг от друга и поддаются счету.

При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределе­ния на основании выборок – ряда значений хi принимаемых слу­чайной величиной х в n независимых опытах. Используемая вы­борка должна быть репрезентативной (представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности.

Оценка параметра называется точечной, если она выражается одним числом. Задача нахождения точечных оценок – частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выбор­ки. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.

Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к ис­тинному значению числовой характеристики.

Несмещенной на­зывается оценка, математическое ожидание которой равно оце­ниваемой числовой характеристике (параметру).

Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра, т.е. наиболее эффективной счи­тают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию.

Требование несмещенности на прак­тике не всегда целесообразно, так как оценка с небольшим сме­щением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не все­гда удается удовлетворить одновременно все три этих требова­ния, однако выбору оценки должен предшествовать ее критиче­ский анализ со всех перечисленных точек зрения.

Наиболее распространенным методом получения оценок явля­ется, метод наибольшего (максимального) правдоподобия, теоретически обоснованный математиком Р. Фишером, который приводит к асимптотически несмещенным и эффективным оценкам с при­ближенно нормальным распределением. Среди других методов мож­но назвать методы моментов и наименьших квадратов.

Точечной оценкой математического ожидания результата измерений является среднее арифметическое значение измеряемой величины:

Точечные оценки параметров нормального распределения(6.1)

При любом законе распределения оно является состоятельной и несмещенной оценкой, а также наиболее эффективной по крите­рию наименьших квадратов.

Точечная оценка дисперсии, определяемая по формуле:

Точечные оценки параметров нормального распределения(6.2)

является несмещенной и состоятельной.

Среднеквадратическое отклонение случайной величины х определяется как корень квадрат­ный из дисперсии. Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта опера­ция является нелинейной процедурой, приводящей к смещенности получаемой таким образом оценки. Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблю­дений n.

Он изменяется от k(3) = 1,13 до k(∞) = 1,03. Оценка сред­него квадратического отклонения:

Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения

Точечные оценки параметров нормального распределения(6.3)

Оценка СКО среднего квадратического отклонения:

Точечные оценки параметров нормального распределения

Отсюда следует, что относительная погрешность определения СКО может быть оценена как:

Точечные оценки параметров нормального распределения

Она зависит только от эксцесса и числа наблюдений в выборке и не зависит от СКО, т.е. той точности, с которой производятся измерения. Ввиду того, что большое число измерений проводит­ся относительно редко, погрешность определения, а может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадрат­ного корня и устраняемой поправочным множителем k(n).

В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле:

Точечные оценки параметров нормального распределения(6.4)

Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:

Точечные оценки параметров нормального распределения; Точечные оценки параметров нормального распределения(6.5)

Точечные оценки других параметров распределений использу­ются значительно реже.

Оценки коэффициента асимметрии и экс­цесса находятся по формулам:

Точечные оценки параметров нормального распределения; (6.6)

Точечные оценки параметров нормального распределения(6.7)

Определение рассеяния оценок коэффициента асимметрии и экс­цесса описывается различными формулами в зависимости от вида распределения.

Источник

Математическая статистика

Точечные оценки

Свойства точечных оценок

Пусть x1. xn – выборка наблюдений случайной величины X, имеющей распределение FX(x). При проведении ряда статистических исследований вид функции распределения наблюдаемой случайной величины зачастую предполагается известным (например, случайная величина имеет нормальное или биномиальное распределение). Неизвестными же являются параметры этого распределения.

Одной из задач математической статистики является оценка неизвестных параметров распределения наблюдаемой случайной величины X по выборке x1. xn её наблюдений.

Параметром θ∈Θ распределения FX(x) случайной величины X называется любая числовая характеристика этой случайной величины (математическое ожидание, дисперсия и т.п.) или любая константа, явно входящая в выражение для функции распределения FX(x).

Напомним, что любая выборка наблюдений x1. xn является реализацией случайной выборки X1. Xn. Статистикой Z в математической статистике называется произвольная функция случайной выборки, не зависящая от неизвестных параметров распределения:

В связи с тем, что статистика Z является функцией случайных аргументов, Z является случайной величиной. Для каждой реализации x1. xn случайной выборки X1. Xn получим соответствующую ей реализацию z статистики Z:

называемую выборочным значением статистики Z.

Основные свойства точечных оценок.

1. Состоятельность (Consistency)

$\forall \varepsilon >0\ \ \ P\left( \left| <<<\tilde<\theta >>>_>-\theta \right|\ge \varepsilon \right)\to 0$,

Точечные оценки параметров нормального распределения

3. Эффективность (Efficiency)

Для оценки параметра θ может быть предложено несколько несмещённых оценок. Вследствие несмещённости различные реализации этих оценок будут группироваться относительно их математического ожидания, равного θ, однако разброс этих значений может быть различным. Как известно, мерой разброса значений случайной величины относительно математического ожидания является её дисперсия.

Точечные оценки параметров нормального распределения

Оценка параметра θ, имеющая минимально возможную дисперсию среди всех оценок, называется эффективной оценкой параметра θ. В математической статистике наряду с термином «эффективная оценка» используют и другие: «несмещённая оценка с минимальной дисперсией», «оптимальная оценка».

При выполнении условий регулярности каждый элемент независимой случайной выборки X1. Xn вносит равный вклад в информацию Фишера In(θ), т.е.

где I(θ) – количество информации по Фишеру о параметре θ, содержащееся в одном выборочном наблюдении.

Величина информации по Фишеру зависит от вида распределения генеральной совокупности X. Так, выборки, полученные из генеральных совокупностей с разными распределениями (например, нормальным и биномиальным) будут содержать различное количество информации о неизвестных математическом ожидании или дисперсии.

Чем больше информации по Фишеру о параметре θ содержится в выборочных наблюдениях, тем меньший разброс имеют реализации эффективной оценки этого параметра, а следовательно, являются более точными.

Формально информация по Фишеру о параметре θ, содержащаяся в одном выборочном наблюдении из генеральной совокупности с функцией плотности распределения fX(x, θ), рассчитывается по формуле

называется вкладом выборки.

Источник

Статистики, их выборочные распределения и точечные оценки параметров распределений в EXCEL

history 26 ноября 2016 г.

В статье напомним некоторые понятия математической статистики: выборка, статистика, точечная оценка, выборочное распределение. Продемонстрируем в MS EXCEL сходимость некоторых распределений статистик к нормальному распределению, распределению ХИ-квадрат, распределению Стьюдента и F — распределению.

Сначала напомним основные понятия математической статистики, необходимые для оценки параметров.

О выборке

После того, как выборка была получена, следующим вопросом является то, каким образом получить информацию о неизвестном распределении:

Примечание : Для некоторых распределений дисперсия и стандартное отклонение случайной величинымогут быть одновременно показателями и параметрами распределения (например, для нормального распределения ).

О статистиках и точечной оценке параметров распределения

Примечание : Про оценку параметров конкретного распределения можно прочитать в статье, относящейся к этому распределению (см. заглавную статью о распределениях ).

Выборочные распределения статистик

Выборочное распределение среднего

Пусть выборка извлекается из нормального распределения с параметрами N(μ;σ 2 ). Рассмотрим статистику Х ср ( среднее выборки ): Точечные оценки параметров нормального распределения

Из Центральной предельной теоремы известно, что выборочное распределение статистики Х ср ( выборочное распределение среднего ) при достаточно большом размере выборки n стремится к нормальному распределению с параметрами N(μ;σ 2 /n).

Проверим это утверждение в MS EXCEL (см. файл примера Лист Нормальное ). Для этого возьмем 60 значений выборочных средних (Хср), вычисленныхна основе 60 случайных выборок, взятых из нормального распределения с параметрами N(μ;σ 2 ). Размер выборки n взят равным 50.

Как видно из рисунка выше, средние значения выборок хорошо укладываются на прямой, что позволяет сделать вывод о нормальности распределения. Параметры этого распределения можно, например, с помощью линии регрессии, которые близки к расчетным.

Выборочное распределение статистики Точечные оценки параметров нормального распределения

Известно, что выборочное распределение статистики при достаточно большом размере выборки стремится к распределению Стьюдента с n-1 степенью свободы.

Выборочное распределение статистики (n-1)s 2 /σ 2

Известно, что Выборочное распределение статистики (n-1)s 2 /σ 2 при достаточно большом размере выборки стремится к распределению ХИ-квадрат с n-1 степенью свободы.

Выборочное распределение статистики Точечные оценки параметров нормального распределения

Пусть из двух нормальных распределений с параметрами N(μ 11 2 ) и N(μ 22 2 ) извлекается по одной выборке (в общем случае разного размера n 1 и n 2 ) .

В файле примера на листе F-расп построен График вероятности для проверки этого утверждения.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *