Точечными параметрами распределения являются

Точечная оценка параметров распределения

Тема 7. Статистические оценки параметров распределения: точечные и интервальные оценки

Смысл статистических методов заключается в том, чтобы по выборке ограниченного объема, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах целиком.

Естественно, что замена исследования генеральной совокупно­сти исследованием выборки порождает ряд вопросов:

1. В какой степени выборка отражает свойства генеральной совокупности, т. е. в какой степени выборка репрезентативна по отношению к генеральной совокупности?

2. Какую информацию о значениях параметров генеральной совокупности могут дать параметры выборки?

3. Можно ли утверждать, что полученные выборочным путем статистические характеристики (средние величины, дисперсия или любые другие производные величины) равны тем характе­ристикам, которые могут быть получены из генеральной сово­купности.

Проверка показывает, что значения параметров, полученных для разных выборок из одной генеральной совокупности, обыч­но не совпадают. Рассчитанные выборочным путем числовые значения параметров выборок являются лишь результатом при­ближенного статистического оценивания значений этих парамет­ров в генеральной совокупности. Статистическое оценивание, в силу изменчивости наблюдаемых явлений, позволяет получать только их приближенные значения.

Примечание. Строго говоря, в статистике оценка — это правило вычисления оцениваемого параметра, а термин оценить, т. е. провести оценивание, означает указать приближенное значе­ние.

Различают оценки точечные и оценки интервальные.

Точечная оценка параметров распределения

Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x).

Числовые характеристики этой выборки называются выборочными (эмпирическими) числовыми характеристиками.

Отметим, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности.

Точечной называют статистическую оценку, которая определяется одним числом.

Точечная оценка характеризуется свойствами:несмещенность, состоятельность и эффективность.

Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n ® ¥) она сходится по вероятности к истинному значению параметра, то есть стремится к истинному значению оцениваемого параметра генеральной совокупности.

Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию, те есть гарантирует наименьшее отклонение выборочной оценки от такой же оценки генеральной совокупности..

В математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное средне:

где хi – варианта выборки, ni – частота варианты хi, – объем выборки.

Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия

,

Более удобна формула .

Оценка s 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.

Точечные оценки имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Доверительный интервал

Если при статистической обработке результатов требуется найти не только точечную оценку неизвестного параметра θ, но и охарактеризовать точность этой оценки, то находится доверительный интервал.

Доверительный интервал – это интервал, в котором заранее заданной доверительной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность – это вероятность, с которой неизвестный параметр генеральной совокупности принадлежит доверительному интервалу.

Обычно принимают р = 0,95 или (реже) 0,99. Эти вероятности признаны достаточными для уверенного суждения о генеральных параметрах на основании известных выборочных показателей.

Доверительный интервал для математического ожидания имеет вид: где S – СКО, — критическое значение распределения Стьюдента (Смотри ПРИЛОЖЕНИЕ 1 к Теме 7)

Доверительный интервал для дисперсии имеет вид

где — обратное распределение хи-квадрат (Смотри ПРИЛОЖЕНИЕ 2 к Теме 7)

ЗАДАЧА. Дана выборка 5, 6, 8, 2, 3, 1, 1, 4. Записать данные в виде вариационного ряда. Определить оценки среднего, дисперсии, и стандартного отклонения а также построить доверительные интервалы для среднего и дисперсии на уровне значимости a=0,05.

Читайте также:  Что такое японский тофу

Решение. Представим данные в виде вариационного ряда: 1, 1, 2, 3, 4, 5, 6, 8. Так как n = 8, то выборочное среднее и исправленная выборочная дисперсия равны

Стандартное отклонение .

По таблицам из ПРИЛОЖЕНИЯ 1 и ПРИЛОЖЕНИЯ 2 к Теме 7. находим: ,

Получаем доверительный интервал для математического ожидания

или .

Доверительный интервал для дисперсии

или

Источник

Точечными параметрами распределения являются

Методы математической статистики используются при анализе явлений, которые обладают свойством статистической устойчивости. Сущность данного свойства заключается в том, что результат Х определённого опыта не может быть предсказан с большой точностью, где значение функции от результатов наблюдений при увеличении объёма выборки теряет своё свойство случайности и сходится по вероятности с неслучайной величиной θ [9].

В математической статистике применяются следующие оценки [3, 7]:

– несмещённые (значение математического ожидания оценки совпадает со значением оценивающего параметра, то есть );

– смещённые (оценка );

– эффективные (оценка, которая имеет при заданном объёме выборки n наименьшую дисперсию);

– состоятельные (оценка, которая стремится при по вероятности к оцениваемому параметру);

Точечной оценкой называют некоторую функцию результатов наблюдения , значение которой принимается за более приближенное в данных условиях к значению самого параметра θ, то есть оценку, определяющую одним числом [5, 2].

Часто, по результатам наблюдений количественного признака X требуется оценить следующие параметры распределения генеральной совокупности:

– генеральная средняя M(X);

– генеральная дисперсия D(X);

В качестве точечных оценок этих параметров выступают выборочная средняя и выборочная дисперсия и Dв соответственно [1, 4].

Генеральная средняя – среднее арифметическое значений генеральной совокупности :

– с повторениями

Выборочная средняя – среднее арифметическое значение выборки [3, 8].

То есть, имеется выборка объёма n, тогда выборочная средняя равна:

.

Выборочная средняя по данным одной выборки является определённым числом. Также выборочная средняя является несмещённой оценкой математического ожидания.

При увеличении объёма выборки n вся выборочная система стремится к генеральной средней [6, 9].

Генеральной дисперсией называют среднеарифметическое квадратное отклонение значений генеральной совокупности от их среднего значения.

Кроме дисперсий для характеристики рассеивания значений генеральной совокупности вокруг своего среднего также можно пользоваться средним квадратическим отклонением [10].

Выборочная дисперсия – среднее арифметическое квадратов отклонений, наблюдаемых значений выборки от их среднего значения.

Справедлива также формула:

.

Для исправления выборочной дисперсии необходимо умножить её на дробь:

.

Получаем исправленную выборочную дисперсию, которая является несмещённой оценкой генеральной дисперсии.

– с повторениями.

Для оценки рассеивания выборки служит выборочное среднеквадратическое отклонение.

Теперь рассмотрим, как применяются перечисленные данные при решении задач.

Из генеральной совокупности извлечена выборка объёма n=30;

Источник

Точечные оценки параматров распределения

Мы подошли к решению вопроса о том, как на основании полученной в эксперименте группы результатов наблюдений оценить истинное значение, т.е. найти результат измерений, как оценить его точность, т.е. меру его приближения к истинному значению.

Рассмотренные в рамках предыдущей лекции функции распределения описывают пове­дение непрерывных случайных величин, т.е. величин, возможные значения которых неотделимы друг от друга и непрерывно запол­няют некоторый конечный или бесконечный интервал. На прак­тике все результаты измерений и случайные погрешности являют­ся величинами дискретными, т.е. величинами xi возможные зна­чения которых отделимы друг от друга и поддаются счету.

При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределе­ния на основании выборок – ряда значений хi принимаемых слу­чайной величиной х в n независимых опытах. Используемая вы­борка должна быть репрезентативной (представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности.

Оценка параметра называется точечной, если она выражается одним числом. Задача нахождения точечных оценок – частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выбор­ки. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.

Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к ис­тинному значению числовой характеристики.

Читайте также:  Vga или qvga что лучше

Несмещенной на­зывается оценка, математическое ожидание которой равно оце­ниваемой числовой характеристике (параметру).

Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра, т.е. наиболее эффективной счи­тают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию.

Требование несмещенности на прак­тике не всегда целесообразно, так как оценка с небольшим сме­щением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не все­гда удается удовлетворить одновременно все три этих требова­ния, однако выбору оценки должен предшествовать ее критиче­ский анализ со всех перечисленных точек зрения.

Наиболее распространенным методом получения оценок явля­ется, метод наибольшего (максимального) правдоподобия, теоретически обоснованный математиком Р. Фишером, который приводит к асимптотически несмещенным и эффективным оценкам с при­ближенно нормальным распределением. Среди других методов мож­но назвать методы моментов и наименьших квадратов.

Точечной оценкой математического ожидания результата измерений является среднее арифметическое значение измеряемой величины:

(6.1)

При любом законе распределения оно является состоятельной и несмещенной оценкой, а также наиболее эффективной по крите­рию наименьших квадратов.

Точечная оценка дисперсии, определяемая по формуле:

(6.2)

является несмещенной и состоятельной.

Среднеквадратическое отклонение случайной величины х определяется как корень квадрат­ный из дисперсии. Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта опера­ция является нелинейной процедурой, приводящей к смещенности получаемой таким образом оценки. Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблю­дений n.

Он изменяется от k(3) = 1,13 до k(∞) = 1,03. Оценка сред­него квадратического отклонения:

(6.3)

Оценка СКО среднего квадратического отклонения:

Отсюда следует, что относительная погрешность определения СКО может быть оценена как:

Она зависит только от эксцесса и числа наблюдений в выборке и не зависит от СКО, т.е. той точности, с которой производятся измерения. Ввиду того, что большое число измерений проводит­ся относительно редко, погрешность определения, а может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадрат­ного корня и устраняемой поправочным множителем k(n).

В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле:

(6.4)

Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:

; (6.5)

Точечные оценки других параметров распределений использу­ются значительно реже.

Оценки коэффициента асимметрии и экс­цесса находятся по формулам:

; (6.6)

(6.7)

Определение рассеяния оценок коэффициента асимметрии и экс­цесса описывается различными формулами в зависимости от вида распределения.

Источник

Статистики, их выборочные распределения и точечные оценки параметров распределений в EXCEL

history 26 ноября 2016 г.

В статье напомним некоторые понятия математической статистики: выборка, статистика, точечная оценка, выборочное распределение. Продемонстрируем в MS EXCEL сходимость некоторых распределений статистик к нормальному распределению, распределению ХИ-квадрат, распределению Стьюдента и F — распределению.

Сначала напомним основные понятия математической статистики, необходимые для оценки параметров.

О выборке

После того, как выборка была получена, следующим вопросом является то, каким образом получить информацию о неизвестном распределении:

Примечание : Для некоторых распределений дисперсия и стандартное отклонение случайной величинымогут быть одновременно показателями и параметрами распределения (например, для нормального распределения ).

О статистиках и точечной оценке параметров распределения

Примечание : Про оценку параметров конкретного распределения можно прочитать в статье, относящейся к этому распределению (см. заглавную статью о распределениях ).

Читайте также:  что нельзя кушать при сахарном диабете список продуктов взрослому

Выборочные распределения статистик

Выборочное распределение среднего

Пусть выборка извлекается из нормального распределения с параметрами N(μ;σ 2 ). Рассмотрим статистику Х ср ( среднее выборки ):

Из Центральной предельной теоремы известно, что выборочное распределение статистики Х ср ( выборочное распределение среднего ) при достаточно большом размере выборки n стремится к нормальному распределению с параметрами N(μ;σ 2 /n).

Проверим это утверждение в MS EXCEL (см. файл примера Лист Нормальное ). Для этого возьмем 60 значений выборочных средних (Хср), вычисленныхна основе 60 случайных выборок, взятых из нормального распределения с параметрами N(μ;σ 2 ). Размер выборки n взят равным 50.

Как видно из рисунка выше, средние значения выборок хорошо укладываются на прямой, что позволяет сделать вывод о нормальности распределения. Параметры этого распределения можно, например, с помощью линии регрессии, которые близки к расчетным.

Выборочное распределение статистики

Известно, что выборочное распределение статистики при достаточно большом размере выборки стремится к распределению Стьюдента с n-1 степенью свободы.

Выборочное распределение статистики (n-1)s 2 /σ 2

Известно, что Выборочное распределение статистики (n-1)s 2 /σ 2 при достаточно большом размере выборки стремится к распределению ХИ-квадрат с n-1 степенью свободы.

Выборочное распределение статистики

Пусть из двух нормальных распределений с параметрами N(μ 11 2 ) и N(μ 22 2 ) извлекается по одной выборке (в общем случае разного размера n 1 и n 2 ) .

В файле примера на листе F-расп построен График вероятности для проверки этого утверждения.

Источник

Точечные оценки параметров распределения

Точечная оценка некоторого параметра распределения определяется по выборке, записывается одним числом и служит оценкой параметра распределения генеральной совокупности. Такая оценка называется выборочной. Приведем основные точечные оценки параметров распределения. Математическое ожидание случайной величины оценивается по выборочной средней ; дисперсия – по выборочной дисперсии Dви исправленной выборочной дисперсии S 2 ; среднее квадратическое отклонение (СКО) оценивается по выборочному среднему квадратическому отклонению σви исправленному выборочному среднему квадратическому отклонению S; Для трактовки полученных результатов расчета параметров выборки следует знать смысл каждой оценки. Приведем краткую их характеристику:

– характеризует среднее значение признака по выборке;

Dви S 2 – характеризуют средний квадрат отклонения признака от среднего значения по выборке, только вторая характеристика является еще и несмещенной;

σв и S– характеризуют среднее отклонение признака от среднего значения по выборке.

Метод “условного нуля”

Если выборка представлена статистическим рядом с равноотстоящими вариантами или интервальным статистическим рядом с равными интервалами разбиения, то целесообразно для упрощения расчетов использовать метод “условного нуля”. В этом случае выбирают в качестве “условного нуля” одну из вариант С, стоящую в центре ряда и имеющую наибольшую частоту. Затем переходят к условным вариантам по формуле ui = (xi –C)/h и заполняют специальную таблицу.

i Интервалы xi ni ui ni×ui ni×ui 2 ni(ui+1) 2
0,55-1,33 0,94 -4,02 -120,6 484,812 273,612
1,33-2,08 1,705 -3 -27
2,08-2,83 2,455 -2 -2
2,83-3,58 3,205 -1
3,58-4,33 C=3,955
4,33-5,08 4,705
5,08-5,83 5,455
5,83-6,58 6,205
Суммы: -90,6 668,812 567,612
М1=-1,1325 М2=8,36015 =3,1124 Dв=3,918 σв=1,979 S 2 =3,152 S=1,775

Для проверки правильности расчетов воспользуемся тождестовом:

i Интервалы xi ni ui ni×ui ni×ui 2 ni(ui+1) 2
0,014-0,054 0,034 -3 -180
0,054-0,094 0,074 -2 -38
0,094-0,131 0,1125 -1
0,131-0,174 С=0,1525
0,174-0,214 0,194 1,0375
0,214-0,254 0,234 2,0375
0,254-0,294 0,274 3,0375
0,294-0,334 0,314 4,0375 4,0375 16,315 25,377
Суммы: -213,9625 632,315 284,377
М1=-2,674 М2=7,9 =0,048 Dв=0,02932 σв=0,1712 S 2 =0,486 S=0,2205

Для проверки правильности расчетов воспользуемся тождестовом:

i Интервалы Yi ni ui ni×ui ni×ui 2 ni(ui+1) 2
60-87 73,5 -4 -72
87-114 100,5 -3 -48
114-141 127,5 -2 -38
141-168 154,5 -1 -10
168-195 C=181,5
195-222 208,5
222-249 235,5
249-276 262,5
Суммы: -153
М1=-1,9125 М2=6,8875 =130,5663 Dв=2290,81 σв=47,862 S 2 =132,219 S=11,498

Для проверки правильности расчетов воспользуемся тождестовом:

Источник

Образовательный портал