Что является предметом математической статистики

Предмет математической статистики

Выборки и их характеристики

Предмет математической статистики

Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.

Математическая статистика тесно связана с теорией вероятностей. Обе эти математические дисциплины изучают массовые случайные явления. При этом теория вероятностей выводит из математической модели свойства реального процесса, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят «из статистических данных»).

Предметом математической статистики является изучение случайных величин (или случайных событий, процессов) по результатам наблюдений. Полученные в результате наблюдения (опыта, эксперимента) данные сначала надо каким-либо образом обработать: упорядочить, представить в удобном для обозрения и анализа виде. Это первая задача. Затем, это уже вторая задача, оценить, хотя бы приблизительно, интересующие нас характеристики наблюдаемой случайной величины. Например, дать оценку неизвестной вероятности события, оценку неизвестной функции распределения, оценку математического ожидания, оценку дисперсии случайной величины, оценку параметров распределения, вид которого неизвестен, и т.д.

Следующей, назовем ее условно третьей, задачей является проверка статистических гипотез, т.е. решение вопроса согласования результатов оценивания с опытными данными. Например, выдвигается гипотеза, что: а) наблюдаемая случайная величина подчиняется нормальному закону; б) математическое ожидание наблюдаемой случайной величины равно нулю; в) случайное событие обладает данной вероятностью и т.д.

Одной из важнейших задач математической статистики является разработка методов, позволяющих по результатам обследования выборки (т.е. части исследуемой совокупности объектов) делать обоснованные выводы о распределении признака (случайной величины Что является предметом математической статистики) изучаемых объектов по всей совокупности.

Результаты исследования статистических данных методами математической статистики используются для принятия решения в задачах планирования, управления, прогнозирования и организации производства, при контроле качества продукции, при выборе оптимального времени настройки и замены действующей аппаратуры и т.д., то есть для научных и практических выводов.

Говорят, что «математическая статистика – это теория принятия решений в условиях неопределенности».

Источник

1. Математическая статистика. Введение

1. Математическая статистика. Введение

Математическая статистика — это такая дисциплина, которая применяется во всех областях научного знания.

Статистические методы предназначены для понимания «численной природы» действительности (Nisbett, et al., 1987).

Определение понятия

Математическая статистика — это раздел математики, посвященный методам анализа данных, преимущественно вероятностной природы. Она занимается систематизацией, обработкой и использованием статистических данных для теоретических и практ ических выводов.

Статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Здесь важно понять, что статистика имеет дело именно с количеством объектов, а не с их описательными признаками.

Производится статистическая обработка выборки, и после этого принимается решение. Важно заметить, что вследствие начального условия неопределённости притятое решение всегда носит характер «нечёткого высказывания». Иными словами, в статистической обработке приходится иметь дело с вероятностями, а не с точными утверждениями.

Основным предметом математической статистики является вычисление статистик (да простит нас читатель за тавтологию), являющихся критериями для оценки достоверности априорных предположений, гипотез или выводов по существу эмпирических данных.

Распределение Стьюдента

Статистики также являются случайными переменными. Распределения статистик (тест-распределения) лежат в основе критериев, которые построены на этой статистике. Например, В. Госсет, работая на пивоварне Гиннеса и публикуясь под псевдонимом “Стьюдент”, в 1908 г. доказал очень полезные свойства распределения отношения разности между выборочным средним и средним значением генеральной совокупности ( Что является предметом математической статистики) к стандартной ошибке среднего значения генеральной совокупности Что является предметом математической статистики, или t –статистики (распределение Стьюдента ):

Что является предметом математической статистики. Что является предметом математической статистики(5.7)

Распределение Стьюдента по форме при некоторых условиях приближается к нормальному.

Итак, предмет математической статистики составляет формальная количественная сторона исследуемых объектов, безразличная к специфической природе самих изучаемых объектов.

По этой причине в приводимых здесь примерах речь идёт о группах данных, о числах, а не о конкретных измеряемых вещах. И поэтому по образцам расчётов, данных здесь, вы можете рассчитывать свои данные, полученные на самых разных объектах.

В зависимости от конкретных результатов наблюдений математическая статистика делится на несколько разделов.

Разделы математической статистики

Многомерный статистический анализ.

Анализ функций (процессов) и временных рядов.

Статистика объектов нечисловой природы.

В современной науке считается, что любая область исследований не может быть настоящей наукой до тех пор, пока в неё не проникнет математика. В этом смысле математическая статистика является полномочным представителем математики в любой другой науке и обеспечивает научный подход к исследованиям. Можно сказать, что научный подход начинается там, где в исследовании появляется математическая статистика. Вот почему математическая статистика так важна для любого современного исследователя.

Хотите быть настоящим современным исследователем — изучайте и применяйте в своей работе математическую статистику!

Статистика с необходимостью появляется там, где происходит переход от единичного наблюдения к множественному. Если у вас имеется множество наблюдений, замеров и данных — то без математической статистики вам не обойтись.

Математическую статистику подразделяют на теоретическую и прикладную.

Теоретическая статистика доказывает научность и правильность самой статистики.

Этим разделом статистики занимаются математики, и они любят с помощь своих теоретических математических доказательств убеждать нас в том, что статистика сама по себе научна и ей можно доверять. Беда в том, что эти доказательства способны понять только другие математики, а обычным людям, которым нужно пользоваться математической статистикой эти доказательства всё равно не доступны, да и совершенно не нужны!

Вывод: Если вы не математик, то не тратьте зря свои силы на понимание теоретических выкладок по поводу математической статистики. Изучайте собственно статистические методы, а не их математические обоснования.

Прикладная статистика учит пользователей работать с любыми данными и получать обобщённые результаты. Неважно, какие именно это данные, важно, какое количество этих данных находится в вашем распоряжении. Кроме того, прикладная статистика подскажет нам, насколько можно верить в то, что полученные результаты отражают действительное положение дел.

Для разных дисциплин в прикладной статистике используют различные наборы конкретных методов. Поэтому различают следующие разделы прикладной статистики: биологическая, психологическая, экономическая и другие. Они отличаются друг от друга комплектацией примеров и приемов, а также излюбленными методами вычислений.

Можно привести следующий пример различий между применением прикладной статистики для разных дисциплин. Так, статистическое изучение режима турбулентных водных потоков производится на основе теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам ввиду того, что допущение того, что распределение вероятностей сохраняется неизменным в этом случае, как правило, совершенно неприемлемо. Следовательно, для этих разных дисциплин потребуются разные статистические методы.

Итак, математическую статистику должен применять в своих исследованиях любой современный учёный. Даже тот учёный, который работает в направлениях, которые весьма далеки от математики. И он должен уметь применять прикладную статискику к своим данным, даже не зная её.

Источник

Учебное пособие: Математическая статистика

1. Предмет и методы математической статистики

2. Основные понятия математической статистики

2.1 Основные понятия выборочного метода

2.2 Выборочное распределение

2.3 Эмпирическая функция распределения, гистограмма

Введение

Математическая статистика — наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надежность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объем выборки для получения результатов требуемой точности при выборочном обследовании).

В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых целиком известны. Предмет теории вероятностей — свойства и взаимосвязи этих величин (распределений).

Но часто эксперимент представляет собой черный ящик, выдающий лишь некие результаты, по которым требуется сделать вывод о свойствах самого эксперимента. Наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов, полученных повторением одного и того же случайного эксперимента в одинаковых условиях.

При этом возникают, например, следующие вопросы: Если мы наблюдаем одну случайную величину — как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении?

Примером такой серии экспериментов может служить социологический опрос, набор экономических показателей или, наконец, последовательность гербов и решек при тысячекратном подбрасывании монеты.

Все вышеприведенные факторы обуславливают актуальность и значимость тематики работы на современном этапе, направленной на глубокое и всестороннее изучение основных понятий математической статистики.

В связи с этим целью данной работы является систематизация, накопление и закрепление знаний о понятиях математической статистики.

1. Предмет и методы математической статистики

Математическая статистика — наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях. Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.

Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними.

Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и др.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.

В математической статистике есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.

Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.

Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.

Разработка методов аппроксимации данных и сокращения размерности описания была начата более 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднее были разработаны факторный анализ[1] и многочисленные нелинейные обобщения.

Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.

Математические методы в статистике основаны либо на использовании сумм (на основе Центральной Предельной Теоремы теории вероятностей) или показателей различия (расстояний, метрик), как в статистике объектов нечисловой природы. Строго обоснованы обычно лишь асимптотические результаты. В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчетов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).

2. Основные понятия математической статистики

2.1 Основные понятия выборочного метода

Пусть Что является предметом математической статистики— случайная величина, наблюдаемая в случайном эксперименте. Предполагается, что вероятностное пространство задано (и не будет нас интересовать).

Будем считать, что, проведя Что является предметом математической статистикираз этот эксперимент в одинаковых условиях, мы получили числа Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики— значения этой случайной величины в первом, втором, и т.д. экспериментах. Случайная величина Что является предметом математической статистикиимеет некоторое распределение Что является предметом математической статистики, которое нам частично или полностью неизвестно.

В серии уже произведенных экспериментов выборка — это набор чисел. Но если эту серию экспериментов повторить еще раз, то вместо этого набора мы получим новый набор чисел. Вместо числа Что является предметом математической статистикипоявится другое число — одно из значений случайной величины Что является предметом математической статистики. То есть Что является предметом математической статистикиЧто является предметом математической статистики, и Что является предметом математической статистики, и т.д.) — переменная величина, которая может принимать те же значения, что и случайная величина Что является предметом математической статистики, и так же часто (с теми же вероятностями). Поэтому до опыта Что является предметом математической статистики— случайная величина, одинаково распределенная с Что является предметом математической статистики, а после опыта — число, которое мы наблюдаем в данном первом эксперименте, т.е. одно из возможных значений случайной величины Что является предметом математической статистики.

Выборка Что является предметом математической статистикиобъема Что является предметом математической статистики— это набор из Что является предметом математической статистикинезависимых и одинаково распределенных случайных величин («копий Что является предметом математической статистики»), имеющих, как и Что является предметом математической статистики, распределение Что является предметом математической статистики.

Что значит «по выборке сделать вывод о распределении»? Распределение характеризуется функцией распределения, плотностью или таблицей, набором числовых характеристик — Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистикии т.д. По выборке нужно уметь строить приближения для всех этих характеристик.

Рассмотрим реализацию выборки на одном элементарном исходе Что является предметом математической статистики— набор чисел Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики. На подходящем вероятностном пространстве введем случайную величину Что является предметом математической статистики, принимающую значения Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистикис вероятностями по Что является предметом математической статистики(если какие-то из значений совпали, сложим вероятности соответствующее число раз). Таблица распределения вероятностей и функция распределения случайной величины Что является предметом математической статистикивыглядят так:

Название: Математическая статистика
Раздел: Рефераты по математике
Тип: учебное пособие Добавлен 11:35:38 21 апреля 2009 Похожие работы
Просмотров: 12068 Комментариев: 22 Оценило: 8 человек Средний балл: 4.3 Оценка: 4 Скачать
Что является предметом математической статистикиЧто является предметом математической статистикиЧто является предметом математической статистикиЧто является предметом математической статистики
Что является предметом математической статистикиЧто является предметом математической статистикиЧто является предметом математической статистикиЧто является предметом математической статистики
Что является предметом математической статистики

Распределение величины Что является предметом математической статистикиназывают эмпирическим или выборочным распределением. Вычислим математическое ожидание и дисперсию величины Что является предметом математической статистикии введем обозначения для этих величин:

Что является предметом математической статистики

Точно так же вычислим и момент порядка Что является предметом математической статистики

Что является предметом математической статистики

В общем случае обозначим через Что является предметом математической статистикивеличину

Что является предметом математической статистики

Если при построении всех введенных нами характеристик считать выборку Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистикинабором случайных величин, то и сами эти характеристики — Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистики— станут величинами случайными. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.

Причина использования характеристик распределения Что является предметом математической статистикидля оценки характеристик истинного распределения Что является предметом математической статистики(или Что является предметом математической статистики) — в близости этих распределений при больших Что является предметом математической статистики.

Мы не станем уточнять, что имеется в виду под близостью выборочного и истинного распределений. В следующих параграфах мы подробнее познакомимся с каждой из введенных выше характеристик и исследуем ее свойства, в том числе ее поведение с ростом объема выборки.

Поскольку неизвестное распределение Что является предметом математической статистикиможно описать, например, его функцией распределения Что является предметом математической статистики, построим по выборке «оценку» для этой функции.

Эмпирической функцией распределения, построенной по выборке Что является предметом математической статистикиобъема Что является предметом математической статистики, называется случайная функция Что является предметом математической статистики, при каждом Что является предметом математической статистикиравная

Что является предметом математической статистики

Напоминание: Случайная функция

Что является предметом математической статистики

называется индикатором события Что является предметом математической статистики. При каждом Что является предметом математической статистикиэто — случайная величина, имеющая распределение Бернулли с параметром Что является предметом математической статистики. почему?

Иначе говоря, при любом Что является предметом математической статистикизначение Что является предметом математической статистики, равное истинной вероятности случайной величине Что является предметом математической статистикибыть меньше Что является предметом математической статистики, оценивается долей элементов выборки, меньших Что является предметом математической статистики.

Если элементы выборки Что является предметом математической статистики, Что является предметом математической статистики, Что является предметом математической статистикиупорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом :

Что является предметом математической статистики

Что является предметом математической статистики

Выборка: Что является предметом математической статистики

Вариационный ряд: Что является предметом математической статистики

Рис. 1. Пример 1
Что является предметом математической статистики

Эмпирическая функция распределения имеет скачки в точках выборки, величина скачка в точке Что является предметом математической статистикиравна Что является предметом математической статистики, где Что является предметом математической статистики— количество элементов выборки, совпадающих с Что является предметом математической статистики.

Можно построить эмпирическую функцию распределения по вариационному ряду:

Что является предметом математической статистики

Что является предметом математической статистики (1)

На каждом из интервалов Что является предметом математической статистикистроят прямоугольник, площадь которого пропорциональна Что является предметом математической статистики. Общая площадь всех прямоугольников должна равняться единице. Пусть Что является предметом математической статистики— длина интервала Что является предметом математической статистики. Высота Что является предметом математической статистикипрямоугольника над Что является предметом математической статистикиравна

Что является предметом математической статистики

Полученная фигура называется гистограммой.

Имеется вариационный ряд (см. пример 1):

Что является предметом математической статистики

Разобьем отрезок Что является предметом математической статистикина 4 равных отрезка. В отрезок Что является предметом математической статистикипопали 4 элемента выборки, в Что является предметом математической статистики— 6, в Что является предметом математической статистики— 3, и в отрезок Что является предметом математической статистикипопали 2 элемента выборки. Строим гистограмму (рис. 2). На рис. 3 — тоже гистограмма для той же выборки, но при разбиении области на 5 равных отрезков.

Что является предметом математической статистики

В курсе «Эконометрика» утверждается, что наилучшим числом интервалов группировки («формула Стерджесса») является Что является предметом математической статистики.

Здесь Что является предметом математической статистики— десятичный логарифм, поэтому Что является предметом математической статистики, т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на 1. Заметим, что чем больше интервалов группировки, тем лучше. Но, если брать число интервалов, скажем, порядка Что является предметом математической статистики, то с ростом Что является предметом математической статистикигистограмма не будет приближаться к плотности.

Справедливо следующее утверждение:

Если плотность распределения элементов выборки является непрерывной функцией, то при Что является предметом математической статистикитак, что Что является предметом математической статистики, имеет место поточечная сходимость по вероятности гистограммы к плотности.

Так что выбор логарифма разумен, но не является единственно возможным.

Заключение

Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи.

Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин — что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость?

Часто бывает возможно высказать некие предположения о распределении, спрятанном в «черном ящике», или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента — например, о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т.д.

Итак, о (математической) статистике имеет смысл вспоминать, если

· имеется случайный эксперимент, свойства которого частично или полностью неизвестны,

· мы умеем воспроизводить этот эксперимент в одних и тех же условиях некоторое (а лучше — какое угодно) число раз.

Список литературы

1. Баумоль У. Экономическая теория и исследование операций. – М.; Наука, 1999.

2. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1995.

3. Боровков А.А. Математическая статистика. М.: Наука, 1994.

5. Коршунов Д.А., Чернова Н.И. Сборник задач и упражнений по математической статистике. Новосибирск: Изд-во Института математики им. С.Л.Соболева СО РАН, 2001.

9. Харман Г., Современный факторный анализ. — М.: Статистика, 1972.

[1] Харман Г., Современный факторный анализ. — М.: Статистика, 1972.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Рис. 2. Пример 2Рис. 3. Пример 2