Что является предметом математической статистики
Предмет математической статистики
Выборки и их характеристики
Предмет математической статистики
Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.
Математическая статистика тесно связана с теорией вероятностей. Обе эти математические дисциплины изучают массовые случайные явления. При этом теория вероятностей выводит из математической модели свойства реального процесса, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят «из статистических данных»).
Предметом математической статистики является изучение случайных величин (или случайных событий, процессов) по результатам наблюдений. Полученные в результате наблюдения (опыта, эксперимента) данные сначала надо каким-либо образом обработать: упорядочить, представить в удобном для обозрения и анализа виде. Это первая задача. Затем, это уже вторая задача, оценить, хотя бы приблизительно, интересующие нас характеристики наблюдаемой случайной величины. Например, дать оценку неизвестной вероятности события, оценку неизвестной функции распределения, оценку математического ожидания, оценку дисперсии случайной величины, оценку параметров распределения, вид которого неизвестен, и т.д.
Следующей, назовем ее условно третьей, задачей является проверка статистических гипотез, т.е. решение вопроса согласования результатов оценивания с опытными данными. Например, выдвигается гипотеза, что: а) наблюдаемая случайная величина подчиняется нормальному закону; б) математическое ожидание наблюдаемой случайной величины равно нулю; в) случайное событие обладает данной вероятностью и т.д.
Одной из важнейших задач математической статистики является разработка методов, позволяющих по результатам обследования выборки (т.е. части исследуемой совокупности объектов) делать обоснованные выводы о распределении признака (случайной величины 
Результаты исследования статистических данных методами математической статистики используются для принятия решения в задачах планирования, управления, прогнозирования и организации производства, при контроле качества продукции, при выборе оптимального времени настройки и замены действующей аппаратуры и т.д., то есть для научных и практических выводов.
Говорят, что «математическая статистика – это теория принятия решений в условиях неопределенности».
1. Математическая статистика. Введение
1. Математическая статистика. Введение
Математическая статистика — это такая дисциплина, которая применяется во всех областях научного знания.
Статистические методы предназначены для понимания «численной природы» действительности (Nisbett, et al., 1987).
Определение понятия
Математическая статистика — это раздел математики, посвященный методам анализа данных, преимущественно вероятностной природы. Она занимается систематизацией, обработкой и использованием статистических данных для теоретических и практ ических выводов.
Статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками. Здесь важно понять, что статистика имеет дело именно с количеством объектов, а не с их описательными признаками.
Производится статистическая обработка выборки, и после этого принимается решение. Важно заметить, что вследствие начального условия неопределённости притятое решение всегда носит характер «нечёткого высказывания». Иными словами, в статистической обработке приходится иметь дело с вероятностями, а не с точными утверждениями.
Основным предметом математической статистики является вычисление статистик (да простит нас читатель за тавтологию), являющихся критериями для оценки достоверности априорных предположений, гипотез или выводов по существу эмпирических данных.
Распределение Стьюдента
Статистики также являются случайными переменными. Распределения статистик (тест-распределения) лежат в основе критериев, которые построены на этой статистике. Например, В. Госсет, работая на пивоварне Гиннеса и публикуясь под псевдонимом “Стьюдент”, в 1908 г. доказал очень полезные свойства распределения отношения разности между выборочным средним и средним значением генеральной совокупности ( 



Распределение Стьюдента по форме при некоторых условиях приближается к нормальному.
Итак, предмет математической статистики составляет формальная количественная сторона исследуемых объектов, безразличная к специфической природе самих изучаемых объектов.
По этой причине в приводимых здесь примерах речь идёт о группах данных, о числах, а не о конкретных измеряемых вещах. И поэтому по образцам расчётов, данных здесь, вы можете рассчитывать свои данные, полученные на самых разных объектах.
В зависимости от конкретных результатов наблюдений математическая статистика делится на несколько разделов.
Разделы математической статистики
Многомерный статистический анализ.
Анализ функций (процессов) и временных рядов.
Статистика объектов нечисловой природы.
В современной науке считается, что любая область исследований не может быть настоящей наукой до тех пор, пока в неё не проникнет математика. В этом смысле математическая статистика является полномочным представителем математики в любой другой науке и обеспечивает научный подход к исследованиям. Можно сказать, что научный подход начинается там, где в исследовании появляется математическая статистика. Вот почему математическая статистика так важна для любого современного исследователя.
Хотите быть настоящим современным исследователем — изучайте и применяйте в своей работе математическую статистику!
Статистика с необходимостью появляется там, где происходит переход от единичного наблюдения к множественному. Если у вас имеется множество наблюдений, замеров и данных — то без математической статистики вам не обойтись.
Математическую статистику подразделяют на теоретическую и прикладную.
Теоретическая статистика доказывает научность и правильность самой статистики.
Этим разделом статистики занимаются математики, и они любят с помощь своих теоретических математических доказательств убеждать нас в том, что статистика сама по себе научна и ей можно доверять. Беда в том, что эти доказательства способны понять только другие математики, а обычным людям, которым нужно пользоваться математической статистикой эти доказательства всё равно не доступны, да и совершенно не нужны!
Вывод: Если вы не математик, то не тратьте зря свои силы на понимание теоретических выкладок по поводу математической статистики. Изучайте собственно статистические методы, а не их математические обоснования.
Прикладная статистика учит пользователей работать с любыми данными и получать обобщённые результаты. Неважно, какие именно это данные, важно, какое количество этих данных находится в вашем распоряжении. Кроме того, прикладная статистика подскажет нам, насколько можно верить в то, что полученные результаты отражают действительное положение дел.
Для разных дисциплин в прикладной статистике используют различные наборы конкретных методов. Поэтому различают следующие разделы прикладной статистики: биологическая, психологическая, экономическая и другие. Они отличаются друг от друга комплектацией примеров и приемов, а также излюбленными методами вычислений.
Можно привести следующий пример различий между применением прикладной статистики для разных дисциплин. Так, статистическое изучение режима турбулентных водных потоков производится на основе теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам ввиду того, что допущение того, что распределение вероятностей сохраняется неизменным в этом случае, как правило, совершенно неприемлемо. Следовательно, для этих разных дисциплин потребуются разные статистические методы.
Итак, математическую статистику должен применять в своих исследованиях любой современный учёный. Даже тот учёный, который работает в направлениях, которые весьма далеки от математики. И он должен уметь применять прикладную статискику к своим данным, даже не зная её.
— случайная величина, наблюдаемая в случайном эксперименте. Предполагается, что вероятностное пространство задано (и не будет нас интересовать).
раз этот эксперимент в одинаковых условиях, мы получили числа
,
,
,
— значения этой случайной величины в первом, втором, и т.д. экспериментах. Случайная величина
имеет некоторое распределение
, которое нам частично или полностью неизвестно.
появится другое число — одно из значений случайной величины
. То есть
, и
, и т.д.) — переменная величина, которая может принимать те же значения, что и случайная величина
объема
— это набор из
,
,
и т.д. По выборке нужно уметь строить приближения для всех этих характеристик.
— набор чисел
,
,
. На подходящем вероятностном пространстве введем случайную величину
, принимающую значения
(если какие-то из значений совпали, сложим вероятности соответствующее число раз). Таблица распределения вероятностей и функция распределения случайной величины 




величину
,
,
,
,
— станут величинами случайными. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.
можно описать, например, его функцией распределения
, построим по выборке «оценку» для этой функции.
, при каждом
равная

. При каждом
это — случайная величина, имеющая распределение Бернулли с параметром
. почему?
, равное истинной вероятности случайной величине 




равна
, где
— количество элементов выборки, совпадающих с 

строят прямоугольник, площадь которого пропорциональна
. Общая площадь всех прямоугольников должна равняться единице. Пусть
— длина интервала
прямоугольника над 

на 4 равных отрезка. В отрезок
попали 4 элемента выборки, в
— 6, в
— 3, и в отрезок
попали 2 элемента выборки. Строим гистограмму (рис. 2). На рис. 3 — тоже гистограмма для той же выборки, но при разбиении области на 5 равных отрезков.
.
— десятичный логарифм, поэтому
, т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на 1. Заметим, что чем больше интервалов группировки, тем лучше. Но, если брать число интервалов, скажем, порядка
, то с ростом
гистограмма не будет приближаться к плотности.
так, что
, имеет место поточечная сходимость по вероятности гистограммы к плотности.