Известна функция распределения дискретной случайной величины выразить закон

Главная / Известна функция распределения дискретной случайной величины выразить закон

Случайные величины. Дискретная случайная величина.
Математическое ожидание

Второй раздел по теории вероятностей посвящён случайным величинам, которые незримо сопровождали нас буквально в каждой статье по теме. И настал момент чётко сформулировать, что же это такое:

Случайной называют величину, которая в результате испытания примет одно и только одно числовое значение, зависящее от случайных факторов и заранее непредсказуемое.

Случайные величины, как правило, обозначают через *, а их значения – соответствующими маленькими буквами с подстрочными индексами, например, .

* Иногда используют , а также греческие буквы

Пример встретился нам на первом же уроке по теории вероятностей, где мы фактически рассмотрели следующую случайную величину:

– количество очков, которое выпадет после броска игрального кубика.

В результате данного испытания выпадет одна и только грань, какая именно – не предсказать (фокусы не рассматриваем); при этом случайная величина может принять одно из следующий значений:

.

– количество мальчиков среди 10 новорождённых.

Совершенно понятно, что это количество заранее не известно, и в очередном десятке родившихся детей может оказаться:

, либо мальчиков – один и только один из перечисленных вариантов.

И, дабы соблюсти форму, немного физкультуры:

– дальность прыжка в длину (в некоторых единицах).

Её не в состоянии предугадать даже мастер спорта 🙂

Тем не менее, ваши гипотезы?

Коль скоро, множество действительных чисел бесконечно, то случайная величина может принять бесконечно много значений из некоторого промежутка. И в этом состоит её принципиальное отличие от предыдущих примеров.

Таким образом, случайные величины целесообразно разделить на 2 большие группы:

1) Дискретная (прерывная) случайная величина – принимает отдельно взятые, изолированные значения. Количество этих значений конечно либо бесконечно, но счётно.

…нарисовались непонятные термины? Срочно повторяем основы алгебры!

2) Непрерывная случайная величина – принимает все числовые значения из некоторого конечного или бесконечного промежутка.

Примечание: в учебной литературе популярны аббревиатуры ДСВ и НСВ

Сначала разберём дискретную случайную величину, затем – непрерывную.

Закон распределения дискретной случайной величины

– это соответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон записывают таблицей:

Довольно часто встречается термин ряд распределения, но в некоторых ситуациях он звучит двусмысленно, и поэтому я буду придерживаться «закона».

А теперь очень важный момент: поскольку случайная величина обязательно примет одно из значений , то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице:

или, если записать свёрнуто:

Так, например, закон распределения вероятностей выпавших на кубике очков имеет следующий вид:

Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем иллюзию – они могут быть любыми:

Некоторая игра имеет следующий закон распределения выигрыша:

Найти

…наверное, вы давно мечтали о таких задачах 🙂 Открою секрет – я тоже. В особенности после того, как завершил работу над теорией поля.

Решение: так как случайная величина может принять только одно из трёх значений, то соответствующие события образуют полную группу, а значит, сумма их вероятностей равна единице:

Разоблачаем «партизана»:

– таким образом, вероятность выигрыша условных единиц составляет 0,4.

Контроль: , в чём и требовалось убедиться.

Ответ:

Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности, теоремы умножения / сложения вероятностей событий и другие фишки тервера:

В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по 100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.

Решение: как вы заметили, значения случайной величины принято располагать в порядке их возрастания. Поэтому мы начинаем с самого маленького выигрыша, и именно рублей.

Всего таковых билетов 50 – 12 = 38, и по классическому определению:
– вероятность того, что наудачу извлечённый билет окажется безвыигрышным.

С остальными случаями всё просто. Вероятность выигрыша рублей составляет:

И для :

Проверка: – и это особенно приятный момент таких заданий!

Ответ: искомый закон распределения выигрыша:

Следующее задание для самостоятельного решения:

Вероятность того, что стрелок поразит мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.

…я знал, что вы по нему соскучились 🙂 Вспоминаем теоремы умножения и сложения. Решение и ответ в конце урока.

Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь некоторые её числовые характеристики.

Математическое ожидание дискретной случайной величины

Говоря простым языком, это среднеожидаемое значение при многократном повторении испытаний. Пусть случайная величина принимает значения с вероятностями соответственно. Тогда математическое ожидание данной случайной величины равно сумме произведений всех её значений на соответствующие вероятности:

или в свёрнутом виде:

Вычислим, например, математическое ожидание случайной величины – количества выпавших на игральном кубике очков:

очка

В чём состоит вероятностный смысл полученного результата? Если подбросить кубик достаточно много раз, то среднее значение выпавших очков будет близкО к 3,5 – и чем больше провести испытаний, тем ближе. Собственно, об этом эффекте я уже подробно рассказывал на уроке о статистической вероятности.

Теперь вспомним нашу гипотетическую игру:

Возникает вопрос: а выгодно ли вообще играть в эту игру? …у кого какие впечатления? Так ведь «навскидку» и не скажешь! Но на этот вопрос можно легко ответить, вычислив математическое ожидание, по сути – средневзвешенный по вероятностям выигрыш:

, таким образом, математическое ожидание данной игры проигрышно.

Не верь впечатлениям – верь цифрам!

Да, здесь можно выиграть 10 и даже 20-30 раз подряд, но на длинной дистанции нас ждёт неминуемое разорение. И я бы не советовал вам играть в такие игры 🙂 Ну, может, только ради развлечения.

Из всего вышесказанного следует, что математическое ожидание – это уже НЕ СЛУЧАЙНАЯ величина.

Творческое задание для самостоятельного исследования:

Мистер Х играет в европейскую рулетку по следующей системе: постоянно ставит 100 рублей на «красное». Составить закон распределения случайной величины – его выигрыша. Вычислить математическое ожидание выигрыша и округлить его до копеек. Сколько в среднем проигрывает игрок с каждой поставленной сотни?

Справка: европейская рулетка содержит 18 красных, 18 чёрных и 1 зелёный сектор («зеро»). В случае выпадения «красного» игроку выплачивается удвоенная ставка, в противном случае она уходит в доход казино

Существует много других систем игры в рулетку, для которых можно составить свои таблицы вероятностей. Но это тот случай, когда нам не нужны никакие законы распределения и таблицы, ибо доподлинно установлено, что математическое ожидание игрока будет точно таким же. От системы к системе меняется лишь дисперсия, о которой мы узнаем во 2-й части урока.

Но прежде будет полезно размять пальцы на клавишах калькулятора:

Случайная величина задана своим законом распределения вероятностей:

Найти , если известно, что . Выполнить проверку.

Тогда переходим к изучению дисперсии дискретной случайной величины, и по возможности, ПРЯМО СЕЙЧАС!! – чтобы не потерять нить темы.

Решения и ответы:

Пример 3. Решение: по условию – вероятность попадания в мишень. Тогда:
– вероятность промаха.

Составим – закон распределения попаданий при двух выстрелах:

– ни одного попадания. По теореме умножения вероятностей независимых событий:

– одно попадание. По теоремам сложения вероятностей несовместных и умножения независимых событий:

– два попадания. По теореме умножения вероятностей независимых событий:

Проверка: 0,09 + 0,42 + 0,49 = 1

Ответ:

Примечание: можно было использовать обозначения – это не принципиально.

Пример 4. Решение: игрок выигрывает 100 рублей в 18 случаях из 37, и поэтому закон распределения его выигрыша имеет следующий вид:

Вычислим математическое ожидание:

Таким образом, с каждой поставленной сотни игрок в среднем проигрывает 2,7 рубля.

Пример 5. Решение: по определению математического ожидания:

поменяем части местами и проведём упрощения:

таким образом:

Выполним проверку:

, что и требовалось проверить.

Ответ:

Автор: Емелин Александр

(Переход на главную страницу)

Качественные работы без плагиата – Zaochnik.com

mathprofi.ru

3.1. Случайная величина и ее распределение

Случайной величиной наЗЫвается переменная, которая может принимать в зависимости от исходов испытания те или иные случайные значения.

Если при этом переменная принимает последовательные различные значения и известны вероятности каждого из них; то она называется Дискретной случайной величиной. Дискретная случайная величина Х определена, если даны все ее возможные значения , число которых может быть как конечным, так и бесконечным, и соответствующие вероятности

Это задание представляется таблицей Распределения,

В котороЙ значения Х располагаются в строго возрастающем порядке. При этом сумма соответствующих этИМ значениям вероятностей равна 1, так как все возможные значения случайной величины представляют полную систему событий.

В случае конечного числа K возможных значений эта сумма запишется в виде

Для дискретной случайной величины с бесконечным множеством возможных значений эта сумма будет представлять собой ряд.

Представленная в виде таблицы совокупность всех значений случайной величины и соответственных вероятностей каждой из них или, что то же, функция Р(х), связывающая значения с соответствующими вероятностями, является Законом распределения случайной величины.

Примерами дискретных случайных величин являются:

1) число грузовых машин, проезжающих за один час через контрольный пункт автоинспекции;

2) сумма выигрыша, приходящегося на один билет денежно-вещевой лотереи;

3) число ничейных результатов в шахматном турнире;

4) число отличных оценок у студентов одной группы на экзамене.

Пример 1. Составить закон распределения случайной величины — числа появлений события А при П повторных независимых испытаниях, если вероятность появления этого события в отдельном испытании очень мала.

Решение. Вероятность появления события А M раз в испытаниях определяется формулой Пуассона

Соответствующая таблица распределения имеет такой вид:

matica.org.ua

2.2. Вероятностно-статистические методы описания неопределенностей в теории принятия решений

2.2.4. Случайные величины и их распределения

Распределения случайных величин и функции распределения. Распределение числовой случайной величины – это функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.

Первое – если случайная величина принимает конечное число значений. Тогда распределение задается функцией Р(Х = х), ставящей каждому возможному значению х случайной величины Х вероятность того, что Х = х.

Второе – если случайная величина принимает бесконечно много значений. Это возможно лишь тогда, когда вероятностное пространство, на котором определена случайная величина, состоит из бесконечного числа элементарных событий. Тогда распределение задается набором вероятностей P(a [1] при увеличении аргумента – от 0 при до 1 при . Случайные величины, имеющие непрерывные функции распределения, называют непрерывными.

Непрерывные функции распределения, используемые в вероятностно-статистических методах принятия решений, имеют производные. Первая производная f(x) функции распределения F(x) называется плотностью вероятности,

По плотности вероятности можно определить функцию распределения:

Для любой функции распределения

Перечисленные свойства функций распределения постоянно используются в вероятностно-статистических методах принятия решений. В частности, из последнего равенства вытекает конкретный вид констант в формулах для плотностей вероятностей, рассматриваемых ниже.

Пример 2. Часто используется следующая функция распределения:

(1)

где a и b – некоторые числа, a 0.

Характеристики случайных величин. В вероятностно-статистических методах принятия решений используется ряд характеристик случайных величин, выражающихся через функции распределения и плотности вероятностей.

При описании дифференциации доходов, при нахождении доверительных границ для параметров распределений случайных величин и во многих иных случаях используется такое понятие, как «квантиль порядка р», где 0 b.

Для дискретных распределений, как правило, не существует хр, удовлетворяющих уравнению (2). Точнее, если распределение случайной величины дается табл.1, где x1 x0,5) = Ѕ.

Медиана указывает «центр» распределения. С точки зрения одной из современных концепций – теории устойчивых статистических процедур – медиана является более хорошей характеристикой случайной величины, чем математическое ожидание [2,7]. При обработке результатов измерений в порядковой шкале (см. главу о теории измерений) медианой можно пользоваться, а математическим ожиданием – нет.

Ясный смысл имеет такая характеристика случайной величины, как мода – значение (или значения) случайной величины, соответствующее локальному максимуму плотности вероятности для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины.

Если x0 – мода случайной величины с плотностью f(x), то, как известно из дифференциального исчисления, .

У случайной величины может быть много мод. Так, для равномерного распределения (1) каждая точка х такая, что a x0.

Отметим еще одно свойство симметричных распределений, постоянно используемое в вероятностно-статистических методах принятия решений и других прикладных исследованиях. Для непрерывной функции распределения

P(|X| 0. Он измеряет разброс в относительных единицах, в то время как среднее квадратическое отклонение – в абсолютных.

Пример 6. Для равномерно распределенной случайной величины Х найдем дисперсию, среднеквадратическое отклонение и коэффициент вариации. Дисперсия равна:

Замена переменной дает возможность записать:

где c = (b a)/2. Следовательно, среднее квадратическое отклонение равно а коэффициент вариации таков:

По каждой случайной величине Х определяют еще три величины – центрированную Y, нормированную V и приведенную U. Центрированная случайная величина Y – это разность между данной случайной величиной Х и ее математическим ожиданием М(Х), т.е. Y = Х – М(Х). Математическое ожидание центрированной случайной величины Y равно 0, а дисперсия – дисперсии данной случайной величины: М(Y) = 0, D(Y) = D(X). Функция распределения FY(x) центрированной случайной величины Y связана с функцией распределения F(x) исходной случайной величины X соотношением:

Для плотностей этих случайных величин справедливо равенство

Нормированная случайная величина V – это отношение данной случайной величины Х к ее среднему квадратическому отклонению , т.е. . Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики Х так:

,

где v – коэффициент вариации исходной случайной величины Х. Для функции распределения FV(x) и плотности fV(x) нормированной случайной величины V имеем:

,

где F(x) – функция распределения исходной случайной величины Х, а f(x) – ее плотность вероятности.

Приведенная случайная величина U – это центрированная и нормированная случайная величина:

.

Для приведенной случайной величины

. (7)

Нормированные, центрированные и приведенные случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства позволяют упростить обоснования методов, формулировки теорем и расчетные формулы.

Используются преобразования случайных величин и более общего плана. Так, если Y = aX + b, где a и b – некоторые числа, то

(8)

Пример 7. Если то Y – приведенная случайная величина, и формулы (8) переходят в формулы (7).

С каждой случайной величиной Х можно связать множество случайных величин Y, заданных формулой Y = aX + b при различных a>0 и b. Это множество называют масштабно-сдвиговым семейством, порожденным случайной величиной Х. Функции распределения FY(x) составляют масштабно сдвиговое семейство распределений, порожденное функцией распределения F(x). Вместо Y = aX + b часто используют запись

(9)

Число с называют параметром сдвига, а число d — параметром масштаба. Формула (9) показывает, что Х – результат измерения некоторой величины – переходит в У – результат измерения той же величины, если начало измерения перенести в точку с, а затем использовать новую единицу измерения, в d раз большую старой.

Для масштабно-сдвигового семейства (9) распределение Х называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-распределение и др. (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины Х рассматривают Y = lg X, где lg X – десятичный логарифм числа Х. Цепочка равенств

связывает функции распределения Х и Y.

При обработке данных используют такие характеристики случайной величины Х как моменты порядка q, т.е. математические ожидания случайной величины X q , q = 1, 2, … Так, само математическое ожидание – это момент порядка 1. Для дискретной случайной величины момент порядка q может быть рассчитан как

Для непрерывной случайной величины

Моменты порядка q называют также начальными моментами порядка q, в отличие от родственных характеристик – центральных моментов порядка q, задаваемых формулой

Так, дисперсия – это центральный момент порядка 2.

Нормальное распределение и центральная предельная теорема. В вероятностно-статистических методах принятия решений часто идет речь о нормальном распределении. Иногда его пытаются использовать для моделирования распределения исходных данных (эти попытки не всегда являются обоснованными – см. ниже). Более существенно, что многие методы обработки данных основаны на том, что расчетные величины имеют распределения, близкие к нормальному.

Пусть X1, X2,…, Xn, …– независимые одинаково распределенные случайные величины с математическими ожиданиями M(Xi) = m и дисперсиями D(Xi) = , i = 1, 2,…, n,… Как следует из результатов предыдущей главы,

Рассмотрим приведенную случайную величину Un для суммы , а именно,

Центральная предельная теорема (для одинаково распределенных слагаемых). Пусть X1, X2,…, Xn, …– независимые одинаково распределенные случайные величины с математическими ожиданиями M(Xi) = m и дисперсиями D(Xi) = , i = 1, 2,…, n,… Тогда для любого х существует предел

где Ф(х) – функция стандартного нормального распределения.

Подробнее о функции Ф(х) – ниже (читается «фи от икс», поскольку Ф – греческая прописная буква «фи»).

Центральная предельная теорема (ЦПТ) носит свое название по той причине, что она является центральным, наиболее часто применяющимся математическим результатом теории вероятностей и математической статистики. История ЦПТ занимает около 200 лет – с 1730 г., когда английский математик А.Муавр (1667-1754) опубликовал первый результат, относящийся к ЦПТ (см. ниже о теореме Муавра-Лапласа), до двадцатых – тридцатых годов ХХ в., когда финн Дж.У. Линдеберг, француз Поль Леви (1886-1971), югослав В. Феллер (1906-1970), русский А.Я. Хинчин (1894-1959) и другие ученые получили необходимые и достаточные условия справедливости классической центральной предельной теоремы.

Развитие рассматриваемой тематики на этом отнюдь не прекратилось – изучали случайные величины, не имеющие дисперсии, т.е. те, для которых

(академик Б.В.Гнеденко и др.), ситуацию, когда суммируются случайные величины (точнее, случайные элементы) более сложной природы, чем числа (академики Ю.В.Прохоров, А.А.Боровков и их соратники), и т.д.

Функция распределения Ф(х) задается равенством

,

где — плотность стандартного нормального распределения, имеющая довольно сложное выражение:

.

Здесь =3,1415925… — известное в геометрии число, равное отношению длины окружности к диаметру, e = 2,718281828… — основание натуральных логарифмов (для запоминания этого числа обратите внимание, что 1828 – год рождения писателя Л.Н.Толстого). Как известно из математического анализа,

При обработке результатов наблюдений функцию нормального распределения не вычисляют по приведенным формулам, а находят с помощью специальных таблиц или компьютерных программ. Лучшие на русском языке «Таблицы математической статистики» составлены членами-корреспондентами АН СССР Л.Н. Большевым и Н.В.Смирновым [8].

Вид плотности стандартного нормального распределения вытекает из математической теории, которую не имеем возможности здесь рассматривать, равно как и доказательство ЦПТ.

Для иллюстрации приводим небольшие таблицы функции распределения Ф(х) (табл.2) и ее квантилей (табл.3). Функция Ф(х) симметрична относительно 0, что отражается в табл.2-3.

Функция стандартного нормального распределения.

Если случайная величина Х имеет функцию распределения Ф(х), то М(Х) = 0, D(X) = 1. Это утверждение доказывается в теории вероятностей, исходя из вида плотности вероятностей . Оно согласуется с аналогичным утверждением для характеристик приведенной случайной величины Un, что вполне естественно, поскольку ЦПТ утверждает, что при безграничном возрастании числа слагаемых функция распределения Un стремится к функции стандартного нормального распределения Ф(х), причем при любом х.

Квантили стандартного нормального распределения.

Квантиль порядка р

Введем понятие семейства нормальных распределений. По определению нормальным распределением называется распределение случайной величины Х, для которой распределение приведенной случайной величины есть Ф(х). Как следует из общих свойств масштабно-сдвиговых семейств распределений (см. выше), нормальное распределение – это распределение случайной величины

,

где Х – случайная величина с распределением Ф(Х), причем m = M(Y), = D(Y). Нормальное распределение с параметрами сдвига m и масштаба обычно обозначается N(m, ) (иногда используется обозначение N(m, )).

Как следует из (8), плотность вероятности нормального распределения N(m, ) есть

Нормальные распределения образуют масштабно-сдвиговое семейство. При этом параметром масштаба является d = 1/ , а параметром сдвига c = — m/ .

Для центральных моментов третьего и четвертого порядка нормального распределения справедливы равенства

Эти равенства лежат в основе классических методов проверки того, что результаты наблюдений подчиняются нормальному распределению. В настоящее время нормальность обычно рекомендуется проверять по критерию W Шапиро – Уилка. Проблема проверки нормальности обсуждается ниже.

Если случайные величины Х1 и Х2 имеют функции распределения N(m1, 1) и N(m2, 2) соответственно, то Х1 + Х2 имеет распределение Следовательно, если случайные величины X1, X2,…, Xn независимы и имеют одно и тоже распределение N(m, ), то их среднее арифметическое

имеет распределение N(m, ). Эти свойства нормального распределения постоянно используются в различных вероятностно-статистических методах принятия решений, в частности, при статистическом регулировании технологических процессов и в статистическом приемочном контроле по количественному признаку.

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных.

Распределение (хи — квадрат) – распределение случайной величины

где случайные величины X1, X2,…, Xn независимы и имеют одно и тоже распределение N(0,1). При этом число слагаемых, т.е. n, называется «числом степеней свободы» распределения хи – квадрат.

Распределение t Стьюдента – это распределение случайной величины

где случайные величины U и X независимы, U имеет распределение стандартное нормальное распределение N(0,1), а X – распределение хи – квадрат с n степенями свободы. При этом n называется «числом степеней свободы» распределения Стьюдента. Это распределение было введено в 1908 г. английским статистиком В. Госсетом, работавшем на фабрике, выпускающей пиво. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому ее руководство запрещало В. Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных В. Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета — Стьюдента показывает, что еще сто лет менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов принятия решений.

Распределение Фишера – это распределение случайной величины

где случайные величины Х1 и Х2 независимы и имеют распределения хи – квадрат с числом степеней свободы k1 и k2 соответственно. При этом пара (k1, k2) – пара «чисел степеней свободы» распределения Фишера, а именно, k1 – число степеней свободы числителя, а k2 – число степеней свободы знаменателя. Распределение случайной величины F названо в честь великого английского статистика Р.Фишера (1890-1962), активно использовавшего его в своих работах.

Выражения для функций распределения хи — квадрат, Стьюдента и Фишера, их плотностей и характеристик, а также таблицы можно найти в специальной литературе (см., например, [8]).

Как уже отмечалось, нормальные распределения в настоящее время часто используют в вероятностных моделях в различных прикладных областях. В чем причина такой широкой распространенности этого двухпараметрического семейства распределений? Она проясняется следующей теоремой.

Тогда при справедливости некоторых условий, обеспечивающих малость вклада любого из слагаемых в Un,

Условия, о которых идет речь, не будем здесь формулировать. Их можно найти в специальной литературе (см., например, [6]). «Выяснение условий, при которых действует ЦПТ, составляет заслугу выдающихся русских ученых А.А.Маркова (1857-1922) и, в особенности, А.М.Ляпунова (1857-1918)» [9, с.197].

Центральная предельная теорема показывает, что в случае, когда результат измерения (наблюдения) складывается под действием многих причин, причем каждая из них вносит лишь малый вклад, а совокупный итог определяется аддитивно, т.е. путем сложения, то распределение результата измерения (наблюдения) близко к нормальному.

Иногда считают, что для нормальности распределения достаточно того, что результат измерения (наблюдения) Х формируется под действием многих причин, каждая из которых оказывает малое воздействие. Это не так. Важно, как эти причины действуют. Если аддитивно – то Х имеет приближенно нормальное распределение. Если мультипликативно (т.е. действия отдельных причин перемножаются, а не складываются), то распределение Х близко не к нормальному, а к т.н. логарифмически нормальному, т.е. не Х, а lg X имеет приблизительно нормальное распределение. Если же нет оснований считать, что действует один из этих двух механизмов формирования итогового результата (или какой-либо иной вполне определенный механизм), то про распределение Х ничего определенного сказать нельзя.

Из сказанного вытекает, что в конкретной прикладной задаче нормальность результатов измерений (наблюдений), как правило, нельзя установить из общих соображений, ее следует проверять с помощью статистических критериев. Или же использовать непараметрические статистические методы, не опирающиеся на предположения о принадлежности функций распределения результатов измерений (наблюдений) к тому или иному параметрическому семейству.

Непрерывные распределения, используемые в вероятностно-статистических методах принятия решений. Кроме масштабно-сдвигового семейства нормальных распределений, широко используют ряд других семейств распределения – логарифмически нормальных, экспоненциальных, Вейбулла-Гнеденко, гамма-распределений. Рассмотрим эти семейства.

Случайная величина Х имеет логарифмически нормальное распределение, если случайная величина Y = lg X имеет нормальное распределение. Тогда Z = ln X = 2,3026…Y также имеет нормальное распределение N(a11), где ln X — натуральный логарифм Х. Плотность логарифмически нормального распределения такова:

Из центральной предельной теоремы следует, что произведение X = X1X2Xn независимых положительных случайных величин Xi, i = 1, 2,…, n, при больших n можно аппроксимировать логарифмически нормальным распределением. В частности, мультипликативная модель формирования заработной платы или дохода приводит к рекомендации приближать распределения заработной платы и дохода логарифмически нормальными законами. Для России эта рекомендация оказалась обоснованной — статистические данные подтверждают ее.

Имеются и другие вероятностные модели, приводящие к логарифмически нормальному закону. Классический пример такой модели дан А.Н.Колмогоровым [10], который из физически обоснованной системы постулатов вывел заключение о том, что размеры частиц при дроблении кусков руды, угля и т.п. на шаровых мельницах имеют логарифмически нормальное распределение.

Перейдем к другому семейству распределений, широко используемому в различных вероятностно-статистических методах принятия решений и других прикладных исследованиях, — семейству экспоненциальных распределений. Начнем с вероятностной модели, приводящей к таким распределениям. Для этого рассмотрим «поток событий», т.е. последовательность событий, происходящих одно за другим в какие-то моменты времени. Примерами могут служить: поток вызовов на телефонной станции; поток отказов оборудования в технологической цепочке; поток отказов изделий при испытаниях продукции; поток обращений клиентов в отделение банка; поток покупателей, обращающихся за товарами и услугами, и т.д. В теории потоков событий справедлива теорема, аналогичная центральной предельной теореме, но в ней речь идет не о суммировании случайных величин, а о суммировании потоков событий. Рассматривается суммарный поток, составленный из большого числа независимых потоков, ни один из которых не оказывает преобладающего влияния на суммарный поток. Например, поток вызовов, поступающих на телефонную станцию, слагается из большого числа независимых потоков вызовов, исходящих от отдельных абонентов. Доказано [6], что в случае, когда характеристики потоков не зависят от времени, суммарный поток полностью описывается одним числом — интенсивностью потока. Для суммарного потока рассмотрим случайную величину Х — длину промежутка времени между последовательными событиями. Ее функция распределения имеет вид

(10)

Это распределение называется экспоненциальным распределением, т.к. в формуле (10) участвует экспоненциальная функция e x . Величина 1/λ — масштабный параметр. Иногда вводят и параметр сдвига с, экспоненциальным называют распределение случайной величины Х + с, где распределение Х задается формулой (10).

Экспоненциальные распределения — частный случай т. н. распределений Вейбулла — Гнеденко. Они названы по фамилиям инженера В. Вейбулла, введшего эти распределения в практику анализа результатов усталостных испытаний, и математика Б.В.Гнеденко (1912-1995), получившего такие распределения в качестве предельных при изучении максимального из результатов испытаний. Пусть Х — случайная величина, характеризующая длительность функционирования изделия, сложной системы, элемента (т.е. ресурс, наработку до предельного состояния и т.п.), длительность функционирования предприятия или жизни живого существа и т.д. Важную роль играет интенсивность отказа

(11)

где F(x) и f(x) — функция распределения и плотность случайной величины Х.

Опишем типичное поведение интенсивности отказа. Весь интервал времени можно разбить на три периода. На первом из них функция λ(х) имеет высокие значения и явную тенденцию к убыванию (чаще всего она монотонно убывает). Это можно объяснить наличием в рассматриваемой партии единиц продукции с явными и скрытыми дефектами, которые приводят к относительно быстрому выходу из строя этих единиц продукции. Первый период называют «периодом приработки» (или «обкатки»). Именно на него обычно распространяется гарантийный срок.

Затем наступает период нормальной эксплуатации, характеризующийся приблизительно постоянной и сравнительно низкой интенсивностью отказов. Природа отказов в этот период носит внезапный характер (аварии, ошибки эксплуатационных работников и т.п.) и не зависит от длительности эксплуатации единицы продукции.

Наконец, последний период эксплуатации — период старения и износа. Природа отказов в этот период — в необратимых физико-механических и химических изменениях материалов, приводящих к прогрессирующему ухудшению качества единицы продукции и окончательному выходу ее из строя.

Каждому периоду соответствует свой вид функции λ(х). Рассмотрим класс степенных зависимостей

где λ0 > 0 и b > 0 — некоторые числовые параметры. Значения b 1 отвечают виду интенсивности отказов в периоды приработки, нормальной эксплуатации и старения соответственно.

Соотношение (11) при заданной интенсивности отказа λ(х) — дифференциальное уравнение относительно функции F(x). Из теории дифференциальных уравнений следует, что

(13)

Подставив (12) в (13), получим, что

(14)

Распределение, задаваемое формулой (14) называется распределением Вейбулла — Гнеденко. Поскольку

(15)

то из формулы (14) следует, что величина а, задаваемая формулой (15), является масштабным параметром. Иногда вводят и параметр сдвига, т.е. функциями распределения Вейбулла — Гнеденко называют F(xc), где F(x) задается формулой (14) при некоторых λ0 и b.

Плотность распределения Вейбулла — Гнеденко имеет вид

(16)

где a > 0 — параметр масштаба, b > 0 — параметр формы, с — параметр сдвига. При этом параметр а из формулы (16) связан с параметром λ0 из формулы (14) соотношением, указанным в формуле (15).

Экспоненциальное распределение — весьма частный случай распределения Вейбулла — Гнеденко, соответствующий значению параметра формы b = 1.

Распределение Вейбулла — Гнеденко применяется также при построении вероятностных моделей ситуаций, в которых поведение объекта определяется «наиболее слабым звеном». Подразумевается аналогия с цепью, сохранность которой определяется тем ее звеном, которое имеет наименьшую прочность. Другими словами, пусть X1, X2,…, Xn — независимые одинаково распределенные случайные величины,

В ряде прикладных задач большую роль играют X(1) и X(n), в частности, при исследовании максимально возможных значений («рекордов») тех или иных значений, например, страховых выплат или потерь из-за коммерческих рисков, при изучении пределов упругости и выносливости стали, ряда характеристик надежности и т.п. Показано, что при больших n распределения X(1) и X(n), как правило, хорошо описываются распределениями Вейбулла — Гнеденко. Основополагающий вклад в изучение распределений X(1) и X(n) внес советский математик Б.В.Гнеденко. Использованию полученных результатов в экономике, менеджменте, технике и других областях посвящены труды В. Вейбулла, Э. Гумбеля, В.Б. Невзорова, Э.М. Кудлаева и многих иных специалистов.

Перейдем к семейству гамма-распределений. Они широко применяются в экономике и менеджменте, теории и практике надежности и испытаний, в различных областях техники, метеорологии и т.д. В частности, гамма-распределению подчинены во многих ситуациях такие величины, как общий срок службы изделия, длина цепочки токопроводящих пылинок, время достижения изделием предельного состояния при коррозии, время наработки до k-го отказа, k = 1, 2, …, и т.д. Продолжительность жизни больных хроническими заболеваниями, время достижения определенного эффекта при лечении в ряде случаев имеют гамма-распределение. Это распределение наиболее адекватно для описания спроса в экономико-математических моделях управления запасами (логистики).

Плотность гама-распределения имеет вид

(17)

Плотность вероятности в формуле (17) определяется тремя параметрами a, b, c, где a>0, b>0. При этом a является параметром формы, b — параметром масштаба и с — параметром сдвига. Множитель 1/Γ(а) является нормировочным, он введен, чтобы

Здесь Γ(а) — одна из используемых в математике специальных функций, так называемая «гамма-функция», по которой названо и распределение, задаваемое формулой (17),

При фиксированном а формула (17) задает масштабно-сдвиговое семейство распределений, порождаемое распределением с плотностью

(18)

Распределение вида (18) называется стандартным гамма-распределением. Оно получается из формулы (17) при b = 1 и с = 0.

Частным случаем гамма-распределений при а = 1 являются экспоненциальные распределения (с λ = 1/b). При натуральном а и с=0 гамма-распределения называются распределениями Эрланга. С работ датского ученого К.А.Эрланга (1878-1929), сотрудника Копенгагенской телефонной компании, изучавшего в 1908-1922 гг. функционирование телефонных сетей, началось развитие теории массового обслуживания. Эта теория занимается вероятностно-статистическим моделированием систем, в которых происходит обслуживание потока заявок, с целью принятия оптимальных решений. Распределения Эрланга используют в тех же прикладных областях, в которых применяют экспоненциальные распределения. Это основано на следующем математическом факте: сумма k независимых случайных величин, экспоненциально распределенных с одинаковыми параметрами λ и с, имеет гамма-распределение с параметром формы а = k, параметром масштаба b = 1/λ и параметром сдвига kc. При с = 0 получаем распределение Эрланга.

Если случайная величина X имеет гамма-распределение с параметром формы а таким, что d = 2a — целое число, b = 1 и с = 0, то 2Х имеет распределение хи-квадрат с d степенями свободы.

Случайная величина X с гвмма-распределением имеет следующие характеристики:

— коэффициент вариации

— асимметрию

— эксцесс

Нормальное распределение — предельный случай гамма-распределения. Точнее, пусть Z — случайная величина, имеющая стандартное гамма-распределение, заданное формулой (18). Тогда

для любого действительного числа х, где Ф(х) — функция стандартного нормального распределения N(0,1).

В прикладных исследованиях используются и другие параметрические семейства распределений, из которых наиболее известны система кривых Пирсона, ряды Эджворта и Шарлье. Здесь они не рассматриваются.

Дискретные распределения, используемые в вероятностно-статистических методах принятия решений. Наиболее часто используют три семейства дискретных распределений — биномиальных, гипергеометрических и Пуассона, а также некоторые другие семейства — геометрических, отрицательных биномиальных, мультиномиальных, отрицательных гипергеометрических и т.д.

Как уже говорилось, биномиальное распределение имеет место при независимых испытаниях, в каждом из которых с вероятностью р появляется событие А. Если общее число испытаний n задано, то число испытаний Y, в которых появилось событие А, имеет биномиальное распределение. Для биномиального распределения вероятность принятия случайной величиной Y значения y определяется формулой

(19)

— число сочетаний из n элементов по y, известное из комбинаторики. Для всех y, кроме 0, 1, 2, …, n, имеем P(Y=y)=0. Биномиальное распределение при фиксированном объеме выборки n задается параметром p, т.е. биномиальные распределения образуют однопараметрическое семейство. Они применяются при анализе данных выборочных исследований [2], в частности, при изучении предпочтений потребителей, выборочном контроле качества продукции по планам одноступенчатого контроля, при испытаниях совокупностей индивидуумов в демографии, социологии, медицине, биологии и др.

Если Y1 и Y2 — независимые биномиальные случайные величины с одним и тем же параметром p0, определенные по выборкам с объемами n1 и n2 соответственно, то Y1 + Y2 — биномиальная случайная величина, имеющая распределение (19) с р = p0 и n = n1 + n2. Это замечание расширяет область применимости биномиального распределения, позволяя объединять результаты нескольких групп испытаний, когда есть основания полагать, что всем этим группам соответствует один и тот же параметр.

Характеристики биномиального распределения вычислены ранее:

В разделе «События и вероятности» для биномиальной случайной величины доказан закон больших чисел:

для любого . С помощью центральной предельной теоремы закон больших чисел можно уточнить, указав, насколько Y/n отличается от р.

Теорема Муавра-Лапласа. Для любых чисел a и b, a 10n. Если при этом сделать замену p = D/N, то выражения для математического ожидания и дисперсии гипергеометрического распределения перейдут в выражения для математического ожидания и дисперсии биномиального распределения. Это не случайно. Можно показать, что

и этим предельным соотношением можно пользоваться при N>10n.

Третье широко используемое дискретное распределение – распределение Пуассона. Случайная величина Y имеет распределение Пуассона, если

,

где λ – параметр распределения Пуассона, и P(Y=y)=0 для всех прочих y (при y=0 обозначено 0! =1). Для распределения Пуассона

Это распределение названо в честь французского математика С.Д.Пуассона (1781-1840), впервые получившего его в 1837 г. Распределение Пуассона является предельным случаем биномиального распределения, когда вероятность р осуществления события мала, но число испытаний n велико, причем np = λ. Точнее, справедливо предельное соотношение

Поэтому распределение Пуассона (в старой терминологии «закон распределения») часто называют также «законом редких событий».

Распределение Пуассона возникает в теории потоков событий (см. выше). Доказано, что для простейшего потока с постоянной интенсивностью Λ число событий (вызовов), происшедших за время t, имеет распределение Пуассона с параметром λ = Λt. Следовательно, вероятность того, что за время t не произойдет ни одного события, равна e Λ t , т.е. функция распределения длины промежутка между событиями является экспоненциальной.

Распределение Пуассона используется при анализе результатов выборочных маркетинговых обследований потребителей, расчете оперативных характеристик планов статистического приемочного контроля в случае малых значений приемочного уровня дефектности, для описания числа разладок статистически управляемого технологического процесса в единицу времени, числа «требований на обслуживание», поступающих в единицу времени в систему массового обслуживания, статистических закономерностей несчастных случаев и редких заболеваний, и т.д.

Описание иных параметрических семейств дискретных распределений и возможности их практического использования рассматриваются в литературе.

[1] В некоторых случаях, например, при изучении цен, объемов выпуска или суммарной наработки на отказ в задачах надежности, функции распределения постоянны на некоторых интервалах, в которые значения исследуемых случайных величин не могут попасть.

www.aup.ru

Смотрите так же:

  • Лучший адвокат севастополь Адвокат Кирюников. Цены услуг. Бесплатная консультация по телефону! (Севастополь, Симферополь, Крым). Хотите дельный совет? Звоните, бесплатная юридическая консультация по телефону или онлайн через мессенджер будет получена Вами прямо сейчас! +79787472333 Главный вопрос граждан, […]
  • Судебная экспертиза мурманской области Центр Судебных экспертиз ННИУ «Центр Судебных экспертиз» - это независимое учреждение, специализированная региональная судебно-экспертная организация в Мурманске. Мы занимаемся только экспертизами, исследованиями и оценочной деятельностью, только тем, что требует высочайшей квалификации […]
  • Договор купли продажи для пчел xuenpk … 0 Анна Па… 0 Светлан… 0 Анастас… 0 Категории блога Договор купли продажи пчелопакетов Скачать Договор купли продажи пчелопакетов Информация о файле:Загружен: 09.04.2013 Скачан раз: 255 Рейтинг: 223 Средняя скорость скачивания: 5390 КБ/сек. Похожих файлов: 15 Как […]
  • Физические законы и физические гипотезы Научные методы познания окружающего мира. Роль эксперимента и теории в процессе познания. Научные гипотезы. Физические законы… ФИЗИКА – наука, занимающаяся изучением простейших и вместе с тем наиболее общих свойств окружающего нас материального мира. Физика – всеобъемлющая наука. […]
  • Как посчитать в экселе стаж работы Как посчитать возраст или стаж в Excel? Рассмотрим возможности расчета стажа или возраста человека в Excel в полных годах, месяцах или днях. Для расчета интервала между двумя датами воспользуемся функцией РАЗНДАТ. Данную формулу нельзя найти через мастер функций, однако если ввести ее […]
  • Получения гражданства рф по браку Получение гражданства РФ по браку Как получить гражданство РФ по браку, может быть интересно обеим сторонам, вступившим в брачные отношения. Ведь по российскому законодательству брак с гражданином РФ является основанием для применения упрощенного порядка выдачи российского паспорта, при […]
  • Юристы мчс россии Юристы мчс россии Сотрудники МЧС являются особо уважаемой категорией людей в Российской Федерации. Благодаря их подвигам, жители нашей страны имеют возможность получить квалифицированную помощь при чрезвычайных происшествиях. Поэтому сотрудники МЧС находятся под отдельной защитой . Никто […]
  • Жалоба на председателя профсоюза Жалоба профсоюза председателю суда Свободный профсоюз рабочих полоцкого завода Стекловолокно 16 января направил жалобу председателю витебского областного суда. Профсоюз недоволен действиями судьи Натальи Хилькевич, которая (по мнению рабочих) оскорбила активистов профсоюза СПБ при […]