Нормальное распределение. Нормальный закон распределения Плотность нормально распределенной случайной величины

(вещественный, строго положительный)

Норма́льное распределе́ние , также называемое распределением Гаусса или Гаусса - Лапласа - распределение вероятностей , которое в одномерном случае задаётся функцией плотности вероятности , совпадающей с функцией Гаусса :

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , {\displaystyle f(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}\;e^{-{\frac {(x-\mu)^{2}}{2\sigma ^{2}}}},}

где параметр μ - математическое ожидание (среднее значение), медиана и мода распределения, а параметр σ - среднеквадратическое отклонение ( σ  ² - дисперсия) распределения.

Таким образом, одномерное нормальное распределение является двухпараметрическим семейством распределений. Многомерный случай описан в статье «Многомерное нормальное распределение ».

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием μ = 0 и стандартным отклонением σ = 1 .

Энциклопедичный YouTube

  • 1 / 5

    Важное значение нормального распределения во многих областях науки (например, в математической статистике и статистической физике) вытекает из центральной предельной теоремы теории вероятностей . Если результат наблюдения является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то при увеличении числа слагаемых распределение центрированного и нормированного результата стремится к нормальному. Этот закон теории вероятностей имеет следствием широкое распространение нормального распределения, что и стало одной из причин его наименования.

    Свойства

    Моменты

    Если случайные величины X 1 {\displaystyle X_{1}} и X 2 {\displaystyle X_{2}} независимы и имеют нормальное распределение с математическими ожиданиями μ 1 {\displaystyle \mu _{1}} и μ 2 {\displaystyle \mu _{2}} и дисперсиями σ 1 2 {\displaystyle \sigma _{1}^{2}} и σ 2 2 {\displaystyle \sigma _{2}^{2}} соответственно, то X 1 + X 2 {\displaystyle X_{1}+X_{2}} также имеет нормальное распределение с математическим ожиданием μ 1 + μ 2 {\displaystyle \mu _{1}+\mu _{2}} и дисперсией σ 1 2 + σ 2 2 . {\displaystyle \sigma _{1}^{2}+\sigma _{2}^{2}.} Отсюда вытекает, что нормальная случайная величина представима как сумма произвольного числа независимых нормальных случайных величин.

    Максимальная энтропия

    Нормальное распределение имеет максимальную дифференциальную энтропию среди всех непрерывных распределений, дисперсия которых не превышает заданную величину .

    Моделирование нормальных псевдослучайных величин

    Простейшие приближённые методы моделирования основываются на центральной предельной теореме . Именно, если сложить несколько независимых одинаково распределённых величин с конечной дисперсией , то сумма будет распределена приблизительно нормально. Например, если сложить 100 независимых стандартно равномерно  распределённых случайных величин, то распределение суммы будет приближённо нормальным .

    Для программного генерирования нормально распределённых псевдослучайных величин предпочтительнее использовать преобразование Бокса - Мюллера . Оно позволяет генерировать одну нормально распределённую величину на базе одной равномерно распределённой.

    Нормальное распределение в природе и приложениях

    Нормальное распределение часто встречается в природе. Например, следующие случайные величины хорошо моделируются нормальным распределением:

    • отклонение при стрельбе.
    • погрешности измерений (однако погрешности некоторых измерительных приборов имеют не нормальные распределения).
    • некоторые характеристики живых организмов в популяции.

    Такое широкое распространение этого распределения связано с тем, что оно является бесконечно делимым непрерывным распределением с конечной дисперсией. Поэтому к нему в пределе приближаются некоторые другие, например, биномиальное и пуассоновское . Этим распределением моделируются многие не детерминированные физические процессы.

    Связь с другими распределениями

    • Нормальное распределение является распределением Пирсона типа XI .
    • Отношение пары независимых стандартных нормально распределенных случайных величин имеет распределение Коши . То есть, если случайная величина X {\displaystyle X} представляет собой отношение X = Y / Z {\displaystyle X=Y/Z} (где Y {\displaystyle Y} и Z {\displaystyle Z} - независимые стандартные нормальные случайные величины), то она будет обладать распределением Коши.
    • Если z 1 , … , z k {\displaystyle z_{1},\ldots ,z_{k}} - совместно независимые стандартные нормальные случайные величины, то есть z i ∼ N (0 , 1) {\displaystyle z_{i}\sim N\left(0,1\right)} , то случайная величина x = z 1 2 + … + z k 2 {\displaystyle x=z_{1}^{2}+\ldots +z_{k}^{2}} имеет распределение хи-квадрат с k степенями свободы.
    • Если случайная величина X {\displaystyle X} подчинена логнормальному распределению , то её натуральный логарифм имеет нормальное распределение. То есть, если X ∼ L o g N (μ , σ 2) {\displaystyle X\sim \mathrm {LogN} \left(\mu ,\sigma ^{2}\right)} , то Y = ln ⁡ (X) ∼ N (μ , σ 2) {\displaystyle Y=\ln \left(X\right)\sim \mathrm {N} \left(\mu ,\sigma ^{2}\right)} . И наоборот, если Y ∼ N (μ , σ 2) {\displaystyle Y\sim \mathrm {N} \left(\mu ,\sigma ^{2}\right)} , то X = exp ⁡ (Y) ∼ L o g N (μ , σ 2) {\displaystyle X=\exp \left(Y\right)\sim \mathrm {LogN} \left(\mu ,\sigma ^{2}\right)} .
    • Отношение квадратов двух стандартных нормальных случайных величин имеет имеет

    Нормальный закон распределения вероятностей

    Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:


    Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

    Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

    Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов, например, время забега стометровки или превращения смолы в янтарь. Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

    Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

    Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

    На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

    При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

    При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:


    Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности чётная , и график симметричен относительно оси ординат.

    В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

    Всё в полном соответствии с геометрическими преобразованиями графиков .

    Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

    Ну а теперь смотрим кино:

    Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
    – вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

    Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

    Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

    =НОРМСТРАСП(z)

    Раз, два – и готово:

    На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

    Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

    но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
    .

    ! Вспоминает также , что

    Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

    Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

    Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

    и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

    Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

    Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

    Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

    Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

    Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

    – с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

    Тренируемся самостоятельно:

    Пример 3

    Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

    В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

    И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:


    Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

    – вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

    Хорошо то решение, которое умещается в одну строчку:)
    – вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

    Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

    правило «трех сигм»

    Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

    И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
    или 99,73%

    В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

    В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез .

    Продолжаем решать суровые советские задачи:

    Пример 4

    Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

    Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

    – вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

    Ответ :

    Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

    Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

    …срочно разрабатываю курс по подготовке продавцов =)

    Самостоятельно решаем обратную задачу:

    Пример 5

    Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

    Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

    И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

    Пример 6

    Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

    а) записать плотность вероятности и схематически изобразить ее график;
    б) найти вероятность того, что примет значение из интервала ;
    в) найти вероятность того, что отклонится по модулю от не более чем на ;
    г) применяя правило «трех сигм», найти значения случайной величины .

    Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

    Ну а я разберу пример повышенной сложности:

    Пример 7

    Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

    Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

    Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

    Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :


    Обязательно выполняем проверку, возвращая показатель в исходный вид:

    , что мы и хотели увидеть.

    Таким образом:
    – по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

    Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
    , откуда выражаем и подставляем в нашу функцию:
    , после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

    Построим график плотности:

    и график функции распределения :

    Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

    Определение 3. Х имеет нормальный закон распределения (закон Гаусса), если ее плотность распределения имеет вид:

    где m = M (X ), σ 2 = D (X ), σ > 0 .

    Кривую нормального закона распределения называют нормальной или гауссовой кривой (рис. 6.7).

    Нормальная кривая симметрична относительно прямой х = m , имеет максимум в точке х = m , равный .

    Функция распределения случайной величины Х, распределенной по нормальному закону, выражается через функцию Лапласа Ф(х ) по формуле:

    Ф(x ) – функция Лапласа.

    Замечание. Функция Ф(х ) является нечетной (Ф(-х ) = -Ф(х )), кроме того, при х > 5 можно считать Ф(х ) ≈ 1/2.

    Таблица значений функции Ф(х ) приведена в приложении (табл. П 2.2).

    График функции распределения F (x ) изображен на рис. 6.8.

    Вероятность того, что случайная величина Х примет значения, принадлежащие интервалу (a;b ) вычисляются по формуле:

    Р (a < Х < b ) = .

    Вероятность того, что абсолютная величина отклонения случайной величины от ее математического ожидания меньше положительного числа δ вычисляется по формуле:

    P (| X - m| .

    В частности, при m =0 справедливо равенство:

    P (| X| .

    "Правило трех сигм"

    Если случайная величина Х имеет нормальный закон распределения с параметрами m и σ, то практически достоверно, что ее значения заключены в интервале (m 3σ; m + 3σ), так как P (| X - m| = 0,9973.

    Задача 6.3. Случайная величина Х распределена нормально с математическим ожиданием 32 и дисперсией 16. Найти: а) плотность распределения вероятностей f (x ); Х примет значение из интервала (28;38).

    Решение: По условию m = 32, σ 2 = 16, следовательно, σ= 4, тогда

    а)

    б) Воспользуемся формулой:

    Р (a< Х)= .

    Подставив a = 28, b = 38, m = 32, σ= 4, получим

    Р (28< Х< 38)= Ф(1,5) Ф(1)

    По таблице значений функции Ф(х ) находим Ф(1,5) = 0,4332, Ф(1) = 0,3413.

    Итак, искомая вероятность:

    P (28

    Задачи

    6.1. Случайная величина Х равномерно распределена в интервале (-3;5). Найдите:

    а) плотность распределения f (x );

    б) функции распределения F (x );

    в) числовые характеристики;

    г) вероятность Р (4<х <6).

    6.2. Случайная величина Х равномерно распределена на отрезке . Найдите:

    а) плотность распределения f (x );

    б) функцию распределения F (x );

    в) числовые характеристики;

    г) вероятность Р (3≤х ≤6).

    6.3. На шоссе установлен автоматический светофор, в котором 2 минуты для транспорта горит зеленый свет, 3 секунды - желтый и 30 секунд - красный и т.д. Машина проезжает по шоссе в случайный момент времени. Найти вероятность того, что машина проедет мимо светофора, не останавливаясь.


    6.4. Поезда метрополитена идут регулярно с интервалом 2 минуты. Пассажир выходит на платформу в случайный момент времени. Какова вероятность того, что ждать поезд пассажиру придется больше 50 секунд. Найти математическое ожидание случайной величины Х - время ожидания поезда.

    6.5. Найти дисперсию и среднее квадратическое отклонение показательного распределения, заданного функцией распределения:

    6.6. Непрерывная случайная величина Х задана плотностью распределения вероятностей:

    а) Назовите закон распределения рассматриваемой случайной величины.

    б) Найдите функцию распределения F (x ) и числовые характеристики случайной величины Х .

    6.7. Случайная величина Х распределена по показательному закону, заданному плотностью распределения вероятностей:

    Х примет значение из интервала (2,5;5).

    6.8. Непрерывная случайная величина Х распределена по показательному закону, заданному функцией распределения:

    Найти вероятность того, что в результате испытания Х примет значение из отрезка .

    6.9. Математическое ожидание и среднее квадратическое отклонение нормально распределенной случайной величины соответственно равны 8 и 2. Найдите:

    а) плотность распределения f (x );

    б) вероятность того, что в результате испытания Х примет значение из интервала (10;14).

    6.10. Случайная величина Х распределена нормально с математическим ожиданием 3,5 и дисперсией 0,04. Найдите:

    а) плотность распределения f (x );

    б) вероятность того, что в результате испытания Х примет значение из отрезка .

    6.11. Случайная величина Х распределена нормально с M (X ) = 0 и D (X )= 1. Какое из событий: |Х |≤0,6 или |Х |≥0,6 имеет большую вероятность?

    6.12. Случайная величина Х распределена нормально с M (X ) = 0 и D (X )= 1.Из какого интервала (-0,5; -0,1) или (1; 2) при одном испытании она примет значение с большей вероятностью?

    6.13. Текущая цена за одну акцию может быть смоделирована с помощью нормального закона распределения с M (X )= 10 ден. ед. и σ(Х ) = 0,3 ден. ед. Найти:

    а) вероятность того, что текущая цена акции будет от 9,8 ден. ед. до 10,4 ден. ед.;

    б) с помощью "правила трех сигм" найти границы, в которых будет находиться текущая цена акции.

    6.14. Производится взвешивание вещества без систематических ошибок. Случайные ошибки взвешивания подчинены нормальному закону со средним квадратическим отклонением σ= 5г. Найти вероятность того, что в четырех независимых опытах ошибка при трех взвешиваниях не превзойдет по абсолютной величине 3 г.

    6.15. Случайная величина Х распределена нормально с M (X)= 12,6. Вероятность попадания случайной величины в интервал (11,4; 13,8) равна 0,6826. Найдите среднее квадратическое отклонение σ.

    6.16. Случайная величина Х распределена нормально с M (X ) = 12 и D (X ) = 36. Найти интервал, в который с вероятностью 0,9973 попадет в результате испытания случайная величина Х .

    6.17. Деталь, изготовленная автоматом, считается бракованной, если отклонение Х ее контролируемого параметра от номинала превышает по модулю 2 единицы измерения. Предполагается, что случайная величина Х распределена нормально с M (X ) = 0 и σ(Х ) = 0,7. Сколько процентов бракованных деталей выдает автомат?

    3.18. Параметр Х детали распределен нормально с математическим ожиданием 2, равным номиналу, и средним квадратическим отклонением 0,014. Найти вероятность того, что отклонение Х от номинала по модулю не превысит 1 % номинала.

    Ответы

    в) M (X )=1, D (X )=16/3, σ(Х )= 4/ , г)1/8.



    в) M (X )=4,5, D (X ) =2 , σ (Х )= , г)3/5.


    6.3. 40/51.

    6.4. 7/12, M (X )=1.


    6.5. D (X ) = 1/64, σ (Х )=1/8

    6.6. M (X )=1 , D (X ) =2 , σ (Х )= 1 .


    6.7. Р(2,5<Х <5)=е -1 е -2 ≈0,2325 6.8. Р(2≤Х ≤5)=0,252.


    б) Р (10 < Х < 14) ≈ 0,1574.

    б) Р (3,1 ≤ Х ≤ 3,7) ≈ 0,8185.


    6.11. |x |≥0,6.

    6.12. (-0,5; -0,1).


    6.13. а) Р(9,8 ≤ Х ≤ 10,4) ≈ 0,6562 6.14. 0,111.

    б) (9,1; 10,9).


    6.15. σ = 1,2.

    6.16. (-6; 30).

    6.17. 0,4 %.

    Будут и задачи для самостоятельного решения, к которым можно посмотреть ответы.

    Нормальное распределение: теоретические основы

    Примерами случайных величин, распределённых по нормальному закону, являются рост человека, масса вылавливаемой рыбы одного вида . Нормальность распределения означает следующее : существуют значения роста человека, массы рыбы одного вида, которые на интуитивном уровне воспринимаются как "нормальные" (а по сути - усреднённые), и они-то в достаточно большой выборке встречаются гораздо чаще, чем отличающиеся в бОльшую или меньшую сторону.

    Нормальное распределение вероятностей непрерывной случайной величины (иногда - распределение Гаусса) можно назвать колоколообразным из-за того, что симметричная относительно среднего функция плотности этого распределения очень похожа на разрез колокола (красная кривая на рисунке выше).

    Вероятность встретить в выборке те или иные значение равна площади фигуры под кривой и в случае нормального распределения мы видим, что под верхом "колокола", которому соответствуют значения, стремящиеся к среднему, площадь, а значит, вероятность, больше, чем под краями. Таким образом, получаем то же, что уже сказано: вероятность встретить человека "нормального" роста, поймать рыбу "нормальной" массы выше, чем для значений, отличающихся в бОльшую или меньшую сторону. В очень многих случаях практики ошибки измерения распределяются по закону, близкому к нормальному.

    Остановимся ещё раз на рисунке в начале урока, на котором представлена функция плотности нормального распределения. График этой функции получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . На ней столбцы гистограммы представляют собой интервалы значений выборки, распределение которых близко (или, как принято говорить в статистике, незначимо отличаются от) к собственно графику функции плотности нормального распределения, который представляет собой кривую красного цвета. На графике видно, что эта кривая действительно колоколообразная.

    Нормальное распределение во многом ценно благодаря тому, что зная только математическое ожидание непрерывной случайной величины и стандартное отклонение, можно вычислить любую вероятность, связанную с этой величиной.

    Нормальное распределение имеет ещё и то преимущество, что один из наиболее простых в использовании статистических критериев, используемых для проверки статистических гипотез - критерий Стьюдента - может быть использован только в том случае, когда данные выборки подчиняются нормальному закону распределения.

    Функцию плотности нормального распределения непрерывной случайной величины можно найти по формуле:

    ,

    где x - значение изменяющейся величины, - среднее значение, - стандартное отклонение, e =2,71828... - основание натурального логарифма, =3,1416...

    Свойства функции плотности нормального распределения

    Изменения среднего значения перемещают кривую функции плотности нормального распределения в направлении оси Ox . Если возрастает, кривая перемещается вправо, если уменьшается, то влево.

    Если меняется стандартное отклонение, то меняется высота вершины кривой. При увеличении стандартного отклонения вершина кривой находится выше, при уменьшении - ниже.

    Вероятность попадания значения нормально распределённой случайной величины в заданный интервал

    Уже в этом параграфе начнём решать практические задачи, смысл которых обозначен в заголовке. Разберём, какие возможности для решения задач предоставляет теория. Отправное понятие для вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал - интегральная функция нормального распределения.

    Интегральная функция нормального распределения :

    .

    Однако проблематично получить таблицы для каждой возможной комбинации среднего и стандартного отклонения. Поэтому одним из простых способов вычисления вероятности попадания нормально распределённой случайной величины в заданный интервал является использование таблиц вероятностей для стандартизированного нормального распределения.

    Стандартизованным или нормированным называется нормальное распределение , среднее значение которого , а стандартное отклонение .

    Функция плотности стандартизованного нормального распределения :

    .

    Интегральная функция стандартизованного нормального распределения :

    .

    На рисунке ниже представлена интегральная функция стандартизованного нормального распределения, график которой получен при рассчёте некоторой выборки данных в пакете программных средств STATISTICA . Собственно график представляет собой кривую красного цвета, а значения выборки приближаются к нему.


    Для увеличения рисунка можно щёлкнуть по нему левой кнопкой мыши.

    Стандартизация случайной величины означает переход от первоначальных единиц, используемых в задании, к стандартизованным единицам. Стандартизация выполняется по формуле

    На практике все возможные значения случайной величины часто не известны, поэтому значения среднего и стандартного отклонения точно определить нельзя. Их заменяют средним арифметическим наблюдений и стандартным отклонением s . Величина z выражает отклонения значений случайной величины от среднего арифметического при измерении стандартных отклонений.

    Открытый интервал

    Таблица вероятностей для стандартизированного нормального распределения, которая есть практически в любой книге по статистике, содержит вероятности того, что имеющая стандартное нормальное распределение случайная величина Z примет значение меньше некоторого числа z . То есть попадёт в открытый интервал от минус бесконечности до z . Например, вероятность того, что величина Z меньше 1,5, равна 0,93319.

    Пример 1. Предприятие производит детали, срок службы которых нормально распределён со средним значением 1000 и стандартным отклонением 200 часов.

    Для случайно отобранной детали вычислить вероятность того, что её срок службы будет не менее 900 часов.

    Решение. Введём первое обозначение:

    Искомая вероятность.

    Значения случайной величины находятся в открытом интервале. Но мы умеем вычислять вероятность того, что случайная величина примет значение, меньшее заданного, а по условию задачи требуется найти равное или большее заданного. Это другая часть пространства под кривой плотности нормального распределения (колокола). Поэтому, чтобы найти искомую вероятность, нужно из единицы вычесть упомянутую вероятность того, что случайная величина примет значение, меньше заданного 900:

    Теперь случайную величину нужно стандартизировать.

    Продолжаем вводить обозначения:

    z = (X ≤ 900) ;

    x = 900 - заданное значение случайной величины;

    μ = 1000 - среднее значение;

    σ = 200 - стандартное отклонение.

    По этим данным условия задачи получаем:

    .

    По таблицам стандартизированной случайной величине (границе интервала) z = −0,5 соответствует вероятность 0,30854. Вычтем ее из единицы и получим то, что требуется в условии задачи:

    Итак, вероятность того, что срок службы детали будет не менее 900 часов, составляет 69%.

    Эту вероятность можно получить, используя функцию MS Excel НОРМ.РАСП (значение интегральной величины - 1):

    P (X ≥900) = 1 - P (X ≤900) = 1 - НОРМ.РАСП(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

    О расчётах в MS Excel - в одном из последующих параграфах этого урока.

    Пример 2. В некотором городе среднегодовой доход семьи является нормально распределённой случайной величиной со средним значением 300000 и стандартным отклонением 50000. Известно, что доходы 40 % семей меньше величины A . Найти величину A .

    Решение. В этой задаче 40 % - ни что иное, как вероятность того, что случайная величина примет значение из открытого интервала, меньшее определённого значения, обозначенного буквой A .

    Чтобы найти величину A , сначала составим интегральную функцию:

    По условию задачи

    μ = 300000 - среднее значение;

    σ = 50000 - стандартное отклонение;

    x = A - величина, которую нужно найти.

    Составляем равенство

    .

    По статистическим таблицам находим, что вероятность 0,40 соответствует значению границы интервала z = −0,25 .

    Поэтому составляем равенство

    и находим его решение:

    A = 287300 .

    Ответ: доходы 40 % семей менее 287300.

    Закрытый интервал

    Во многих задачах требуется найти вероятность того, что нормально распределённая случайная величина примет значение в интервале от z 1 до z 2 . То есть попадёт в закрытый интервал. Для решения таких задач необходимо найти в таблице вероятности, соответствующие границам интервала, а затем найти разность этих вероятностей. При этом требуется вычитать меньшее значение из большего. Примеры на решения этих распространённых задач - следующие, причём решить их предлагается самостоятельно, а затем можно посмотреть правильные решения и ответы.

    Пример 3. Прибыль предприятия за некоторый период - случайная величина, подчинённая нормальному закону распределения со средним значением 0,5 млн. у.е. и стандартным отклонением 0,354. Определить с точностью до двух знаков после запятой вероятность того, что прибыль предприятия составит от 0,4 до 0,6 у.е.

    Пример 4. Длина изготавливаемой детали представляет собой случайную величину, распределённую по нормальному закону с параметрами μ =10 и σ =0,071 . Найти с точностью до двух знаков после запятой вероятность брака, если допустимые размеры детали должны быть 10±0,05 .

    Подсказка: в этой задаче помимо нахождения вероятности попадания случайной величины в закрытый интервал (вероятность получения небракованной детали) требуется выполнить ещё одно действие.

    позволяет определить вероятность того, что стандартизованное значение Z не меньше -z и не больше +z , где z - произвольно выбранное значение стандартизованной случайной величины.

    Приближенный метод проверки нормальности распределения

    Приближенный метод проверки нормальности распределения значений выборки основан на следующем свойстве нормального распределения: коэффициент асимметрии β 1 и коэффициент эксцесса β 2 равны нулю .

    Коэффициент асимметрии β 1 численно характеризует симметрию эмпирического распределения относительно среднего. Если коэффициент асимметрии равен нулю, то среднее арифметрического значение, медиана и мода равны: и кривая плотности распределения симметрична относительно среднего. Если коэффициент асимметрии меньше нуля (β 1 < 0 ), то среднее арифметическое меньше медианы, а медиана, в свою очередь, меньше моды () и кривая сдвинута вправо (по сравнению с нормальным распределением) . Если коэффициент асимметрии больше нуля (β 1 > 0 ), то среднее арифметическое больше медианы, а медиана, в свою очередь, больше моды () и кривая сдвинута влево (по сравнению с нормальным распределением) .

    Коэффициент эксцесса β 2 характеризует концентрацию эмпирического распределения вокруг арифметического среднего в направлении оси Oy и степень островершинности кривой плотности распределения. Если коэффициент эксцесса больше нуля, то кривая более вытянута (по сравнению с нормальным распределением) вдоль оси Oy (график более островершинный). Если коэффициент эксцесса меньше нуля, то кривая более сплющена (по сравнению с нормальным распределением) вдоль оси Oy (график более туповершинный).

    Коэффициент асимметрии можно вычислить с помощью функции MS Excel СКОС. Если вы проверяете один массив данных, то требуется ввести диапазон данных в одно окошко "Число".


    Коэффициент эксцесса можно вычислить с помощью функции MS Excel ЭКСЦЕСС. При проверке одного массива данных также достаточно ввести диапазон данных в одно окошко "Число".


    Итак, как мы уже знаем, при нормальном распределении коэффициенты асимметрии и эксцесса равны нулю. Но что, если мы получили коэффициенты асимметрии, равные -0,14, 0,22, 0,43, а коэффициенты эксцесса, равные 0,17, -0,31, 0,55? Вопрос вполне справедливый, так как практически мы имеем дело лишь с приближенными, выборочными значениями асимметрии и эксцесса, которые подвержены некоторому неизбежному, неконтролируемому разбросу. Поэтому нельзя требовать строгого равенства этих коэффициентов нулю, они должны лишь быть достаточно близкими к нулю. Но что значит - достаточно?

    Требуется сравнить полученные эмпирические значения с допустимыми значениями. Для этого нужно проверить следующие неравенства (сравнить значения коэффициентов по модулю с критическими значениями - границами области проверки гипотезы).

    Для коэффициента асимметрии β 1 .

    Нормальное распределение - наиболее часто встречающийся вид распределения. С ним приходится встречаться при анализе погрешностей измерений, контроле технологических процессов и режимов, а также при анализе и прогнозировании различных явлений в биологии , медицине и других областях знаний.

    Термин «нормальное распределение» применяется в условном смысле как общепринятый в литературе, хотя и не совсем удачный. Так, утверждение, что какой-то признак подчиняется нормальному закону распределения, вовсе не означает наличие каких-либо незыблемых норм, якобы лежащих в основе явления, отражением которого является рассматриваемый признак, а подчинение другим законам распределения не означает какую-то анормальность данного явления.

    Главная особенность нормального распределения состоит в том, что оно является предельным, к которому приближаются другие распределения. Нормальное распределение впервые открыто Муавром в 1733 году. Нормальному закону подчиняются только непрерывные случайные величины. Плотность нормального закона распределения имеет вид .

    Математическое ожидание для нормального закона распределения равно . Дисперсия равна .

    Основные свойства нормального распределения.

    1. Функция плотности распределения определена на всей числовой оси Ох , то есть каждому значению х соответствует вполне определённое значение функции.

    2. При всех значениях х (как положительных, так и отрицательных) функция плотности принимает положительные значения, то есть нормальная кривая расположена над осью Ох .

    3. Предел функции плотности при неограниченном возрастании х равен нулю, .

    4. Функция плотности нормального распределения в точке имеет максимум .

    5. График функции плотности симметричен относительно прямой .

    6. Кривая распределения имеет две точки перегиба с координатами и .

    7. Мода и медиана нормального распределения совпадают с математическим ожиданием а .

    8. Форма нормальной кривой не изменяется при изменении параметра а .

    9. Коэффициенты асимметрии и эксцесса нормального распределения равны нулю.

    Очевидна важность вычисления этих коэффициентов для эмпирических рядов распределения, так как они характеризуют скошеннность и крутость данного ряда по сравнению с нормальным.

    Вероятность попадания в интервал находится по формуле , где нечётная табулированная функция.

    Определим вероятность того, что нормально распределённая случайная величина отклоняется от своего математического ожидания на величину, меньшую , то есть найдём вероятность осуществления неравенства , или вероятность двойного неравенства . Подставляя в формулу, получим

    Выразив отклонение случайной величины Х в долях среднего квадратического отклонения, то есть положив в последнем равенстве, получим .


    Тогда при получим ,

    при получим ,

    при получим .

    Из последнего неравенства следует, что практически рассеяние нормально распределённой случайной величины заключено на участке . Вероятность того, что случайная величина не попадёт на этот участок, очень мала, а именно равна 0,0027, то есть это событие может произойти лишь в трёх случаях из 1000. Такие события можно считать практически невозможными. На приведённых рассуждениях основано правило трёх сигм , которое формулируется следующим образом: если случайная величина имеет нормальное распределение, то отклонение этой величины от математического ожидания по абсолютной величине не превосходит утроенного среднего квадратического отклонения .

    Пример 28 . Деталь, изготовленная автоматом, считается годной, если отклонение её контролируемого размера от проектного не превышает 10 мм. Случайные отклонения контролируемого размера от проектного подчинены нормальному закону распределения со средним квадратическим отклонением мм и математическим ожиданием . Сколько процентов годных деталей изготавливает автомат?

    Решение. Рассмотрим случайную величину Х - отклонение размера от проектного. Деталь будет признана годной, если случайная величина принадлежит интервалу . Вероятность изготовления годной детали найдём по формуле . Следовательно, процент годных деталей, изготавливаемых автоматом, равен 95,44%.

    Биномиальное распределение

    Биномиальным является распределение вероятностей появления m числа событий в п независимых испытаниях, в каждом из которых вероятность появления события постоянна и равна р . Вероятность возможного числа появлений события вычисляется по формуле Бернулли: ,

    где . Постоянные п и р , входящие в это выражение, параметры биномиального закона. Биномиальным распределением описывается распределение вероятностей дискретной случайной величины.

    Основные числовые характеристики биномиального распределения. Математическое ожидание равно . Дисперсия равна . Коэффициенты асимметрии и эксцесса равны и . При неограниченном возрастании числа испытаний А и Е стремятся к нулю, следовательно, можно предположить, что биномиальное распределение сходится к нормальному с возрастанием числа испытаний.

    Пример 29 . Производятся независимые испытания с одинаковой вероятностью появления события А в каждом испытании. Найти вероятность появления события А в одном испытании, если дисперсия числа появлений в трёх испытаниях равна 0,63.

    Решение. Для биномиального распределения . Подставим значения, получим отсюда или тогда и .

    Распределение Пуассона

    Закон распределения редких явлений

    Распределение Пуассона описывает число событий m , происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью. При этом число испытаний п велико, а вероятность появления события в каждом испытании р мала. Поэтому распределение Пуассона называют законом редких явлений или простейшим потоком. Параметром распределения Пуассона является величина , характеризующая интенсивность появления событий в п испытаниях. Формула распределения Пуассона .

    Пуассоновским распределением хорошо описываются число требований на выплату страховых сумм за год, число вызовов, поступивших на телефонную станцию за определённое время, число отказов элементов при испытании на надёжность, число бракованных изделий и так далее.

    Основные числовые характеристики для распределения Пуассона. Математическое ожидание равно дисперсии и равно а . То есть . Это является отличительной особенностью этого распределения. Коэффициенты асимметрии и эксцесса соответственно равны .

    Пример 30 . Среднее число выплат страховых сумм в день равно двум. Найти вероятность того, что за пять дней придётся выплатить: 1) 6 страховых сумм; 2) менее шести сумм; 3) не менее шести.распределение.

    Это распределение часто наблюдается при изучении сроков службы различных устройств, времени безотказной работы отдельных элементов, частей системы и системы в целом, при рассмотрении случайных промежутков времени между появлениями двух последовательных редких событий.

    Плотность показательного распределения определяется параметром , который называют интенсивностью отказов . Этот термин связан с конкретной областью приложения - теорией надёжности.

    Выражение интегральной функции показательного распределения можно найти, используя свойства дифференциальной функции:

    Математическое ожидание показательного распределения , дисперсия , среднее квадратическое отклонение . Таким образом, для этого распределения характерно, что среднее квадратическое отклонение численно равно математическому ожиданию. При любом значении параметра коэффициенты асимметрии и эксцесса - постоянные величины .

    Пример 31 . Среднее время работы телевизора до первого отказа равно 500 часов. Найти вероятность того, что наудачу взятый телевизор проработает без поломок более 1000 часов.

    Решение. Так как среднее время работы до первого отказа равно 500, то . Искомую вероятность найдём по формуле .

Статьи по теме