ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ

Все тела и процессы в природе обладают свойствами. Если мы придумали способ как измерять эти свойства, то будем называть эти свойства величинами. Напомним, что измерить – значит сравнить с эталоном.

Бывают свойства, для которых нельзя или очень трудно придумать способ для их измерения. Такие величины будем называть качественными величинами. Рассмотрим примеры. Человечество уже давно и очень точно может предсказывать, например, солнечные затмения. Можно предсказать время затмения на несколько столетий вперед. Интуитивно ясно, что назвать время следующего солнечного затмения случайной величиной язык не поворачивается. Действительно, это не случайная, а детерминированная (строго определенная) величина. Другой пример представляет изучение верхнего артериального давления. Можем ли мы предсказать заранее каким окажется артериальное давление у случайно выбранного человека? Конечно, нет – это случайная величина.

Итак, случайные величины - это такие величины, значения которых до проведения испытания (опыта) точно предсказать нельзя. Очевидно, что в медицине, мы, в большинстве случаев, имеем дело со случайными величинами. Может сложиться впечатление, что если величина случайная, то и предсказать результат испытания (опыта) совершенно невозможно. Если говорить о точном значении результата опыта, то это действительно так. Но все-таки у нас есть понятие, которое позволяет очень плодотворно работать со случайными величинами.

Это понятие – ВЕРОЯТНОСТЬ!

Понятие вероятности интуитивно есть у каждого человека. Например, мало кто ошибется в ответе на вопрос: какая вероятность больше, встретить первого взрослого человека на улице ростом от 50 до 60 сантиметров или ростом от 160 до 170. Рост – это непрерывная случайная величина и здесь слово «непрерывная» играет существенную роль, поскольку позволяет задать вопрос, а чему равна вероятность встретить человека ростом 165,123 см? Очевидно, что такая вероятность практически равна нулю (невозможное событие). Поэтому когда рассчитывают вероятность для той или иной непрерывной случайной величины всегда рассчитывают эту вероятность для какого либо диапазона. В нашем случае надо рассчитать вероятности для двух диапазонов: 50-60 см и 160-170.

Итак, мы приходим к задаче: как найти вероятность, что при следующем испытании случайная величина попадет в наперед заданный интервал?

Для ответа на этот вопрос, прежде всего надо ввести понятие закона распределения случайной величины.

Закон распределения случайной величины (ЗРСВ) – это способ рассчитать вероятность того, что случайная величина (СВ) примет то или иное значение (для дискретных случайных величин) или попадет в тот или иной интервал (для непрерывных случайных величин) в результате испытания.

Для дискретных СВ это чаще всего таблица. Например, для правильной игральной кости эта таблица будет выглядеть так:

 

1/6 1/6 1/6 1/6 1/6 1/6

Выпадение 1, 2, 3, 4, 5, или 6 равновероятно и равно одной шестой.

Для непрерывной случайной величины, ЗРСВ может быть задан или в виде графика или в виде формулы. Наибольшее значение в математической статистике имеет нормальный закон распределения случайной величины или закон Гаусса.

Это связано с тем, что очень многие СВ распределены именно по этому закону, в том числе и в биологии и медицине.

Итак, для вычисления вероятностей нам нужен закон Гаусса. Рассмотрим этот закон.

Поставим задачу более точно. Пусть у нас есть некоторая непрерывная случайная величина Х и мы хотим узнать какова вероятность, что при следующем испытании эта величина примет значение хi, лежащие в маленьком интервале от х до х+dx (здесь dx – дифференциал х). Тогда вероятность P(xi), что при следующем испытании это произойдет, по закону Гаусса будет равна:

 
 


(1)

Формула (1) позволяет рассчитать вероятность попадания следующего измерения в бесконечно маленький интервал dx. Но на практике нам надо научиться рассчитывать вероятность попадания в реальные интервалы, например в интервал от х=а до х=b. Это можно сделать с помощью формулы (2):

 
 

 


(2)

Поскольку интервал (а,b) мы задаем сами, следовательно, для расчета вероятности того, что результат следующего испытания попадет в этот интервал нам надо знать только два числа: μ - математическое ожидание и σ - среднее квадратическое отклонение.

Таким образом, оценка этих двух чисел является одной из основных задач математической статистики.

Итак, чтобы решить главную задачу, которая как мы знаем, состоит в том, чтобы научиться рассчитывать вероятность попадания случайной величины в тот или иной наперед заданный интервал, нам надо научиться рассчитывать эти два числа. Вот здесь нас ожидает неудача, поскольку точно рассчитать эти два числа оказалось невозможным! Оказалось, что для того чтобы точно получить эти два числа, например для случайной величины «рост», надо измерить рост у всех людей в мире! Ясно, что мы этого сделать не можем. Что же нам остается? А остается нам измерить рост у тех людей, до которых мы можем добраться, и по полученным значениям ОЦЕНИТЬ значения μ и σ. Подчеркну: не получить точные значения, а только оценить чему приблизительно они равны. Вот эти оценки, которые называются выборочным арифметическим средним () и оценкой среднеквадратичного отклонения (s) и являются самой первой целью большинства статистических исследований.

В нашем рассмотрении неожиданно появилось слово «выборочная». Попробуем объяснить, что оно значит. Для этого введем следующее определение: