Випадкові події і величини, їх числові характеристики


Тема 2. Основні теоретичні положення математико-статистичного моделювання техніко-економічних показників

З позиції теорії пізнання спостережувані в природі й суспільстві явища можна підрозділити на наступні види:

- достовірні (визначені), які обов'язково відбудуться, якщо буде здійснена певна сукупність умов, і приймуть умови, які явно можна передбачити;

- неможливі, які явно не відбудуться в певних умовах;

- випадкові, які при сукупності умов можуть відбутися або не відбутися, в результаті випробувань можуть прийняти будь-яке значення, причому невідомо, яке саме;

- невизначені, про які нічого не можна сказати відбудуться вони або не відбудуться, незалежно від створених умов.

Слід розрізняти випадкові події - факт і випадкові величини.

У теорії вірогідності під "подією" розуміється будь-яке (не обов'язково знаменне) явище. Подія-факт в кількісному і якісному відношенні може бути величиною невизначеною, оскільки про неї нічого не можна сказати з наперед відомою вірогідністю, а випадкова величина пов'язана з характером, змістом досліджуваного процесу.

Величина називається випадковою, якщо вона формується під дією багатьох дрібних причин, не піддатливих до результату випробувань повному контролю і обліку, діючих відносно незалежно один від одного.

Теорія вірогідності вивчає кількісні закони масових випадкових величин і явищ, але не ставить перед собою завдання передбачити, відбудеться одинична подія чи ні, - вона просто не в силах це зробити.

Предметом теорії вірогідності і прикладних її напрямів є вивчення закономірностей масових однорідних випадкових подій вірогідності. Випадкові величини підрозділяються на дискретні (переривчасті) й безперервні.

Дискретними називаються випадкові величини, які приймають окремі, строго визначені, ізольовані, кінцеві чисельні значення з певною вірогідністю, між якою не може бути проміжних (число робітників у бригаді, число перевезених за один рейс пасажирів і т.д.). При цьому число можливих значень дискретної випадкової величини може бути кінцевим і нескінченним.

Частіше зустрічаються безперервні випадкові величини, які можуть мати всі можливі значення в деякому кінцевому або нескінченному проміжку. Очевидно, число можливих значень безперервної випадкової величини нескінченне, наприклад, рівень собівартості перевезення одного пасажира, продуктивність праці і т.д.

Оскільки точність вимірювання або обліку завжди обмежена, то практично всі випадкові величини є дискретними.

Значна частина теорії вірогідності й математичної статистики пов'язана з необхідністю досліджувати і описувати велику сукупність об'єктів. Звичайно цю сукупність називають генеральною. Вона охоплює, наприклад, усіх мешканців великого міста, продукцію галузі народного господарства.

Якщо досліджувана сукупність об'єктів дуже численна або об'єкти вивчення труднодоступні, а також є інші причини, що не дозволяють вивчити всі об'єкти, то вдаються до вивчення якоїсь частини генеральної сукупності, що називається вибіркою.

Вибірка повинна бути представницькою або, як кажуть, репрезентативною. Якщо вибірка представляє не всю генеральну сукупність, а якусь її частину, то це називається зсувом вибірки. Зсув - одне з основних джерел помилок при використанні вибіркового методу.

Об'єктом дослідження теорії вірогідності є вибірка, що складається з n однорідних одиниць (елементів). Число n називається обсяг вибірки. Одиницями вибірки можуть бути різні економічні процеси і явища, результати виробничо-господарської діяльності підприємств: продуктивність праці, собівартість продукції, фондовіддача, рентабельність та ін.

Чисельні значення, які приймає досліджувана ознака, називають варрантами. Зміна величини ознаки в статистичній сукупності називається варіацією (коливається або розсіюванням).

Для того, щоб замінити в зареєстрованих значеннях процесу, що вивчається, будь-яку закономірність, їх треба привести до доступного для аналізу вигляду, тобто впорядкувати, класифікувати, систематизувати, згрупувати. Процес розчленовування досліджуваної сукупності на частини називається угрупованням.

Початковою базою для вивчення закономірностей тих чи інших явищ служать статистичні ряди розподілу, які будуються за якісними і кількісними ознаками.

Якщо ряди є послідовністю чисел, що характеризують зміну показника в часі, то вони називаються тимчасовими, а якщо показують розподіл одиниць сукупності, що вивчається, по окремих групах, виділених за певною ознакою, то варіаційними.

Число, що показує, скільки разів зустрічається та або інша одиниці сукупності, що вивчається, називається його частотою m.

Варіаційний ряд або ряд розподілу є таблицею, в якій в порядку убування або зростання перераховані можливі значення випадкової величини за вибіркою, що вивчається, з вказівкою їх частот.

Таблиця 2.1 – Значення випадкової величини

Значення випадкової величини Х1 Х2 Х3 ... Хn
частоти m1 m2 m3 ... mn

Очевидно, що сума всіх частот рівна обсягу вибірки

, (2.1)

де n-загальне число спостережень.

Якщо різних значень випадкової величини багато, то ряди розподілу складаються в інтервальній формі. Різниця між верхньою Хi і нижньої Хi-1 межами інтервалу називається його величиною:

∆Хi−Xi−Xi-1. (2.2)

Число інтервалів не повинне бути надмірно великим. Для того, щоб можна краще проявити характерні особливості, пов'язані з природою величин, що вивчаються, рекомендується ділити проміжок варіації на 6÷16 інтервалів залежно від обсягу вибірки.

Отже, для визначення величини інтервалів необхідно різницю Хmax і Хmin (розмах варіювання) розділити на 6ч16 залежно від числа спостережень:

. (2.3)

У літературі зустрічається і таке визначення розрахунку інтервалів, як використання формули Стерджеса

. (2.4)

Отримане значення інтервалу Х звичайно округляють. За величину і особливо центр інтервалу приймається деяке "зручне число", що має невелике число значущих цифр, щоб полегшити надалі обчислення.

Запис інтервальних рядів розподілу поданий в табл. 2.2.

Таблиця 2.2- Інтервальні ряди розподілу

Значення випадкових величин Х1−Х2 Х2−Х3 Х3−Х4 Xn-1−Xk
частоти m1 m2 m3   mk

 

Сума частот представлена наступним чином:

. (2.5)

Дослідження не обмежується побудовою ряду розподілу тієї або іншої випадкової величини. Необхідно знайти декілька величин, так званих статистичних характеристик, які відображали б властивості ряду розподілу в цілому, повніше характеризували б сукупність і властиві їй закономірності. Інакше кажучи, ставиться завдання знаходження такого значення випадкової величини, навколо якої групуються всі інші і зустрічаються найбільш часто. Найважливішим і найпоширенішим з них є середня арифметична, яка позначається символом . Якщо випадкова величина приймає n значень, то середня арифметична за незгрупованими даними є сумою її значень, розділеною на їх число:

. (2.6)

Середня арифметична зважена за групованими даними обчислюється таким чином:

. (2.7)

Середня арифметична, як і середня арифметична зважена, володіє тією властивістю, що сума відхилень значень випадкової величини від середньої арифметичної рівна нулю. Ця властивість дає можливість визначити середню арифметичну як центр угрупування випадкової величини.

Крім середнього значення ознаки важливо знати характер варіації, тобто як тісно концентруються всі значення елементів сукупності навколо середньої. З теоретичної точки зору самою відповідною мірою коливання ознаки служить дисперсія (від латинського dispercia - розсіяння), є квадратом відхилення дослідних даних від середнього значення:

, (2.8)

за незгрупованими даними,

(2.9)

- за згрупованими даними.

Як бачимо, дисперсія випадкової величини в окремих випадках може мати нереальну розмірність. Для її усунення вводять середньоквадратичне відхилення, що розглядається в тих же одиницях вимірювання:

. (2.10)

Безрозмірним показником коливання випадкової величини є коефіцієнт варіації, який є відношенням, відображеним у відсотках:

. (2.11)

Якщо дисперсія або коефіцієнт варіації великі, то це свідчить про значний розкид випадкової величини її середнього значення.

Випадкова величина характеризується двома основними параметрами:

- безліччю її можливих значень;

- вірогідністю того, що вона прийме ті чи інші значення з цієї множини.

Вірогідність є одним з основних понять математичної статистики. Вона є математичним визначенням об'єктивної можливості відбутися або не відбутися випадковому явищу.

При вивченні рядів розподілу використовують не тільки абсолютні значення появи випадкової величини mi (частоти), але й відносні частоти, тобто .

Згідно з теоремою Якова Бернуллі (1654-1705), що отримала назву "закону великих чисел" в статистиці, можна передбачати відносну частоту події.

Теорія Я. Бернуллі була опублікована в 1713г. Стосовно вибірки вона формулюється так: з вірогідністю, скільки завгодно близькою до одиниці, можна стверджувати, що різниця між відносною частотою і часткою в генеральній сукупності при достатньо великому обсязі вибірки буде скільки завгодно мала.

Коротко теорема Я. Бернуллі записується так:

. (2.12)

З цього виходить, що вірогідність події А визначається формулою

P (A) =. (2.13)

Сума всіх відносних частот дорівнює 1, тобто

. (2.14)

З визначення вірогідності випливають наступні її властивості:

1.Вірогідність неможливої події дорівнює 1. При m=n

P(A)===1.

2. Вірогідність неможливої події дорівнює нулю. При m=0

Pa===o.

3.Вірогідність випадкової події є позитивне число, укладене між нулем і одиницею.

Дійсно випадковій події сприяє лише частина із загального числа елементарних результатів випробувань. У цьому випадку о<m<1, значить

о<<1

о≤P(A)≤1.

4. Вірогідність протилежної події дорівнює різниці між одиницею і вірогідністю даної події, тобто

P(B)=1−P(A).

5. Якщо в результаті випробування повинне відбутися одне, і тільки одне з деяких подій А12,…Ак, то сума всієї вірогідності дорівнює одиниці, тобто

P1(A1)+P2(A2)+…+Pk(Ak)=1.

Одним з узагальнюючих результатів закону великих чисел є те, що при достатньо великому числі спостережень n середнє значення випадкової величини приблизно дорівнює її математичному очікуванню, або М(х)=. Така середня називається стохастичною.

З цього виходить, що математичне очікування дискретної випадкової величини є невипадкова (постійна) величина. Тим самим П.Л.Чебишев (1821-1894) довів, що сукупні дії великого числа чинників призводять до результату, майже не залежному від випадку.

У вузькому значенні слова під законом великих чисел розуміється ряд математичних теорем, в яких встановлюється факт наближення середніх показників у результаті великого числа спостережень до деяких постійних величин.

У широкому значенні слова зміст закону великих чисел полягає в тому, що при великому числі випадкових явищ їх середній результат практично перестає бути випадковим і може бути представлений з великою визначеністю.