Генеральна сукупність – це вся множинність об’єктів, по відношенню до якої формулюється дослідницька гіпотеза(повна сукупність об’єктів дослідження).

ОСНОВНІ СТАТИСТИЧНІ ПОНЯТТЯ

Лекція 2

 

При використанні математичної статистики у психологічних дослідженнях можна виділити дві основні групи методів: методи описової статистики і методи статистичних висновків.

Методи описової статистики використовуються для узагальнення показників однієї змінної (статистика випадкової вибірки) та виявлення взаємозв’язків між двома і більше змінними (кореляційний аналіз).

Описова статистика дає змогу отримати нову інформацію, швидше зрозуміти і всебічно оцінити її, тобто виконує функцію опису об’єктів дослідження. За її методом здійснюють перетворення сукупності окремих емпіричних даних на систему наочних для сприйняття форм і чисел (розподіли частот, показники тенденцій, варіативності, зв’язку) і розраховують статистики випадкової вибірки, які уможливлюють здійснення статистичних висновків.

Методи статистичних висновків надають можливість оцінити похибки, які виникають у процесі статистичних досліджень (статистичне оцінювання); узагальнити параметри генеральної сукупності, отримані на підставі вибіркових статистик (перевірка статистичних гіпотез).

Основна мета досліджень – отримання нового знання про великі класи явищ, осіб або подій, тобто про генеральну сукупність.

Дослідження починається з певних припущень, які вимагають перевірки з залученням фактів. Це припущення – гіпотеза – формулюється по відношенню зв’язку явищ або властивостей в певній сукупності об’єктів.

Приклад: дослідник передбачає, що жінки в середньому більш тривожні, ніж чоловіки (тривожність пов’язана з статтю). Або перегляд телепередач, які містять сцени насилля, підвищує агресивність у підлітків. В першому випадку дослідника цікавлять такі явища, як тривожність і стать, в другому – агресивність та перегляд телепередач. Об’єктами-носіями властивостей в першому випадку будуть всі чоловіки та всі жінки, а в другому – всі підлітки.

Для перевірки подібних припущень на фактах необхідно виміряти відповідні властивості у їх носіїв. Але не можливо виміряти тривожність у всіх жінок та чоловіків, як не можливо виміряти агресивність у всіх підлітків. Тому при проведенні досліджень обмежуються лише відносно невеликою групою представників відповідної сукупності людей.

В першому прикладі такими генеральними сукупностями є всі чоловіки та жінки. У другому – всі підлітки, які дивляться передачі, що містять сцени насилля. Генеральні сукупності по відношенню до яких дослідник збирається робити висновки за результатами дослідження, можуть бути за чисельністю і більш скромними.

Приклад: при вивченні професійного самовизначення студентів-випусників певного факультету в конкретному вузі генеральна сукупність, начебто невелика та допускає суцільне дослідження. Але дослідник за звичай надіється, що висновки дослідження будуть справедливі не тільки по відношенні випускників цього, але й наступних років.

Таким чином, генеральна сукупність – це хоч і не нескінчене за чисельністю, але недоступна для суцільного дослідження множинність потенціальних досліджуваних.

Вибіркаце обмежена за чисельністю група об’єктів (в психології – досліджуваних, респондентів), спеціально відібрана з генеральної сукупності для вивчення її властивостей. Відповідно, вивчення на вибірці властивостей генеральної сукупності називається вибірковим дослідженням. Практично всі психологічні дослідження є вибірковими, а їх висновки поширюються на генеральні сукупності. Вибірка повинна бути такою, щоб була обґрунтована генералізація висновків вибіркового дослідження – узагальнення, поширення їх на генеральну сукупність. Основні критерії обґрунтування висновків дослідження – це репрезентативність вибірки та статистична достовірність (емпіричних) результатів.

Репрезентативність вибірки – або її показовість – це здатність вибірки представляти явища, що вивчаються достатньо повно – з точки зору їх мінливості в генеральній сукупності.Репрезентативність відповідність характеристик вибірки характеристикам популяції або генеральної сукупності в цілому. Репрезентативність визначає, наскільки можливо узагальнювати результати дослідження із залученням певної вибірки на всю генеральну сукупність, з якої вона була зібрана.

Помилки репрезентативності можуть виникати:

1. Якщо вибірка, яка характеризує генеральну сукупність, мала. Якщо ми провели дослідження на групі, яка складається з 10-ти школярів 11-го класу якоїсь школи міста, то навряд ми маємо право екстраполювати отримані нами дані на всю генеральну сукупність.

2. Властивості (параметри) вибірки не співпадають з параметрами генеральної сукупності. Це може спостерігається в тих випадках, коли порушується принцип випадковості при відборі досліджуваних.

Залежні та незалежні вибірки. Звичайна ситуація дослідження, коли властивість, яка цікавить дослідника, вивчається на двох або більше вибірках з метою їх подальшого порівняння. Ці вибірки можуть знаходитись в різних співвідношеннях – в залежності від процедури їх організації. Незалежні вибірки характеризуються тим, що вірогідність відбору любого досліджуваного однієї вибірки не залежить від відбору любого з досліджуваних іншої вибірки. У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними.

Приклад: чоловіки та жінки; психологи та математики.

Напроти, залежні вибірки характеризуються тим, що кожному досліджуваному однієї вибірки поставлений в відповідності до певного критерію досліджуваний з іншої вибірки.

Приклад: найбільш типовий приклад залежних вибірок – повторне вимірювання властивості на одній і тій же вибірці після впливу (ситуація «до – після»). Чоловіки – одна вибірка, їх жінки – інша вибірка (при дослідженні їх уподобань). Або діти 5 – 7 років одна вибірка, а їх брати або сестри-близнюки – інша вибірка.

Змінна величина (або змінна) – це кількісно виміряна властивість або ознака, яка набуває різні значення. В якості змінних можуть виступати різні психічні ознаки – час вирішення задачі, кількість отриманих помилок, рівень тривожності або нейротизму, коефіцієнт інтелекту та ін.. значення змінних можуть змінюватися або неперервно, або дискретно (роздільно). В більшості психофізіологічних дослідженнях виміряні величини неперервні і точність їх вимірювання залежать від точності вимірювального пристрою (приладу). Дискретні значення змінних зустрічаються в більшості психодіагностичних процедур, де параметр виміру набуває цілечисельного значення – кількість позитивних та негативних відповідей, число правильно вирішених завдань (виконаних задач) та ін..

Прийнято вважати, що психологічні змінні є випадковими величинами, так як відчувають на собі вплив багатьох та різноманітних факторів та неможливо передбачити, яке значення вони набудуть. На мові математики величина будь-якої варіюючої ознаки є змінною випадкової величини. На відміну від постійних величин, які позначаються початковими буквами латинського алфавіту, змінні величини прийнято позначати останніми в латинському алфавіті великими (друкованими) буквами X, Y, Z, а їх числові значення, тобто варіанти – відповідними маленькими (прописними) буквами того ж алфавіту: x1, x2, x3, …, xn або y1, y2, y3,…, yn та інше. Загальне позначення любої варіанти відмічається символом xi, yi, де індекс i символізує загальний характер варіанти.

Причини варіювання результатів спостережень. Ознаки варіюються під впливом самих різних, в тому числі і випадкових, причин. Поряд з природнім варіюванням на величину ознак впливають помилки, які виникають при вимірах досліджуваних об’єктів. Як би точно не проводились виміри вони завжди супроводжуються відхиленнями від дійсного значення величини виміру, тобто не можуть бути проведені абсолютно точно. Різниця між результатами вимірів та дійсно існуючими значеннями виміряної величини називається похибкою або помилкою. Помилки виникають через несправність або неточність вимірювальних приладів та інструментів, особистісних якостей дослідника, його навичок та майстерності в роботі та інш.

Математична обробка – це оперування зі значеннями ознак (змінної), отриманими у досліджуваних в процесі психологічного дослідження.

Статистична гіпотеза– це припущення, яке носить вірогідний характер, та має невизначеність по відношенню до своєї істинності. Формалізація гіпотез з математичної точки зору приводить до опису гіпотез двох видів: Н0нульова гіпотеза, Н1альтернативна гіпотеза.

Нульова гіпотеза є припущенням, про відсутність відмінностей у значеннях ознак, які зіставляють (відсутність відмінностей у вибірках, в умовах експериментів, про рівність мір зв’язку нулю, про схожість двох розподілів). Відмінності не достатньо значимі, і тому розподіли відносяться до одної і тої популяції, а незалежна змінна не містить ніякого впливу.

Альтернативна гіпотезаце припущення про існування відмінностей (міри зв’язку відрізняються від нуля, відмінність двох розподілів). Відмінності між двома розподілами достатньо значимі та обумовлені впливом незалежної змінної.

Нульова гіпотеза – це гіпотеза про відсутність відмінностей. Вона позначається як H0 і називається нульовою тому, що містить число 0: X1–Х2 = 0, де X1, Х2 – зіставляються значення ознак. Нульова гіпотеза – це те, що ми хочемо спростувати, якщо перед нами стоїть завдання довести значимість відмінностей. Альтернативна гіпотеза – це гіпотеза про значимість відмінностей. Вона позначається як H1. Альтернативна гіпотеза – це те, що ми хочемо довести, тому іноді її називають експериментальною гіпотезою.

 

Спрямовані гіпотези Н0: X1 не перевищує Х2 Н1: X1 перевищує Х2 Не спрямовані гіпотези Н0: X1 не відрізняється від Х2 H1: Х1 відрізняється від Х2

 

У гуманітарних науках прийнято вважати, що нульову гіпотезу можна відхилити на користь альтернативної гіпотези, якщо за результатами статистичного тесту ймовірність випадкового виникнення знайденої відмінності не перевищує 5 з 100. Якщо ж цей рівень достовірності не досягається, вважають, що різниця цілком може бути випадковою і тому не можна відхилити нульову гіпотезу.

Гіпотези перевіряються за допомогою статистичних критеріїв. Статистичний критерій – це правило, яке дозволяє приймати істинні та відхиляти хибну гіпотезу з високою вірогідністю. Математично критерій є формулою, за якою отримується певне число. Критерій є випадковою величиною, розподіл якої залежить від числа ступені свободи. Ступені свободи – це кількість можливих напрямків мінливості деякої змінної. Загальноприйнятим позначенням числа ступенів свободи є df (від англ.. – degrees of freedom – ступінь, рівень та свобода).

Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростування гіпотези. Статистичні критерії поділяються на параметричні й непараметричні. До формули розрахунку параметричних критеріїв належать показники розподілу, наприклад середні, дисперсії. Це класичні критерії, як z – критерій, t – критерій Стьюдента, F – критерій Фішера.

Непараметричні критеріїоперують – частотами, рангами та вірогідностями.

В статистиці за основний приймається варіант розглядати істинність нульової гіпотези та хибність альтернативної. Оскільки дослідження завжди проводиться на вибірці, а висновки робляться по відношенню до генеральної сукупності, то остаточне рішення про істинність чи хибність нульової та альтернативної гіпотези не можливе, можна тільки вказувати вірогідність помилки такого припущення.

Параметричні критерії Критерії, які містять у формулі розрахунку параметри розподілу, тобто середні і дисперсії (t-критерій Стьюдента, критерій F та ін) Непараметричні критерії Критерії, не містять у формулі розрахунку параметрів розподілу і засновані на оперуванні частотами або рангами (критерій Q Розенбаума, критерій Т Вілкоксона та ін)

 

Рівень значимості(поріг достовірності – β) є показником вірогідності безпомилкових висновків та прогнозів. Частіше всього в статистиці використовуються чотири стандартних рівня значимості – нульовий (β0=0,90), перший (β1=0,95), другий (β2=0,99) та третій (β3=0,999). Іншими словами, якщо дослідник задає нульовий рівень значимості, то його висновки та прогнози справедливі в 90% випадків (вірогідність рівна 0,90); якщо перший рівень – в 95% випадків і т.д.

Необхідно мати на увазі, що робота на кожному рівні значимості визначає мінімальний об’єм вибіркової сукупності, на якій проводиться дослідження. Так якщо об’єм вибірки (n) – від 20 до 30 досліджуваних, ми маємо право використовувати тільки нульовий рівень значимості, при n ≥ 30 – нульовий та перший рівень, при n ≥ 100 – β0 , β1 та β2 і нарешті при n ≥ 200 – всі чотири рівня. При малочисельних вибірках (n ˂ 20) надають перевагу методам непараметричної статистики, оскільки визначити характер розподілу досліджуваної ознаки на такій вибірці не є можливим.

Деякі дослідники в якості рівня значимості використовують величину α(або ρ), рівну 1 – β. В цьому випадку рівні значимості набувають наступного виду: α0 ≤ 0,10; α1 ≤ 0,05; α2 ≤ 0,01; α3 ≤ 0,001. Логічний сенс цих величин в тому, що вони характеризують вірогідність випадковості (вірогідність помилкових прогнозів). Іншими словами, це та вірогідність, яка припадає на долю випадкових (як правило, непередбачуваних) факторів.

Який власне критерій (α чи β) використовувати при статистичній обробці – справа самого дослідника, оскільки принципового значення не має.

 

Рівень статистичної значимості Рівень значущості – це ймовірність того, що ми визнали відмінності істотними, а вони насправді випадкові. Коли ми вказуємо, що відмінності достовірні на 5%-му рівні значущості, або при р<0,05, то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,05. Коли ми вказуємо, що відмінності достовірні на 1%-му рівні значущості, або при р<0,01, то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,01. Якщо перевести все це на більш формалізовану мову, то рівень значущості – це ймовірність відхилення нульової гіпотези, в той час як вона вірна. Помилка, яка полягає в тому, що ми відхилили нульову гіпотезу, в той час як вона вірна, називається помилкою 1 роду. Ймовірність такої помилки зазвичай позначається як α. По суті, ми повинні були б вказувати в дужках не р<0,05 або р<0,01, а α<0,05 або α<0,01. У деяких посібниках так і робиться (Руніон Р., 1982; Захаров В.П., 1985 та ін.) Якщо ймовірність помилки – це α, то ймовірність правильного рішення: 1–α. Чим менше α, тим більше вірогідність правильного рішення. Історично склалося так, що в психології прийнято вважати нижчим рівнем статистичної значущості 5%-ий рівень (р<0,05): достатнім – 1%-ий рівень (р<0,01) і вищим 0,1%-ий рівень (р<0,001), тому в таблицях критичних значень зазвичай приводяться значення критеріїв, що відповідають рівням статистичної значимості р<0,05 і р<0,01, іноді – р<0,001. Для деяких критеріїв у таблицях вказано точний рівень значимості їх різних емпіричних значень. Наприклад, для φ*=1,56 р=0,06.

Достовірність результатів дослідження.Про статистичну достовірність (статистичної значимості) результатів психологічного дослідження можна говорити в тих випадках, коли статистичний критерій (міра відмінностей, зв’язку, залежностей, впливу і т.д.) перевищує стандартне (критичне) табличне значення для даного рівня значимості. При рівності показників (tексп.= tкр.) достовірність відмінностей піддається сумніву (іноді говорять, що відмінності лежать на межі достовірності). Виключення складають деякі непараметричні критерії, наприклад, критерій Манна-Уітні, критерій Вілкоксона та критерій знаків G, де ступінь відмінностей або впливу вважається статистично значимою, коли емпірично отримані значення критерію менше критичного (табличного).

 

Правило відхилення Н0 та прийняття H1 Якщо емпіричне значення критерію дорівнює критичному значенню, відповідному р<0,05 або перевищує його, то Н0 відхиляється, але ми ще не можемо виразно прийняти H1. Якщо емпіричне значення критерію дорівнює критичному значенню, відповідному р<0,01 або перевищує його, то Н0 відхиляється і приймається H1. Винятки: критерій знаків G, критерій Т Вілкоксона і критерії U Манна-Уїтні. Для них встановлюються зворотні співвідношення.
Потужність критеріїв Потужність критерію – це його здатність виявляти відмінності, якщо вони є. Іншими словами, це його здатність відхилити нульову гіпотезу про відсутність відмінностей, якщо вона неправильна. Помилка, яка полягає в тому, що ми прийняли нульову гіпотезу, в той час як вона неправильна, називається помилкою II роду. Ймовірність такої помилки позначається як β. Потужність критерію – це його здатність не допустити помилку II роду, тому. Потужність=1-β Потужність критерію визначається емпіричним шляхом. Одні й ті ж завдання можуть бути вирішені за допомогою різних критеріїв, при цьому виявляється, що деякі критерії дозволяють виявити відмінності там, де інші виявляються нездатними це зробити, або виявляють більш високий рівень значущості відмінностей. Виникає питання: а навіщо ж тоді використовувати менш потужні критерії? Справа в тому, що підставою для вибору критерію може бути не тільки потужність, але й інші його характеристики, а саме: а) простота; б) більш широкий діапазон використання (наприклад, по відношенню до даних, визначеним за номінативною шкалою, або по відношенню до великих n); в) застосовність по відношенню до нерівних за обсягом вибірках; г) велика інформативність результатів.