Дані протоколювання

Лекція 3

ПІДГОТОВКА ДАНИХ ДО МАТЕМАТИЧНОЇ ОБРОБКИ

 

Перш ніж приступати до математичні обробки результатів психологічних досліджень, експериментальний матеріалу необхідно належним чином підготувати. Психолог повинен дотримуватися двох необхідних умов. По-перше, дані мають бути представлені в найбільш компактній, зручній для обробки формі. По-друге, при упорядкуванні даних повен зберігатися максимум інформації, що міститься в них.

Підготовка даних до математичної обробки включає в себе кілька послідовних етапів: протоколювання, табулювання даних, створення таблиць згрупованих частот, побудова діаграм або полігона, розподіл частот і т. д.

Якщо психолог має під рукою персонального комп'ютера, завдання протоколювання значно спрощується. Будь-який програміст може зробити відповідні бази даних і всю необхідну інформацію про кожного досліджуваного ви можете занести до комп’ютера. Безсумнівно зручність комп'ютерного варіанту в тому, що в будь-який час ви можете отримати інформацію про контингент досліджуваних, які нас цікавлять – стать, вік, соціальний клас тощо. Якщо це неможливо, на кожного досліджуваного складається окремий протокол.

У протоколі необхідно відмітити прізвищета ініціали досліджуваного, статьта вік (за винятком випадків анонімного опитування, коли вказуються тільки ініціали, стать та вік). Недотримання цих вимог робить неможливим подальший аналіз результатів (у випадках, коли нас цікавить зв'язок вимірюваної змінної з віком та статтю досліджуваних).

Бажано вказати в протоколі датудослідження. Це особливо важливо в тих випадках, коли дослідження одної й тої ж вибірки проводиться повторно (період часу між повторними дослідженнями, наприклад, два тижні або півроку) має важливе значення, особливо коли мова йде про дітей.

В деяких випадках необхідно вказувати час доби, коли було проведено дослідження. Деякі психологічні та психофізіологічні змінні (час сенсомоторної реакції, концентрація та переключення уваги, об’єм оперативної пам'яті та інші) значною мірою залежать від рівня активності суб'єкта, ступеню його втоми, які не одинакові в різний час доби.

При необхідності в протоколі слід відмічати умови досліду (проводилось дослідження окремо чи в групі, наявність зовнішніх перешкод і т. д.). Всі інші дані по кожному або окремих досліджуваних дослідник відмічає на свій розсуд, тобто фіксується те, що психолог вважає найбільш важливим.

Складення зведених таблиць (табулювання даних)

Використання індивідуальних протоколів для математичної обробки результатів не дуже зручно. Представити матеріали в більш компактній формі, дані заносяться в зведену таблицю наступного вигляду:

№№ п/п Прізвище, ім'я, по батькові Інші дані (якщо необхідно) Досліджуваний показник
     
     
     
(n)

 

У ряді випадків перед складанням зведеної таблиці проводиться ранжування даних. Воно, зокрема, необхідне при визначенні. Для цього дані шикуються в загальний ряд за досліджуваною ознакою в порядку її зростання (або зменшення) наступним чином: х1х2х3 ≤ ... ≤ хn (або навпаки), де n – загальне число значень ознаки (обсяг вибірки). Знак «менше або дорівнює» передбачає, що у різних досліджуваних можуть зустрічатися однакові значення змінної.

Іноді навіть підсумкові таблиці можуть виявитися досить громіздкими і не цілком зручними для подальшої обробки. У цьому випадку матеріал можна зробити ще більш компактним, складаючи частотні таблиці (таблиці розподілу частот досліджуваної ознаки):

№№ п/п. ... n -1 n
xi              
fi              

 

У першому рядку дається номер значення змінної в ряду ранжування, у другому конкретне значення (величина ознаки) і в третьому частота повторюваності ознаки (число однакових значень ознаки у вибірці). Для того щоб отримані дані представити у ще більш компактному вигляді, використовуються таблиці розподілу згрупованих частот (варіаційний ряд).

Варіаційним рядом або рядом розподілу називають подвійний ряд чисел, який показує, яким чином числові значення ознаки пов’язані з їх повторюваністю в даній статистичній сукупності.

Приклад: з врожаю картоплі, зібраного з дослідної ділянки, випадковим чином, тобто навмання, відібрано 25 картоплин, в яких підрахували кількість вічок. Результати підрахунку виявились наступними: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 11, 9, 10. Щоб розібратися в цих даних розмістимо їх в ряд 9в порядку реєстрації результатів вимірювання) з врахуванням повторень варіант в цій сукупності:

 

Варіанти xi 6 9 5 7 10 8 11 12

Число варіант fi 1 7 1 2 6 4 3 1

 

Це і є варіаційний ряд. Числа, які показують скільки раз окремі варіанти зустрічаються в даній сукупності, називаються частотами та позначуються прописною буквою латинського алфавіту f. Загальна сума частот варіаційного ряду рівна об’єму даної сукупності, тобто . Де – сума (в даному прикладі сума частот варіаційного ряду), а n – загальне число спостережень, або об’єм вибірки.

Частоти виражаються не тільки абсолютними, але й відносними числами – в долях одиниці або процентах від загальної чисельності варіант, даної сукупності. В таких випадках їх називають відносними частотами або частостями. Загальна сума частостей дорівнює одиниці, тобто . Заміна частот частостями не обов’язкова, але іноді виявляється корисною та необхідною, коли співставляються варіаційні ряди, які значно відрізняються за об’ємами.

Варіаційний ряд являє собою впорядковану за зростанням неперервну послідовність класів виміряної ознаки.

Щоб побудувати варіаційний ряд при таких емпіричних значеннях х:

5, 4, 10, 10, 2, 9, 7, 1, 17, 8 необхідно виконати наступні дії:

1) визначити кількість класів виміряної ознаки використовуючи формулу Стерджесса: g = 1 + 3,322 lg n n – об’єм вибірки (к-ть значень ознаки)

g = 1 + 3,3 lg 10= 1 + 3,3 ×1= 4,3 ≈ 4

2) визначити ширину класу виміряної ознаки:

(ро) розмах (різниця між найбільшим та найменшим значенням)

3) сформувати класи виміряної ознаки. 1-й клас почати з найменшого значення серед результатів вимірювання та додати h.

2 клас (найменше +h) + h

класи Wi рознесення fі - частота Fі - накопичена частота
1 – 5 ǀǀǀ' 3,5 3,5
5 – 9 ǀǀǀ 6,5
9 – 13 ǀǀ' 2,5
13 – 17 ǀ

Wi – варіанта (середнє арифметичне)

fi – частота

Fi – накопичена частота

Накопичені частоти, в 5-му рядку, можуть використовуватися під час деяких статистичних обчислень (наприклад, щоб обчислити критерії l за Колмогоровим). Накопичені частоти вираховуються шляхом простого додавання частот від 1-го до N-гокласу: F1 = f1 ; F2 = f1 + f2 ; F3 = f1 + f2 + f3 і т. д.