Одержаних соціологічних даних

Методи обробки та статистичного групування

Перш за все, для того, щоб зібрані дані можна було обробити та узагальнити, заповнений інструментарій має пройти стадію попередньої підготовки до обробки.

Перший етап такої підготовки - перевірка методичного інструментарію на точність, повноту та якість заповнення.

Перевірка на точність заповнення полягає у виявленні правильної відповіді на кожне питання та у виправленні помилок у випадках їх наявності. Наприклад, у питанні: «чи знаєте Ви про основні планові заходи щодо відпочинку студентів, які розробив студентський профком на поточний рік?» - може бути обведеною відповідь «так, знаю». В той же час наступне відкрите питання: «Якщо знаєте назвіть будь-ласка їх» - залишається без відповіді. В даному випадку варіант відповіді «так, знаю» необхідно закреслити і відмітити позицію «немає відповіді».

Перевірка анкети, бланків інтерв'ю на повноту заповнення передбачає вибраковку тих із них, у яких відсутні відповіді на якісь питання відносно соціально-демографічних характеристик респондента (стать, вік, сімейний стан, освіта), то вона також підлягає вибраковці.

Перевірка анкет на якість заповнення полягає в уважному перегляді їх на предмет ясності, чіткості та зрозумілості відповідей, обводки кодів. Справа в тім, що незрозумілий (нечіткий, неакуратний) почерк виключає можливість точної і однозначної інтерпретації відповідей, робить анкету, бланк-інтерв'ю непридатними для обробки.

Всі анкети, бланки-інтерв'ю і т.ін., в яких мають місце перелічені вище недоліки, виключаються із подальшого процесу обробки. Ті ж документи, що залишились, нумеруються і об'єднуються за ознаками належності до одного і того ж респондента.

Наступний етап підготовки методичних документів до обробки полягає у кодуванні інформації.

Процедура кодування інформації являє собою допоміжний процес формалізації відповідей на питання, а також ряд інших моментів, пов'язаних із процедурою обробки та аналізу інформації.

Процедура кодування полягає в присвоєнні кожному варіанту відповіді умовного числа, яке називається кодом. Відповідно, вся інформація в анкеті чи бланку-інтерв'ю ніби-то «перетворюється» в упорядковану систему чисел. Коди мають бути безперервними, що означає: ні один код не може бути «загубленим». Також коди по­винні бути строго впорядкованими, тобто переміна їхніх місць не допускається. Якщо ці вимоги не дотримуються, то вся структура інформації порушиться.

В залежності від того, який вид програми передбачається для обробки інформації на комп'ютері, відповіді можуть бути закодованими двома способами: або суцільною нумерацією всіх позицій (так званапорядкова система кодування), або нумерацією відповідей у кожномупитанні автономно (позиційна система кодування).

Порядкова (лінійна) форма відповідей на питання 15: «Які фак­тори стимулюють Ваше навчання у вузі?» - може бути представлена у такому вигляді:

Як видно із прикладу, порядкові коди розташовуються, як правило, зліва, а позиційні - справа (щоб не переплутати з номером питання). Перед питанням стоїть номер 15, з чого робиться висновок, що в анкеті йому передували 14 питань і перша позиція наведеного питання закодована числом 078. Відповідно перша позиція наступного питання буде зазначена кодом 082.

Кодування інформації процес відповідальний. Тому є науково розроблені норми, скільки кодувальників треба залучати в тому чи іншому випадку. Розраховується це за формулою:

де J - кількість кодувальників;

n - об'єм вибіркової сукупності, а значить і кількість анкет; b - кількість питань у анкеті;

a - кількість питань, які може закодувати один кодувальник за день (500 питань);

t - час, за який треба виконати роботу.

Якщо у нас є 2 000 анкет, в кожній анкеті 40 питань, а процес кодування необхідно завершити за десять днів, то підставивши дані у формулу ми без зайвих зусиль визначимо, скільки кодувальників треба залучити до роботи:

Після завершення процесу кодування первинної соціологічної інформації, приступають до її обробки. Ще на стадії розробки програми вирішується питання про те як буде оброблятись інформація - вручну, чи за допомогою комп'ютера. Ручна обробка, як правило, застосовується тоді, коли дослідник має справу з невеликою кількістю анкет (декілька десятків). Якщо анкета невелика, то це число може бути збільшене до 200-250.

Для обробки даних на комп'ютері складається програма. Цю частину роботи виконують спеціалісти. Результати обробки оформляються у вигляді табуляграми. Дані в табуляграмі фіксуються, як правило, у формі, яка передбачена програмою обробки для відповід­ного типу комп'ютера.

Розглянемо логіку «прочитання» записів в табуляграмах на прикладах двох питань.

Питання 11. «Як Ви ставитесь до необхідності систематичної роботи, направленої на поглиблення своїх знань?» (варіанти відповідей: 1 - вважаю це корисною і необхідною справою; 2 - вважаю в цілому ці справою корисною, але для себе необов'язковою; 3 - не бачу користі і необхідності для себе у поглибленні знань; 4 - затрудняюсь відповісти).

Питання 32. «Як Ви навчаєтесь?» (варіанти відповідей: 1 - маю тільки відмінні оцінки; 2 - є відмінні і добрі оцінки; 3 - вчусь тільки на трійки).

Табуляграма, яка відображає поєднання відповідей на обидва питання (так зване-попарне розміщення даних), буде мати такий вигляд (всього опитано 2 000 респондентів):

Зазначення числових рядів в табуляграмі: в першому ряді вказа­ний номер, питання (32), що визначає рівень успішності; в другому ряді записані номери позицій питання 32; в третьому ряді вказується абсолютне число опитаних, які вибрали в якості відповіді першу позицію питання 11; в четвертому ряді даються ті ж відомості, але виражені у відсотках. Подальші рядки читаються аналогічно. В останній колонці (код 0) вказані абсолютні величини і відсотки від числа опитаних, що відмітили відповідно ту чи іншу позицію питан­ня 11. В останньому рядку табуляграми (код 0) вказані абсолютна величина та частка у відсотках опитаних, які відмітили відповіді позицій питання 32.

Наведений приклад - не єдиний вид запису узагальненої соціо­логічної інформації. Відображення соціологічних даних має ряд інших, більш складних математичних і геометричних форм. їх вибір залежить від глибини аналізу соціального явища, що вивчається.

Слід пам'ятати, що характер відображення соціологічних даних визначається насамперед формою узагальнення первинної інформації. Сама простіша його форма - групування. Підбиваючи підсумок відповідей на позиції питань анкети з урахуванням вибраного признака дослідник здійснює не що інше, як просте групування тих, хто відповів в залежності від їх соціально-демографічних ознак, установок, інформованості, оцінок і т.д. Виділені таким чином однорідні за складом групи значно легше співвідносити, порівнювати, аналізувати.

Вибір признака групування - не довільна процедура. В залежності від шкали виміру, відповідно з якою одержані відповіді на питання, групування соціологічної інформації може являти собою:

- зарахування респондентів до номінальних груп (групування опитаних за ознаками статі, національності, місця проживання і т.д.);

- упорядкування інформації у ранжированому ряді, наприклад за характером праці (ті, хто займаються ручною працею, ті, хто має справу з механізмами, працівники, що виконують розумову роботу);

- групування за кількісними ознаками, в результаті чого групи респондентів характеризуються числовою величиною і тому їх можна кількісно порівнювати між собою (наприклад, групування за віковими інтервалами: 18-25 років, 26-30 років, 31-40 років, 41-50 років, 50 років і старше).

В результаті групування виділяється не одна, а декілька груп. При цьому кожній виділеній групі відповідає деяке число, що визначає її кількісний склад. Такий ряд чисел, що одержується в результаті групування, називають рядом розподілення. Ряди розподілення, що відображають результат групування респондентів за якісними ознаками, називаються атрибутивними, а ті, що за кількісними ознаками - варіаційні. Відповідно до характеру кількісних ознак варіаційні ряди поділяються на дискретні і безперервні. Останні, як правило, мають інтервальний характер. Це означає, що та чи інша група респондентів характеризується за кількісною ознакою не одним числом, а числовим інтервалом, наприклад віковим інтервалом: 20-24 роки, 25-30 років і т.д.

Вибір інтервалів значною мірою залежить від дослідника і здійснюється відповідно до завдань дослідника. Так, вивчення пи­тання адаптації молодих спеціалістів на виробництві передбачає у показнику «стаж роботи» досить вузькі інтервали (1-3 місяці, 4-6 місяців, 7-9 місяців, 10 місяців - 1 рік), а от вивчення відмінностей у рівні професійної майстерності - більш широкі (1-3 роки, 4-5 років, 6-10 років).

Ряди розподілення поряд із числовою мають і текстову характеристику. Таке відображення даних паралельно з супроводжуючим пояснювальним текстом здійснюється за допомогою таблиць. Побудова таблиці відбувається згідно з установленими правилами. В назві повинен бути відображений основний зміст таблиці (коло питань, що розглядається, географічні кордони статистичної сукупності, час, одиниці виміру).

Таблиці можуть бути прості і комбінаційні.

Прості таблиці являють собою перелік, список окремих одиниць сукупності з кількісною (або якісною характеристикою кожної із них

окремо). Найбільш проста - перелікова таблиця складається на основу розподілення за однією ознакою (див. таблицю 1).

Таблиці, які відображають ряди розподілення за двома і більше ознаками, називаються комбінаційними (див. таблицю 2).

Така таблиця являє собою дещо більше, ніж простий перелік даних, вона є способом і, разом з тим, результатом певної організації даних. Добре сконструйована таблиця надає можливість досліднику більш чітко уявити та описати зміст і сутність соціального явища, що вивчається.

Таким чином, метод групування та подання матеріалу у вигляді статистичних таблиць вже створюють певні можливості для вивчення соціологічних даних. З іншого боку, подібні методи є необхідним засобом для подальшого аналізу та застосування більш досконалих статистичних методів.

Частотний розподіл може зображуватись також у вигляді діаграм та графіків. Основною перевагою графічного зображення є його наочність.

Графічна інтерпретація емпіричних залежностей заснована на знанні технічних правил побудови рядів, типів та властивостей теоретичних розподілів. Найпоширенішими графіками, що практикують­ся у соціології, є гістограма, полігон та комулята розподілення.

Для побудови полігона величина признака відкладається на вісі абсцис,а частота на вісі ординат. З точок, які відповідають значен­ням признака, будуються перпендикуляри, що дорівнюють по ви­сотічастотам. Вершини перпендикулярів сполучаються прямими лініями.

Для інтервального ряда ординати, пропорційні частоті (або відносній частоті) інтервала, будуються перпендикулярно вісі абсцис в точці, що відповідає середині даного інтервала.

Приведені дані розподілу випускників СумДУ по категоріям бакалавр, спеціаліст, магістр дають можливість побудувати полігон розподілу

Для графічного зображення варіаційних рядів застосовують та­кож кумулятивні криві. При побудові кумуляти, як і гістограми, на вісі абсцис відкладають границі інтервалів, а на вісі ординат - накопичені частоти (або відносні частоти), які відповідають верхнім межам інтервалів. Таким чином, кумулята являє собою ламану лінію, яка дає можливість швидко визначити процент осіб, які знаходяться нижче або вище заданої величини признака.