Таблиця 4.


Таблиця 3.

Кумулята розподілу шлюбного віку подружніх пар, які розлучаються

Поряд із графічним, більш глибоке узагальнення первинної соціологічної інформації передбачає визначення спеціальних статистичних величин (середньої арифметичної та дисперсії).

Середня арифметична - це інтегральна, узагальнена величина, яка дає можливість порівнювати між собою не тільки групи одного ряду розподілення, але й самі ряди розподілення в тих випадках, коли вони будуються за ідентичними ознаками. Загальна формула для її визначення має такий вигляд

де Хі - числове значення варіацій признака, і - число варіацій. Знак означає суму.

Розглянемо приклад визначення середньої арифметичної. Є три величини,які характеризують відвідування студентами практичних занять з соціології на початку семестру: перше заняття відвідали ЗО студентів, друге - 28 і третє - 32.

Така (проста) середня арифметична визначається в тих випадках коли групування інформації здійснюється за признаком, який не має варіацій і, відповідно, власних числових значень. Але таке буває досить рідко, адже більшість при знаків, для групувань, за якими визначають середнє значення є кількісними. Тому в соціологічному дослідженні, як правило, визначається так звана зважена середня арифметична.

Уявимо, що в результаті опитування 200 респондентів дали такі дані за ознаками «вік» і «кількість відвідувань обласного театру» (див. таблиці 3 та 4).

 

 

В таблицях наведені дані за двома показниками. Визначення середньої арифметичної для даних у кожній таблиці має свої особливості. Признак «кількість відвідувань обласного театру» має позиції, які виражені однозначними числовими величинами (один раз на місяць, два рази на місяць і т.д.). За ознакою «віку» вони розподілені в інтервалах (наприклад, від 41 до 50 років). Зважені середні арифметичні для значення признака визначаються за однозначними величинами, тому для інтервалів заздалегідь необхідно визначити середнє значення кожної позиції показника «вік» (дані у третьому стовпчику таблиці 5). Усереднення інтервалу відбувається шляхом визначення простої середньої для кожної градації віку (наприклад 41-50, або 31-40), тобто сума крайніх значень інтервалу ділиться на число цих значень (у нашому випадку на 2).

Наше завдання - виходячи із даних таблиці, визначити середню кількість відвідувань театру та середній вік у розрахунку на одного респондента. В таких випадках звішену середню арифметичну визначаємо за формулою:

де Хі - числове значення 1-ї позиції признака, Ni - число респондентів, виділених за першою позицією признака, N - загальне число респондентів, які підлягають групуванню

Підставивши у формулу значення із таблиці 4 за ознакою «кількість відвідувань обласного театру» одержимо:

Це означає, що на кожного опитаного в середньому припадає 1,6 відвідувань.

Визначення середньої для ознаки «вік» здійснюється за допомогою тієї ж формули, з використанням середніх значень по кожному інтервалу.

Таким чином, середній вік опитаних буде:

Недоліки середньої арифметичної як характеристики опитуваних за деякою ознакою полягають у тому, що вона може таїти в собі різну ступінь «розсіювання» значень, і тим самим якісне порівняння різних груп за даними характеристиками ускладнюється.

В таких випадках, для того щоб визначити ступінь рівномірності або нерівномірності тієї чи іншої характеристики опитуваних, застосовується формула розрахування ступеню розсіювання значень признака, якій називають дисперсією і позначають буквою (сігма в квадраті):

Значення дисперсії простіше визначити, якщо в таблицю заздалегідь внести окремі елементи та їх розрахунки (див. таблицю 5).

Дана таблиця складена на основі такого припущення. Є дві групи респондентів: в одній - 20, в іншій - ЗО чоловік. Протягом 4-х днів в першій групі відвідали бібліотеку (відповідно) 18, 20, 20, 18 чоловік; в другій групі 15, 23, 10, 28 - чоловік.

Враховуючи, що наш признак «відвідування» має однозначну інтерпретацію в кожному із чотирьох випадків, дисперсію можна визначити аналогічно простій середній.

Більшому значенню дисперсії відповідає і більше розсіювання признака (в нашому випадку - нерівномірність відвідування бібліотеки).

Більш поглиблений вид математичного аналізу характеристик явищ, що вивчаються, проявляється у виявленні їх взаємодії та тенденцій до змін. Здійснюється це за допомогою порівнянь і співставленнярядів розподілення, побудованих на основі групувань за різними ознаками. Для рішення подібних задач існують спеціальні коефіцієнти кореляції.

Кореляція означає наявність статистичного зв'язку при знаків. Із розрахунком одного із такий коефіцієнтів - коефіцієнта рангової кореляції (ро)варто ознайомитися, так як він легко піддається вирахуванню «вручну» (тобто без комп'ютера), а застосування його є досить ефективним при аналізі розподілу соціологічної інформації, одержаної за допомогою рангової шкали. Формула коефіцієнта рангової кореляції має такий вигляд:

де d - різність рангів; n - загальна кількість рангів, тобто варіанті відповідей; ∑d2- сума квадратів різниці рангів. Коефіцієнт рангової кореляції змінює свою величину від -1 до +1.

Фактично коефіцієнт рангової кореляції виявляє ступінь ідентич­ності розподілу відповідей двох груп, що порівнюються при відповіді на одне ітеж питання, позиції якого є показниками рангової шкали. При ρ= -1 порядок розподілу відповідей двох груп, що порівнюється прямо протилежний, а при ρ=+1 він повністю співпадає. Застосовується коефіцієнта рангової кореляції є ефективним також для порівняння даних анкетного опитування.

Розглянемо процедуру розрахунку коефіцієнта рангової кореляції, для чого проранжируємо за двома групами питання: «З яких джерел Ви частіше за все отримуєте необхідну наукову інформацію?» (див. таблицю 6).

Ранжирування відповідей побудуємо так, щоб максимальна кількість тих, хто звертається до того чи іншого джерела була зазначеначислом 1, менш значима - числом 2 і так дальше до 8 в міру зменшення кількості. Результати покажемо в таблиці 6.

Число позицій (або рангів) дорівнює: п=8. відповідно до одержаних значень маємо:


 

Відповідно із визначеним значенням коефіцієнта можна зробити висновок, що характер звертання до джерел наукової інформації в цілому подібний в обох групах.

Наведених методів узагальнення та відображення соціологічних даних в принципі достатньо для того, щоб вирішити проблеми, які виникають в процесі соціологічних досліджень на рівні підприємство, район, місто.

В тих же випадках, коли необхідно вирішувати якусь специфіч­ну проблему, яка вимагає застосування методів багатомірного аналізу, доцільно звернутись за допомогою до спеціалістів з математичної статистики і програмування.