Шкали найменувань
Розглянемо об'єкти, про будь-які два стани яких можна сказати, розрізняються вони чи ні. Крім того, зосередимо увагу на таких алгоритмах вимірювань, що різним станам системи ставлять у відповідність різні позначення, а еквівалентним (тотожним) - однакові. Тобто приймемо, що можливі стани об'єкта та їх позначення задовольняють таким аксіомам тотожності:
1.Або А = В, або А≠В.
2.Якщо А = В, то В = А.
3.Якщо А = В і В = С, то А = С.
Тут символ «=» означає рівність, якщо А і В - числа, і еквівалентність (тотожність) - в інших випадках.
Припустимо, що кількість станів, які розрізняються (класів еквівалентності), має певне (скінченне) значення. Кожному класу поставимо у відповідність позначення, яке відрізняється від позначень інших класів. Вимірювання буде полягати у визначенні належності результату до того чи іншого класу еквівалентності. Множина символів, що позначають різні класи, утворює шкалу найменувань (рівнозначні терміни - номінальна шкала, класифікаційна шкала). Її зручно використовувати для класифікації дискретних за своєю природою об'єктів. Прикладами таких шкал можуть служити сукупності держав світу, родів військ у Збройних силах України, будинків на певній вулиці тощо.
При великій кількості класів еквівалентності, зокрема при розробці систем поштових адрес, автомобільних номерів й ін., позначення зручно вводити ієрархічно. Шкали найменувань можна використовувати також і при описі неперервних об'єктів. У таких випадках неперервна множина розбивається на скінченну кількість підмножин, кожна з яких утворює окремий клас еквівалентності.
Межі класів часто є умовними, що в окремих випадках може породжувати проблеми. Зокрема, говорять про сім кольорів райдуги, але думки двох різних людей про те, яка довжина хвилі відповідає, наприклад, межі між синім та фіолетовим кольорами, як правило, не збігаються. В українській та російській мовах розрізнюють синій та голубий кольори, а в англійській - вони позначаються однією назвою «blue», іноді голубий колір позначають словосполученням «light blue», тобто світло-синій. Іншим прикладом може служити часта розбіжність думок викладача й студента про те, яку оцінку варто поставити останньому на іспиті.
При обробці експериментальних даних, зафіксованих у номінальній шкалі, з самими даними можна виконувати тільки одну операцію - перевірку їх збігу чи розбіжності. Результат цієї операції можна виразити за допомогою символу Кронекера:
δij = { 1: xj = xi ; 0 : xj ≠ xi},
де xi, xj - записи різних вимірів. Із цими результатами можна виконувати більш складні операції, зокрема, розраховувати кількості збігів (кількість спостережень k-го класу , п - загальна кількість спостережень), обчислювати відносні частоти класів (рк = пк/п), порівнювати ці частоти між собою тощо. При цьому необхідно стежити, щоб з вихідними даними не виконувалися ніякі дії, крім їх перевірки на збіг.
Завдання. Наведіть приклади застосування шкали найменувань.
3. Порядкові шкали
У багатьох випадках вимірювана ознака стану системи дає змогу не тільки ототожнити стан з одним із класів еквівалентності, а й порівнювати різні класи в певному відношенні. Якщо таке порівняння не здійснювати, то частина корисної інформації буде втрачена. У зв'язку з цим розроблені більш сильні вимірювальні шкали, ніж шкала найменувань.
Наступною за силою після номінальної є порядкова (рангова) шкала. Порядкові шкали використовують, якщо класи, крім аксіом тотожності, задовольняють також таким аксіомам упорядкованості:
4.Якщо А > В, то В < А.
5.Якщо А > В і В > С, то А > С.
Прикладами шкал простого порядку є військові звання, рейтинги впливовості політиків, нумерація черговості тощо. У таких шкалах класи позначаються деякими символами, між якими встановлюються ті самі відносини порядку, що й між класами.
Однак можлива ситуація, коли два класи не можна впорядкувати за перевагою, і вони вважаються рівними. Тоді замість аксіом 4 і 5 будуть виконуватися такі аксіоми:
4*. Якщо А < В, то А > В.
5*. Якщо А > В і В > С, то А > С.
Шкала, що відповідає аксіомам 4 і 5 , називається шкалою слабкого порядку. Прикладами таких шкал є впорядкування людей за ступенем споріднення з певними особами, студентських груп за курсами, працівників за стажем роботи й таке інше.
Разом з тим іноді виявляється, що деякі пари класів не можна порівняти між собою, тобто неможливо зробити вибір А >В чи В > А. У таких випадках вводять шкалу часткового порядку. Подібні шкали часто зустрічаються в соціологічних дослідженнях. У людей можуть виникати труднощі при впорядкуванні за перевагою політичних партій, улюблених занять, різних груп товарів тощо.
Характерною рисою порядкових шкал є те, що встановлення відносини порядку не дає інформації про відстань між класами. Тому над порядковими експериментальними даними, навіть якщо вони зображуються числами, не можна виконувати різні дії, як над звичайними числами. Зокрема, не коректно знаходити вибіркове середнє порядкових вимірів. З цими числами можна виконувати тільки дві операції - перевірку їх збігу чи розбіжності, а також визначення кращого результату спостережень. Остання операція формально може бути виражена через різницю t = хi – хj. Введемо індикатор позитивних чисел
- функцію С(t) = {1: t ≥ 0; 0: t < 0}. Число , де п - кількість порівнюваних об'єктів (1≤ Ri ≤ n), називають рангом і-го об'єкта. Якщо має місце слабкий порядок, то частина спостережень збігається (така група спостережень називається зв'язкою), і всі вони одержують той самий (як правило, старший для них) ранг. Іноді використання старшого рангу є незручним. У таких випадках усім спостереженням присвоюється середній для зв'язки ранг (мідранг) або випадково - ранги від молодшого до старшого.
Обробка даних ґрунтується на використанні величин δij та Ri.
Для цих чисел можна знаходити частоти й моди, вибіркові медіани (тобто спостереження з рангом Ri найближчим до п/2), вибіркові квантілі будь-якого рівня р (тобто спостереження з рангом Ri, найближчим до величини пр, 0 < р < 1), коефіцієнти рангової кореляції між двома серіями порядкових спостережень і таке інше.
При використанні порядкових шкал варто мати на увазі, що вони визначені тільки для заданого набору порівнюваних об'єктів. Для цих шкал немає загальноприйнятого чи тим більше абсолютного стандарту.
Завдання. Чому порядкові шкали є більш сильними, ніж шкала найменувань? Наведіть приклади вимірювальних шкал, що відповідають співвідношенням 4, 5 і 4*, 5*.