Абсолютна шкала

Розглянемо таку шкалу, яка має і абсолютний нуль, і абсолютну одиницю. Ця шкала не єдина з точністю до деякого перетворення, а просто єдина, унікальна. Саме такими якостями володіє числова вісь, яку істотно назвати абсолютною шкалою. Важливою особливістю абсолютної шкали порівняно із усіма іншими є її безрозмірність та абсолютність її одиниці. Вказана особливість дозволяє виконувати над показами абсолютної шкали у явній формі такі операції, що недопустимі для показів інших шкал, - вживати ці покази у якості показника степеня та аргументу логарифма. Числова вісь використовується як вимірювальна шкала у явній формі при підрахунку предметів, а як допоміжний засіб присутня у всіх інших шкалах.

Підсумкова таблиця вимірювальних шкал

 

Назва шкали Визначальні відношення Еквівалентне Перетворення шкал Допустимі операції над даними (первинне оброблення Вторинне оброблення даних
Номінальна Еквівалентність Перестановки найменувань Обчислення символу Кронекера δij Обчислення відносних частот та операцій над ними
Порядкова Еквівалентність; перевага Не змінюючи порядку (монотонне) Обчислення δij та рангів Ri Обчислення відносних частот та вибіркових квантилей, операції над ними
Інтервальна Еквівалентність; перевага; зберігання відношення інтервалів Лінійне перетворення y = ax+b, a > 0 Обчислення δij , рангів Ri та інтервалів (різниць між спостереженнями) Арифметичні дії над інтервалами
Циклічна Еквівалентність; перевага; зберігання відношення інтервалів; періодичність Зсув y = x+nb, b – const, n = 0,1,2,… Теж, що і для інтервальної шкали Теж, що й для інтервальної шкали
Відношень Еквівалентність; перевага; зберігання відношення інтервалів; зберігання відношень двох значень Розтягування y = ax, a > 0 Усі арифметичні операції Довільне необхідне оброблення
Абсолютна Еквівалентність; перевага; зберігання відношення інтервалів; зберігання відношень двох значень; абсолютна та безрозмірна одиниця; абсолютний нуль Шкала унікальна Усі арифметичні операції; використання у якості показника степеня, основи та аргументу логарифму Довільне необхідне оброблення

 

11. Поняття розпливчастості (нечіткості)

У дійсності зустрічаються (набагато частіше, ніж здається) випадки, коли про тотожність чи різницю двох станів та/або спостережень не можна стверджувати із повною впевненістю. Найбільш явно це видно на прикладі шкал, у котрих класи позначаються конструкціями природної мови. “У нашу кімнату зайшла висока молода людина” – клас, до якого належить людина, названий (тобто вимір відбувся), проте якого зросту та скільки їй років? “У руках він (вона) тримала досить важкий пакунок” – якої ваги була ця ноша? Якщо розібратися, то майже кожне слово позначає деяку не зовсім визначену множину. (“Майже” – який відсоток? “Наше” – чиє саме? “Деяке” – яке ж? “Не зовсім” – наскільки? “Визначене” – ким та як? І т.д.). Це властивість природної мови, природне та невід’ємне, безперечне, корисне (інакше б воно не закріпилося у процесі розвитку мови), проте приводить до утруднень, коли невизначеність, що його супроводжує, заважає. Древні логіки диспутували питання про те, скільки піщинок мають бути зібраними разом, щоби отрималася купа піску; сьогодні ми просто кажемо, що слово “купа” – це лише мітка не чітко визначеної множини. Спір про те, скільки піщинок у “купі”, еквівалентний суперечці про те, в якому віці людина стає “старою” або скільки волосинок повинно у неї випасти, щоби стати “лисим”.

Ця невизначеність смислу мовних конструкцій являється однією з основних перешкод аналізу та синтезу мови, автоматичного (та й не тільки автоматичного) перекладу з однієї мови на іншу. Наприклад, одному англійському реченню, що складається із п’яти слів, можна дати п’ять різних (!) смислових інтерпретацій:

TIME FLIES LIKE AN ARROW

ЧАС ЛЕТИТЬ СТРІЛОЮ

ЧАС ЛЕТИТЬ У НАПРЯМКУ СТРІЛИ

МУХАМ ЧАСУ ПОДОБАЄТЬСЯ СТРІЛА

ВИМІРЮЙ ШВИДКІСТЬ МУХ ТАК ЖЕ, ЯК ШВИДКІСТЬ СТРІЛИ

ВИМІРЮЙ ШВИДКІСТЬ МУХ, СХОЖИХ НА СТРІЛУ

Невідомо, чи дійсний цей факт або це науковий фольклор, оснований на потенційній можливості, але у літературі по автоматизації перекладу наводяться дані про кільцеву роботу програм, що перекладають з однієї мови на іншу: фраза “плоть слабка, а дух сильний” після декілька перекладів перетворилася у “м’ясо тухле, але горілка міцна”.

Усе сказане мотивує введення поняття лінгвістичної змінної як змінної, значення якої розпливчате по своїй природі, як мітки розмитої, нечіткої множини. Хоча побудована Л. Заде теорія нечітких множин прекрасно ілюстрована мовними прикладами і має цікаві застосування, нечіткість виявляється властивістю не тільки природної мови. Наприклад, у математиці з успіхом застосовуються поняття “значно більше” (символ ») та “приблизно дорівнює” (символ ≈), що являються типово нечіткими.

 

12. Реєстрація експериментальних даних та її зв’язок із наступним опрацюванням

Результати довільного експерименту фіксуються у тій чи іншій формі, а далі використовуються для тієї цілі, заради якої й виконувався експеримент. Іноді ці операції суміщені у часі, наприклад при автоматичному керуванні виробничим процесом, при автоматизації експериментів у реальному часі тощо. У деяких же видах людської практики (наукові дослідження; системний аналіз; контроль, ревізія, слідство та інші види адміністративної діяльності; учбові експерименти тощо) оброблення експериментальних даних являється окремим, самостійним етапом, проміжним між етапами отримання інформації (виміри) та її використання (прийняття рішень та їх виконання). У таких випадках вихідною інформацією для оброблення являються протоколи спостережень (інколи називають матрицями даних, експериментальними таблицями).

Характер самих протоколів спостережень та методи їх оброблення залежать від того, яка модель, для уточнення якої ставиться експеримент: фактично оброблення даних – це просто перетворення інформації до вигляду, зручному для використання, переклад відповідей природи з мови вимірів на мову моделі. Наші знання можуть бути як первинними, грубими, так і далеко просунутими, добре структурованими, хоча їх треба уточнити. Відповідні два типи моделей різні автори називають по-різному, залежно від того, що вони хочуть підкреслити: дескриптивні та конструктивні, якісні та кількісні, декларативні та процесуальні, класифікаційні та числові. Ми користуємося останніми термінами: відмітимо, що у них відображена і та різниця, що класифікаційні моделі описують множину різних об’єктів, а числові – один об’єкт (або множину схожих об’єктів). Відмітимо також, що у моделі можуть брати участь кількісні змінні, і це не змінює її якісний характер (наприклад, діагноз хворому ставиться на підставі кількісних аналізів); аналогічно, у числових моделях частина змінних може вимірюватися у слабких шкалах.

 

13. Класифікаційні моделі

Класифікаційні моделі являються основоположними, первинними, вихідними формами знання. Пізнавання навколишніх предметів – типовий приклад класифікаційних процесів у розумовій діяльності. І у науці пізнання починається із співвідношення даного об’єкта з другим, виявлення схожості та різниці між ними. Тому протоколи спостережень на класифікаційному рівні експерименту містять результати виміру ряду ознак X для підмножини A об’єктів, вибраних із множини G: кожний об’єкт ai AG має значення ознак xi = (xi0,xi1,…,xin) {X0,X1,…,Xn} = X, i = , n- число ознак, N - число об’єктів в A. Ознака характеризує конкретну властивість об’єкта, тому іноді такий протокол називають таблицею “об’єкт – властивість”.

Як вже згадувалося, способи оброблення протоколу залежать від мети оброблення. Часто виявляється, що задача може бути сформульованою як визначення по спостережуваним значенням ознаки x = (xi0,xi1,…,xin) значення не спостережуваної (“цільової”) ознаки x0. Як правило, цільовими ознаками являються ті параметри моделі, котрі вимагається уточнити по експериментальним даним.

 

14. Типи задач для класифікаційних моделей

Кластерізація (пошук “істотного” групування об’єктів). Не задані а ні границі класів у просторі ознак, а ні число класів. Треба їх визначити, виходячи із “близькості”, “схожості” або “різниці” описів об’єктів xi = (xi0,xi1,…,xin). Компоненти вектора X0 – ознаки кластера, значення котрих підлягають визначенню.

Класифікація(розпізнавання образів). Число класів задане. Якщо також задані межі між класами, то маємо апріорну класифікацію; якщо межі вимагається знайти, оцінити по класифікаційним прикладам, то задача називається розпізнаванням образів по навчальній вибірці. Цільова ознака X0 має значення у номінальній шкалі (імена класів).

Впорядкування об’єктів. Вимагається встановити відношення порядку між х10, х20,...,xn0j (або деякої їх частини) по визначеному критерію переваги.

Зменшення розмірності моделі. Класифікаційні моделі як первинні, “сирі”, враховують множину припущень, котрі ще треба перевірити. Так сам список ознак формується евристично, часто із “запасом”, і виявляється досить довгим, але головне надлишковим, містить “дублюючі” та “шумові” ознаки. Тому одна з важливих задач вдосконалення моделей полягає у зменшенні розмірності моделі за допомогою відбору найбільш інформативних ознак, “склеювання” декількох ознак в одну тощо.

 

15. Числові моделі

Числові моделі відрізняються від класифікаційних тим, що: 1) цільові ознаки вимірюються у числових шкалах; 2) числа являють собою функціонали або функції, котрі не обов’язково всі являються числовими); 3) у них достатньо частіше враховуються зв’язки змінних у часі (у класифікаційних задачах час іноді навіть називають “забутою” змінною). Зв’язку з цим і протоколи спостережень можуть не обов’язково відноситись до множини об’єктів: модель можна уточняти і по експериментам з одним об’єктом у різні моменти часу.

 

16. Типові задачі для числових моделей

Непрямі виміри (оцінка параметрів). Вимагається визначити значення x0 по заданій множині {xij}. На відміну від класифікації x0 вимірюється не у номінальній, а у числовій шкалі. Якщо {xij} визначені до якогось моменту t0, а x0 вимагається оцінити для t > t0, то задача називається прогнозуванням (Прогнозування має смисл і в задачі класифікації; наприклад, рання діагностика захворювання).

Пошук екстремуму (планування експерименту). Вважається, що є можливість покрокової зміни величин {xij(tk)}, tk = t0 + kΔt, k = 0,1,2,.... Вимагається змінити їх так, щоби нарешті отримати екстремальне значення цільової ознаки x0.

 

17. Особливості протоколів спостережень

Велика розмірність. У багатьох дослідженнях число об’єктів та число ознак великі, так що добуток досягає декількох порядків. Врахування часу призводить до збільшення розмірності блоку даних. “Прокляття розмірності” притаманне і для комп’ютерів.

Різнотипність даних. Різні ознаки можуть вимірюватися у різних шкалах. Більшість алгоритмів розроблені для оброблення однотипних змінних, що часто викликає необхідність приводити різнотипні дані до одної шкали. Ясно, що більш правильною стратегією поведінки є розроблення алгоритмів, спеціально побудованих, щоби була можливість оброблення різнотипних даних, не вносячи в протокол ніяких змін, не пов’язаних з експериментом.

Пропущені значення. Незаповнена частина таблиці даних – не такий вже рідкий випадок, особливо якщо експеримент виконується не у лабораторних, а у природних умовах. Виключити з таблиці строку та стовпчик, на пересіченні котрих знаходиться пусте місце, вихід далеко не завжди прийнятний. Можна, використовуючи надмірність таблиці, якимось чином “відновити” пропущені значення, а далі обробляти таблицю так, начебто їх і не було. Однак критерій “відновлення” та мета оброблення повинні бути погодженими.

Зашумливість. Досить часто занесені у протокол виміри насправді відрізняються від вимірюваного значення на деяку випадкову величину. Статистичні властивості цієї додаткової завади можуть не залежати від вимірюваної величини, і тоді кажуть про адитивний шум. У протилежному випадку має місце неадитивна або залежна завада.

Викривлення, відхилення від припущень. Приступаючи до оброблення протоколу спостережень, завжди виходять із деяких припущень про природу величин, що занесені у протокол. Довільний спосіб оброблення дає результати очікуваної якості тільки у тому випадку, якщо дані відповідають деяким припущенням. Далеко не завжди у ході оброблення даних звертають увагу на те, чи дійсно дані відповідають припущенням, що закладені в алгоритм оброблення.

Запитання для роздумів, самоконтролю, повторення

 

1. У чому полягають сучасні поняття експерименту?

2. Які вимірювані шкали Вам відомі?

3. Що таке шкала найменувань?

4. Що таке порядкові шкали?

5. У чому полягають бальні оцінки знань учнів?

6. Що таке шкала інтервалів, відношень та абсолютна шкала?

7. Поясніть поняття розпливчастості (нечіткості).

8. Як фіксуються результати експериментів?

9. Які класифікаційні моделі Вам відомі?

10. У чому полягають особливості протоколів спостережень?