Применимость различных моделей
Обсудим вопрос о степени пригодности моделей IRT для целей измерения латентных параметров.
Многие авторы, в частности Пол Клайн [1994], отмечают, что IRT обладает множеством недостатков. Для того чтобы получить надежную и не зависимую от испытуемых шкалу свойств, требуется провести тестирование большой выборки (не менее 1000 испытуемых). Тестирование достижений показывает, что существуют значительные расхождения между предсказаниями модели и эмпирическими данными.
В 1978 г. Вуд доказал, что любые произвольные данные могут быть приведены в соответствие с моделью Раша. Кроме того, существует очень высокая корреляция шкал Раша с классическими тестовыми шкалами (около 0,90).
Главный же недостаток IRT — игнорирование проблемы валидности. В психологической практике не наблюдается случаев, когда ответы на задания теста были бы обусловлены лишь одним фактором. Даже при тестировании общего интеллекта модели IRT неприменимы. Клайн рекомендует использовать модели IRT для коротких тестов с валидными заданиями (факторно простые тесты). В пособии Клайна «Справочное руководство по конструированию тестов» (Киев, 1994) приведен алгоритм конструирования тестов на основе модели Раша.
Характерной особенностью модели Раша является то, что характеристические кривые (ICC) не пересекаются. Это означает, что если некоторое задание «А» легче задания «Б», то это соотношение сохраняется во всем интервале изменения θ.
Совершенно иная картина наблюдается для двух- и трехпараметрической моделей. На рис.2. это хорошо видно. Задание с αj = 0,5 в области положительных значений θ является самым трудным из представленных трех заданий, то есть вероятность правильного ответа на это задание самая низкая. В области же отрицательных значений q это же задание теперь уже самое легкое - вероятность правильного ответа на него наибольшая. Получается, что для слабых учащихся это самое легкое задание, а для сильных учащихся - самое трудное.
Аналогичная картина наблюдается и для трехпараметрической модели. На рис.13. приведен пример пересекающихся кривых..
Рис.3. Пересекающиеся характеристические кривые задания в трехпараметрической модели. αj=1, βj=1.
Здесь у задания с параметром cj=0 изменена трудность βj= -1, что немедленно вызвало пересечение характеристических кривых. Задание с cj=0 в области θ < -2 является самым трудным. В области -1,5 < θ < -1 это задание легче задания с cj=0,25 и труднее задания с cj=0,5. В области θ > -1 задание с cj=0 является самым легким.
Подобное пересечение характеристических кривые задания практически всегда происходит для двух- и трехпараметрической моделей.
Таким образом, только однопараметрическая модель Раша соответствует требованиям, предъявляемым к качественному измерительному инструментарию. Именно модель RASCH MEASUREMENT больше всего пригодна для построения теста, как измерительного инструмента.