Трехпараметрическая модель Бирнбаума.

Все тесты можно разделить в зависимости от формального типа ответов испытуемого на «открытые» и «закрытые». В тестах с «открытым» ответом, к которым относятся тест WAIS Д. Векслера или методика дополнения предложений, испытуемый сам порождает ответ. Тесты с «закрытыми» заданиями содержат варианты ответов. Испытуемый может выбрать один или несколько вариантов из предлагаемого множества. В тестах способностей (тест Дж. Равена, GABT и др.) предусмотрено несколько вариантов неправильного решения и один правильный. Испытуемый может применить стратегию угадывания. Вероятность угадывания ответа , где п — число вариантов.

Результаты эмпирических исследований показали, что относительная частота решения «закрытых» заданий отклоняется от теоретически предсказанных вероятностей двухпараметрической модели Бирнбаума. Чем ниже уровень способностей испытуемого (низкие значения параметра q), тем чаще он прибегает к стратегии угадывания. Аналогично, чем труднее задание, тем больше вероятность того, что испытуемый будет пытаться угадать правильный ответ, а не решать задачу.

Попытки выяснить причины такого отклонения привели Ф. Лорда, А. Бирнбаума и других создателей теории IRТ к выводу о влиянии эффекта угадывания правильного ответа на достоверность эмпирических результатов выполнения теста.

Возможно, что испытуемые с различным уровнем знаний пользуются различными методами при выборе правильного ответа. Вернее, методом пользуются только те, кто обладает достаточными знаниями для правильного выбора. Другие же, знания которых характеризуются низкими значениями параметра , просто угадывают правильный ответ. И чем труднее задание, тем вероятнее, что ответ получен именно путем догадки. Для того чтобы учесть фактор угадывания, А. Бирнбаум предложил трехпараметрическую логистическую модель, которая позволила бы учесть влияние угадывания на результат выполнения теста.

Для еще лучшего соответствия эмпирическим данным А.Бирнбаум ввел третий параметр c - параметр угадывания. (4).

Величина параметра определяется количеством ответов к закрытым заданиям теста. Например, для задания с пятью ответами по классическому определению вероятности е.- 0,2, при четырех предложенных ответах с = 0,25 и т. д.

Из формулы (4) видно, что при cj=0 и aj=1 эта формула переходит в однопараметрическую модель. По этой причине иногда говорят, что модель Раша является частным случаем двух и трехпараметрической моделей Бирнбаума. Формально это так, но по существу это неверно.

На рис.12. приведены примеры характеристических кривых для трех заданий с трудностью β = 1, дискриминационным параметром aj = 1 и различными параметрами угадывания cj = 0, cj = 0,25, cj = 0,5.

Рис.12. Характеристические кривые заданий в трехпараметрической модели IRT

 

Из приведенных графиков видно, что наличие параметра угадывания приводит к пропорциональному смещению характеристических кривых заданий вверх на величину cj. Тем самым даже самый неспособный испытуемый не может показать нулевой результат. Дифференцирующая сила тестового задания при введении параметра снижается. Из этого следует нетривиальный вывод: тесты с «закрытыми» заданиями (вынужденным выбором ответа) хуже дифференцируют испытуемых по уровням свойства, чем тесты с «открытыми» заданиями.

Применение трехпараметрической модели значительно осложняет анализ и обработку статистических данных в процессе конструирования теста. Введение третьего параметра с. не только существенно снижает точность оценок других параметров, но и ухудшает сходимость итерационных методов, используемых для повышения точности оценок латентных переменных 0 и р. Один из наиболее распространенных итерационных методов строится на подсчете оценок

Модель Бирнбаума не объясняет парадоксального, но встречающегося в практике тестирования феномена: испытуемый может реже выбирать правильный ответ, чем неправильный.

 

Еще одну модель предложил В. С. Аванесов. В IRT не решается проблема валидности: успешность решения задачи зависит в моделях IRT только от одного свойства. Иначе говоря, каждое задание теста считается априорно валидным.

Аванесов обратил внимание на это обстоятельство и ввел дополнительный, четвертый, параметр, который можно обозначить как внутреннюю валидность задания. Успешность решения задания определяется не только «основной» способностью (q), но и множеством условий, нерелевантных заданию, однако влияющих на деятельность испытуемого.

Четырехпараметрическая модель представляет, по мнению ряда исследователей, лишь теоретический интерес: