Двухпараметрическая модель Бирнбаума.

Главным недостатком модели Раша теоретики считают пренебрежение «крутизной» характеристических кривых: «крутизна» их полагается одинаковой. Хотя задания с более «крутыми» характеристическими кривыми позволяют лучше «различать» испытуемых (особенно в среднем диапазоне шкалы способностей), чем задания с более «пологими» кривыми.

Параметр, определяющий «крутизну» характеристических кривых заданий, называют дифференцирующей способностью задания. Если тест содержит задания с различной дифференцирующей способностью, то однопараметрическая модель IRT не может описать такие эмпирические данные. Для преодоления этой трудности А.Бирнбаум ввел еще один параметр - a (item discrimination parameter). Он используется в двухпараметрической модели Бирнбаума.

Пусть параметр отражает уровень подготовленности i-го участника испытаний, а параметры и – некоторые параметры j-го тестового задания (и – любые числа, а – только положительные).

Модель Бирнбаума аналитически описывается формулой (1) или (2).

Данное выражение показывает, что вероятность успеха Pi зависит только от и поэтому модель Бирнбаума, получила название двухпараметрической.

Вероятность успеха Pij как функция от при фиксированных значениях и называется характеристической функцией j - го задания.

Исследование характеристических функций показывает, что и , т.е. с уменьшением уровня подготовленности участника вероятность верного решения задания уменьшается до 0, а при увеличении уровня подготовленности увеличивается до 1.

При увеличении параметра, характеризующего трудность задания, вероятность успеха для одного и того же уровня подготовленности уменьшается. При небольших значениях параметра характеристическая кривая является пологой, следовательно, для испытуемых с уровнем подготовленности и для участников тестирования с вероятности верного решения данного задания приблизительно равны. Если значение параметра велико, то вероятности успеха будут существенно различаться, поэтому параметр получил название коэффициента дискриминации. Этот коэффициент показывает, насколько хорошо данное задание различает участников тестирования с высоким, и низким уровнем подготовленности.

Параметр определяет «крутизну» кривой в точке ее перегиба; его значение прямо пропорционально тангенсу угла наклона касательной к характеристической кривой задания теста в точке .

Примеры характеристических кривых показаны на рис.11 Видно, что чем больше тем круче идет кривая, тем выше дифференцирующая способность задания.

Рис.11. Характеристические кривые заданий в двухпараметрической модели IRT

 

Интервал изменения параметра от –∞ до +∞. Если значения близки к 0 (для заданий разной трудности), то испытуемые, различающиеся по уровню выраженности свойства, равновероятно дают «ключевой» ответ на это задание теста. При выполнении такого задания у испытуемых не обнаруживается различий. Эти задания оказываются бесполезными при дифференциации испытуемых группы по оцениваемому параметру, так как они не несут информации об индивидуальных различиях учеников.

Парадоксальный вариант получаем при a=0. В этом случае более способные испытуемые отвечают правильно с меньшей вероятностью, а менее способные – с большей вероятностью. Опытные психодиагносты знают, что такие случаи встречаются в практике тестирования очень часто.

Еще более бесполезны задания с отрицательными значениями : на них отвечают правильно с большой вероятностью испытуемые с низким уровнем подготовки, а для знающих учеников с большими значениями 6 вероятность правильного ответа стремится к нулю. Число заданий в тесте должно сокращаться в первую очередь за счет устранения таких неудачных заданий даже в том случае, когда другие их характеристики устраивают разработчика теста. Как правило, такое сокращение приводит к повышению надежности и валидности теста.

Параметр может быть вычислен по следующей формуле: .

При = 1 задание соответствует однопараметрической модели Раша. Анализ характеристических кривых заданий одинаковой трудности, но разной крутизны, позволяет отобрать лучшие задания и определить разумные границы интервала для значений параметра . Практики рекомендуют использовать задания, характеризующиеся значением в интервале от 0,5 до 3.

Отбор заданий с большими значениями является одним из важных принципов при конструировании нормативно-ориентированного теста.

 

Как и модель Г. Раша, двухпараметрическая логистическая модель А. Бирнбаума имеет определенные недостатки, несколько сужающие область ее применения. Описанные модели не рекомендуется использовать в том случае, когда в тесте отдано предпочтение заданиям в закрытой форме. Для теста, содержащего задания с выборочными ответами, лучше обратиться к трехпараметрической модели.