Надежность теста

Гомогенность тестовых заданий

При конструировании теста необходимо иметь четкое представление о содержании заданий, которые предполагается включить в окончательную версию теста. Содержание заданий должно отвечать свойству гомогенности, указывающему на степень его однородности с точки зрения оцениваемого качества ученика. Таким образом, гомогенность (однородность) - это характеристика задания, отражающая степень соответствия его содержания измеряемому свойству ученика. В педагогических итоговых тестах роль оцениваемого свойства отводится уровню подготовки по предмету.

Надежность теста показывает, на сколько точно данный тест измеряет изучаемое явление. Надежный тест - это тест, который внутренне согласован, и дает одни и те же результаты для каждого испытуемого при повторном тестировании. Надежность характеризует точность теста как измерительного инструмента, устойчивость его к действию помех.

Надежность — это характеристика психодиагностической методики, отражающая точность психодиагностических измерений, а также устойчивость (стабильность) результатов теста к действию посторонних случайных факторов.

В психологии термин надежность применяется в двух значениях.

1) Тест называется надежным, если он является помехоустойчивым. То есть при проведении теста в других условиях он дает схожие результаты. Говоря о других условиях, мы должны помнить о том, что инструкция достаточно четко должна задавать условия для проведения тестирования, поэтому эти другие условия должны находиться в рамках, определяемых инструкцией.

2) Тест называется надежным, если он является внутренне согласованным (гомогенным).

Н. Гронлунд считает: тесты по оценке результатов должны быть надежными и в связи с этим их обработка должна осуществляться очень тщательно. Если балл, полученный учеником в результате теста, по оценке результатов будет соответствовать той оценке, которую они получили бы при повторном прохождении того же теста или идентичного с ним по форме, то данная оценка считается высоко надежной. Все тестовые результаты содержат некоторый процент ошибок, но процент ошибок может быть уменьшен путем увеличения количества и усовершенствованием качества вопросов, задаваемых в тесте. Чем длиннее тест, тем более надежными и адекватными будут результаты».

Посмотрим, какие факторы оказывают влияние на надежность тестового инструментария. Это особенно важно, поскольку знание этих факторов позволит обратить на них внимание при разработке тестового инструмента и, следовательно, предотвратить низкую надежность и, с другой стороны, в случае получения неудовлетворительных показателей надежности может подсказать пути их повышения.

Источники неудовлетворительной надежности могут быть разбиты на 3 группы: а) связанные с качеством теста, б) процедурой его проведения и оценивания и в) связанные с испытуемыми.

А) 1. величина теста.

Чем длиннее тест, тем он надежнее. Поскольку общая оценка состоит из истинной составляющей и ошибочной. Истинная составляющая несомненно больше ошибочной, и чем больше заданий в тесте, тем скорее сумма истинной составляющей будет возрастать, а ошибочной соответственно уменьшаться.

2. непонятность и двусмысленность заданий

Непонятные и двусмысленные задания приводят к тому, что ответы на них даются случайным образом. То есть в двух тестированиях будут получены разные результаты, таким образом корреляция между рузультами тестирований снизится и , следовательно, надежность будет низкой.

3. случайное угадывание правильных ответов

Еще раз подчеркнем нежелательность использования заданий альтернативных ответов в виде единичного утверждения.

Б) 4. субъективное оценивание и ошибки в подсчетах

Результаты выполнения заданий должны оцениваться одинаково разными проверяющими.

Это будет зависеть от однозначности правильного ответа.

5. инструкции к тесту могут быть причиной низкой надежности.

В) 6. источники, связанные с испытуемыми.

Усталость, скука, невнимательность, жара или холод, различная мотивация. Все эти факторы снижают надежность теста. Однако в том случае, если выборка для апробации теста достаточно велика, а инструкция для проведения четко определяет условия проведения ( в том числе ситуативным отвлекающих факторов: температура, освещение, запахи, шумность и т.д.) , то многие из перечисленных источников удается нейтрализовать и ионии не могут оказать существенного влияния на надежность теста.

Исходя из перечисленных причин, можно наметить пути повышения надежности тестов- увеличение длины теста, проверка объективности оценочной схемы, снижение вероятности угадывания правильных ответов, повышение качества инструктажа и др.

 

Существует ряд способов проверки надежности теста:

На практике используются 3 основных метода оценки тестовой надежности:

1) метод параллельных форм – когда задается аналогичный вариант уже использованного теста, позволяющий проверить правильность отбора заданий, оптимальность структуры теста, возможность построения различных вариантов на основе типового теста;

2) ретестовый метод, или повторное тестирование, предусматривающий сравнение результатов одного и того же теста: чем выше показатели, тем менее чувствителен результат к изменениям состояния тестируемого, к обстановке тестирования;

3) метод внутренней согласованности форм теста или метод расщепления, суть которого состоит в том, что он предполагает разделение теста на равные части с четными и нечетными номерами заданий, предлагаемые как самостоятельные, не связанные один с другим тесты. Тестируемый, таким образом, должен выполнить тест, состоящий их двух равноценных по трудности частей. Подсчет баллов ведется отдельно по условным – первому и второму – тестам.