Классические шкалы оценки знаний

Развитие образования » Оценка качества теста » Классические шкалы оценки знаний

Страница 4

В целом, метрики качества знаний при классическом подходе обоснованы статистической калибровкой методов по соответствующей популяции. Со времён создания IQ метрологическое обоснование измерений знаний проводится по распределениям баллов, вычисленных по соответствующему контингенту респондентов. Например, указываются средние значения IQ по возрастным, социальным или профессиональным группам. Однако из разницы IQ непонятно, какие принципиальные отличия в структуре знаний различают эти группы.

Item Response Theory

В качестве средства обеспечения содержательной корректности метрик качества знаний в 50-е годы была предложена и с начала 80-х годов стала популярной Item Response Theory – IRT.

В IRT предполагается, что получаемые баллы оказываются внешними проявлениями результатов действия неких ненаблюдаемых переменных — латентных параметров, и ставится задача оценить эти параметры по результатам выполненным измерениям.

Первоначальный вариант IRT связан с именем Г.Раша. В IRT результат измерения считается внешним проявлением латентной переменной, и ставится задача восстановить оценку латентной переменной по измерениям видимых переменных. Для -го испытуемого значение латентной переменной , обычно интерпретируемой как оценка готовности, и уровень трудности -го задания расположены на одной шкале, измеримы в сравнимых единицах, которые в этой теории называются логиты, и поэтому вычислима разность .

В IRT предполагается существование семейства функций вида

,

где — вероятность того, что -й испытуемый выполнит -е задание. Точный вид зависимости может меняться, в модели могут также могут дополнительные параметры. Таким образом, предполагается, что вероятность успеха зависит только от разницы между уровнем готовности и сложностью задания, при этом уровень готовности отдельных испытуемых и уровень сложности задания предполагаются независимыми как минимум в статистическом смысле.

При использовании логистической функции, можно определить вероятность успеха -го испытуемого при решении-го задания как

,

где k — некий масштабный множитель, который используется для согласования различных шкал и моделей, и соответствующие интегральные характеристики сложности заданий для -го испытуемого и готовности испытуемого к решению-го задания.

Часто вместо модели Раша используется модель Фергюссона, в которой вместо логистической функции используется функция нормального распределения, тогда для совместимости этих двух моделей в модели Раша используется коэффициент . Принято считать, что модель Раша позволяет отделить трудности заданий от готовности испытуемых, т. е. от субъективной сложности заданий.

Страницы: 1 2 3 4 5 6 7

Методика формирования обобщенных представлений у детей старшего дошкольного возраста о диких животных
Детей шестого года жизни продолжают знакомить с особенностями жизни диких животных (волк, медведь, лиса, заяц, еж): где живут, чем питаются, как добывают пищу, как некоторые из них готовятся к зимней спячке (еж натаскивает осенние листья и зарывается в эту подстилку, лисица прячется зимой в пустующ ...

Категории детей ДОУ нуждающиеся в помощи социального педагога
Среди основных категории детей, нуждающихся в социальной защите социальный педагог, работающий в ДОУ, может столкнуться со следующими категориями: 1. Дезадаптированные дети, для которых характерно нарушение процессов социализации, социального функционирования и социального развития [14;105]. Эта ка ...

Формирование самоконтроля учащихся лесомеханического техникума на уроках производственного обучения
Целью второго этапа экспериментального исследования являлось формирование самоконтроля учащихся на уроках при изучении предмета «Слесарное дело» в учебных мастерских. Соответственно мы ставили следующие задачи: 1. На основе анализа педагогической и методической литературы разработать конспекты урок ...

Навигация

Copyright © 2024 - All Rights Reserved - www.creativeeducation.ru