Классические шкалы оценки знаний

Развитие образования » Оценка качества теста » Классические шкалы оценки знаний

Страница 1

Классическая теория тестирования (Clasical Test Theory — CTT)

изначально создана для интерпретации диагностических процедур. Эта теория создавалась под чисто прикладные задачи, поэтому некоторые предположения, используемые в основаниях этой теории, необходимо прояснить, тем более что в литературе эти основания почти не обсуждаются.

В классической теории тестирования предполагается явно:

1. Одномерность, т.е. процедура тест измеряет только одно качество, готовность или способность.

2. Репрезентативность, в рамках CTT понимаемая как независимость вероятности той или иной оценки от того, какая подгруппа из общей популяции будет выполнять тест.

3. Независимость заданий, т.е. задания не зависят друг от друга.

4. Независимость ответов испытуемых.

Обе упомянутых независимости понимаются как минимум в статистическом смысле. Поскольку диагностические процедуры в большинстве случаев проводились в виде тестов, причём в большинстве тестов в форме закрытых или, реже, открытых вопросов, то результат каждого ответа предполагался измеримым в баллах по некоторой шкале.

Кроме явных предположений, в этой теории заложены некоторые неявные предположения. В частности, неявно предполагается:

— измеримость всех возможных ответов, т.е. существование эффективной процедуры получения ответа на любой поставленный вопрос,

— полнота ответов, т.е. получение ответов на все поставленные вопросы, из чего следует, что отказы от ответов во внимание не принимаются,

— равнозначимость всех вопросов и, следовательно, равные веса всех поступивших ответов,

— равенство дисперсий при использовании параллельных форм ответов,

— нормальное распределение ответов .

Как и в случае технических измерений, неявно предполагается, что любой результат измерений складывается из истинного значения и ошибки измерения, и ошибки измерения предполагаются аддитивными, что нужно для корректности перехода от сумм ошибок к одной интегральной ошибке, причём интегральная ошибка тоже предполагается нормально распределённой.

Насколько корректны эти допущения, обычно не обсуждается. Во всяком случае, самые серьёзные вопросы по поводу CTT связаны с обеспечением реальной независимости заданий. Не обсуждается также и вопрос о выборе оценочных шкал, в качестве исходного допущения предполагается, что «сырые баллы» уже получены.

Более тонкий вопрос связан с метрологическим смыслом категории «ошибка». В технических измерениях неявно предполагается, что ошибка и порождённая ею погрешность — свойство измерительной процедуры, и, следовательно, погрешность в принципе можно оценить и учесть по результатам поверки и калибровки. При измерениях эргатических элементов появляется ещё один источник ошибок — нестабильность самого измеряемого, возникающая вследствие действия различных факторов, к самым важным из которых можно отнести обучение, забывание, утомление и динамику функционального состояния. Поправки на эти факторы в метрологии не обсуждаются.

Для получения итоговой оценки используются различные вычислительные процедуры. Чаще всего вычисляется средний балл по обычной формуле среднего арифметического

,

Страницы: 1 2 3 4 5 6

Права и возможности профессорско-преподавательского состава
Преподавательские кадры учреждений высшего образования должны иметь доступ к библиотекам, которые имеют в наличии современную литературу, отражающую разные стороны той или иной проблемы. Они также должны иметь доступ к международным компьютерным сетям, спутниковым программам и базам данных, необход ...

Опыт формирования межкультурной коммуникации в системе гражданского воспитания школьников
В данной главе раскрывается опыт формирования межкультурной коммуникации в системе гражданского воспитания школьников. Для этого, во-первых, анализируется образовательная ситуация. Во-вторых, характеризуется формирование межкультурной коммуникации. В-третьих, формулируются методические рекомендации ...

Характеристика базы исследования навыка чтения в СОШ с. Новоманошкино
Чтение — это сложный комплексный вид деятельности, состоящий из ряда операций. Достаточно полно навык чтения может характеризовать совокупность нескольких его параметров: способ, скорость, правильность, автоматизированность (так называемая «беглость») и понимание прочитанного [16, с. 140]. Актуальн ...

Навигация

Copyright © 2024 - All Rights Reserved - www.creativeeducation.ru