Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Характеристическая функция теста и ее существенные параметры в модели Раша
Аннотация:
Abstract:
Автор: Хлебников В.А. () - | |
Ключевое слово: |
|
Ключевое слово: |
|
Количество просмотров: 16290 |
Версия для печати Выпуск в формате PDF (1.18Мб) |
Характеристическая функция теста и ее существенные параметры в модели Раша
Статья опубликована в выпуске журнала № 4 за 2005 год.
Известно, что в рамках развивающейся в настоящее время теории моделирования и параметризации тестирования (ТМПТ) удается интерпретировать процесс разумно организованного педагогического тестирования как процесс измерения уровня подготовленности испытуемых в определенной области знаний. Результаты измерений (в полной аналогии с измерениями в физике, технике и т.п.) отражаются на метрической шкале логитов и обеспечивают таким образом реальную объективность окончательных оценок испытуемых. Основополагающие идеи в этом направлении впервые были сформулированы датским математиком Рашем в 1960 году. Поэтому семейство логистических моделей, составляющих основу современной ТМПТ, обычно называют моделями Раша [2-4]. В приложении тестирования в образовании задания теста различных трудностей играют роль своеобразного измерительного инструмента, а исходными данными алгоритмов ТМПТ служат так называемые первичные баллы, то есть количество верно выполненных заданий (или определенных частей заданий) каждым испытуемым. Уникальность ТМПТ состоит в том, что она разрабатывает определенный механизм преобразования формальных наблюдений за исходом событий (первичные баллы) в объективные измерения, то есть в определенные индексы на определенной метрической шкале латентных стимулов этих событий. Принципиальная возможность такого преобразования, собственно, и определяет собой то, что делает тестологию в широком смысле настоящей наукой и позволяет ей количественно решать задачи не только в образовании, но и во многих науках медицинского, социологического и экономического характера. Цель данной статьи - показать, что соотношение между первичными баллами испытуемых на порядковой шкале и соответствующими оценками в логитах на метрической шкале устанавливается определенной функцией, которую мы называем характеристической. Эта функция в рамках основной логистической модели Раша является исчерпывающей характеристикой теста, и потому служит удобным инструментом сравнения тестов при их конструировании, а также при выравнивании различных вариантов одного и того же теста на единую метрическую шкалу в процессе математической обработки результатов тестирования. Обсудим сначала суть дела на простейшем численном примере. Предположим, что тест состоит из k = 5 заданий с известными трудностями
Заметим, что в условии задачи не сказано, какие именно 3 задания выполнены верно, а какие 2 задания выполнены ошибочно. Заданному первичному баллу b = 3 могут соответствовать 10 различных строк матрицы индикаторов ответов. Например, 11100, 01110, 00111 и т.д. Согласие этих строк с моделью Раша, конечно, различно - наилучшее согласие дает первая строка из перечисленных (каноническая строка), наихудшее - третья. Однако с точки зрения оценивания Одним из простейших методов математической статистики, предназначенных для отыскания состоятельных оценок латентных параметров, является метод моментов К. Пирсона. Согласно этому методу, мы должны приравнять теоретический момент (в данном случае математическое ожидание М(b) первичного балла, то есть начальный момент первого порядка) его эмпирическому значению (в данном случае заданному первичному баллу b=3): M(b)=3. (2) Поскольку при заданных значениях трудностей заданий
есть некоторая функция только одной переменной
Здесь нижний индекс 5 напоминает зависимость Корень последнего уравнения и есть искомая оценка Для наглядности мы решим уравнение (4) графически (рис.1). Таким образом, Эта оценка получена, исходя из строки матрицы ответов 11100. Но если взять вместо нее любую другую строку с k=5 и b=3, то ни функция (3), ни уравнение (4) никак не изменятся и, следовательно, мы получим ту же оценку Итак, имея график функции То же можно сказать и относительно графика функции Видно, что при заданных трудностях тестовых заданий вся информация, необходимая для оценивания подготовленности испытуемых, содержится только в первичных баллах Сказанное полностью справедливо и относительно соответствия между первичными баллами Поэтому первичные баллы испытуемых
Левая часть уравнения (4), то есть функция Пусть в общем случае тест состоит из k заданий с трудностями
назовем характеристической функцией теста (ХФТ). Ее область определения включает весь диапазон уровня подготовленности испытуемых, Если, в частности, k=1, то ХТФ совпадает с характеристической функцией соответствующего тестового задания р(q;d1). Знание ХФТ равносильно знанию точного соответствия между первичными процентными баллами и окончательными оценками уровня подготовленности испытуемых в логитах. Аналогично вводится понятие и характеристической функции контингента (ХФК) испытуемых:
где В следующих разделах выведены аналитические выражения ХФТ под условием определенных предположений о распределении трудностей заданий составляемого теста. ХФТ при равномерном распределении трудностей тестовых заданий
В указанных условиях математическое ожидание каждого слагаемого выражения (5) имеет вид
Поэтому первичный процентный балл в среднем определяется как
Интегрируя, имеем:
Если a= –g, а
Предположим теперь, что тест состоит из k заданий, трудности В самом деле, если
Сдвиг начала отсчета приводит к изменению всех параметров На рисунке 2 показан график выведенной ХФТ вида (10), (11) при Например, первичному баллу b=26 при общем количестве тестовых заданий k=40 соответствует процентный первичный балл ХФТ при нормальном распределении трудностей тестовых заданий Рассмотрим теперь ХФТ (5)
в условиях, когда трудности В связи с этим функцию успеха (1)
Она известна в математике как функция логистического распределения вероятностей [1], ее значения с точностью до сотых долей совпадают со значениями функции распределения F нормального закона. Надо только изменить масштаб аргумента, исходя из равенства
В указанных условиях математическое ожидание каждого слагаемого выражения (12) имеет вид
где f(t) - плотность центрированной и нормированной нормальной случайной величины. Поэтому первичный процентный балл в среднем определяется как
Учитывая (14), выражение (17) перепишем в виде
Этот интеграл вычисляется с помощью известного соотношения для нормального распределения:
В нашем случае
Другими словами, в (19) Следовательно,
Видим, что ХФТ зависит только от
и вспомнить равенство (13), то получим окончательно:
На рисунке 3 показаны графики четырех ХФТ, различающихся параметрами m и Изменение математического ожидания m, как видим, приводит к параллельному переносу кривой вдоль оси абсцисс, а поворот кривой вокруг точки Сравнение ХФТ при различных распределениях трудностей заданий Ранее мы получили усредненную ХФТ при условии, что трудности заданий распределены или равномерно на отрезке [-3; 3], или по нормальному закону. Соответствующие графики отличаются друг от друга в зависимости от параметров нормального закона m и Если m=0 и Если m=0 и Характеристическая функция
позволяющую аппроксимировать любую реальную ХФТ.
В наших рассуждениях функция (23) играет роль лишь некоторого инструмента, позволяющего назвать существенные параметры имеющейся ХФТ в целом. Так, например, ХФТ (7) при равномерном распределении трудностей тестовых заданий лучше всего аппроксимируется функцией (23) с параметрами m=0 и d=0,68, а существенные параметры ХФТ (22) при нормальном распределении трудностей с m=0 и Если иметь в виду дискриминацию только в окрестности средней трудности теста, то этот результат можно получить и без привлечения аппроксимирующей функции (23). В самом деле, поскольку для ХФТ нам известны аналитические выражения (10) и (22), то мы можем продифференцировать их и вычислить значения производных в точке
Заметим, что аппроксимирующая функция (23) с d=0,60 совпадает с ХФТ (10) только в узкой окрестности точки m=0. Аппроксимация в среднем по всему отрезку [-3; 3] лучше выполняется при несколько другом значении d=0,68. Что касается ХФТ при нормальном распределении (22), то при Таким образом, при одинаковой средней трудности теста m нормальное распределение трудностей заданий с Аналогично можно устанавливать существенные параметры ХФТ при наличии только ее табличных значений. Рисунок 4 иллюстрирует определение существенных параметров таблично заданной ХФТ по физике, состоящего из 40 заданий (общероссийское централизованное тестирование 2002 г.). Оценки параметров m=0,4 и d=1,05 позволяют судить о средней трудности и коэффициенте дискриминации не отдельного задания, а всего теста в целом. Понятие ХФТ и ее существенные параметры m и d позволяют сравнивать между собой тесты в целом. В частности, показано, что распределение трудностей тестовых заданий по нормальному закону в среднем имеет преимущество по сравнению с равномерным распределением, поскольку коэффициент дискриминации при нормальном распределении почти в полтора раза превышает аналогичный параметр при равномерном распределении. Наибольший интерес, однако, представляет возможность количественно сравнивать тесты при реальном распределении трудностей тестовых заданий, то есть при таком распределении, которое лишь приближенно соответствует каким-нибудь намерениям. Например, какие практически создаваемые тесты можно считать параллельными? По мнению автора, тесты одинаковой содержательной валидности следует считать параллельными, если их характеристические функции совпадают. Расстояние между этими функциями в той или иной метрике может служить количественной мерой непараллельности тестов. В ослабленном виде можно сравнивать не сами характеристические функции, а их существенные параметры. В связи с указанной возможностью характеристические функции различных вариантов одного и того же теста полезно использовать при решении проблемы выравнивания этих вариантов и при отображении всех результатов тестирования на единую шкалу. Список литературы 1. Вероятность и математическая статистика: Энциклопедия. – М., 1999. 2. Rasch Models. Foundations, Resent Developments and Applications. Editors Fisher G.H., Molenaar I.W. New York, Berlin, 1997, Springer, 436 p. 3. Нейман Ю.М., Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов. - М.: Прометей, 2000. - 169 с. 4. Нейман Ю.М., Хлебников В.А. Педагогическое тестирование как измерение. - М.: Прометей, 2003. - 70 с. |
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=491 |
Версия для печати Выпуск в формате PDF (1.18Мб) |
Статья опубликована в выпуске журнала № 4 за 2005 год. |
Статья опубликована в выпуске журнала № 4 за 2005 год.
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Комплексная система автоматизированного исследовательского проектирования надводных кораблей
- Некоторые тенденции в развитии интеллектуальных систем
- Оптимальное размещение модулей при проектировании распределенных тренажерных комплексов
- Подход к разработке информационно-справочной системы для медицинских приложений
- Аппаратно-программные средства анализа электрических сигналов
Назад, к списку статей