Journal influence
Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)
Bookmark
Next issue
№4
Publication date:
16 December 2025
Experimental study of an estimator consistensy related to the Rash model latency features
The article was published in issue no. № 3, 2012 [ pp. 166-171 ]Abstract:Consistency of an estimator of the maximum likelihood related to latency features «task severity» of the test and «preparation level» of a student in one-parameter dichotomous Rash model when the amount of selected students N and number of the test task L grows without limitation, is supported by computing experiment. It is shown that extreme values of latency features are achieved when N=1500 and L=1500, and they stay stable with following growth of N, L. They offer calibration technique to calibrate test tasks by test resulting matrix of limited amount, which significantly reduces its measure of inaccuracy. The study was performed based on computation experiment. First part of the study examined dependence of the maximum likelihood related to latency features and from matrix size of the test results. It was assumed that estimate distribution and was normal. Based on dichotomous result matrix with dimensions of 6049 and provided algorithm, the author formed reference dichotomous resulting matrix of tests with dimensions of 501500 to 25052505. Then they were processed and the data was presented in graphic form. Data was analyzed and latency features were compared among themselves , and ( ) as well. In the second part of the computing experiment, results received from the result matrix model were checked upon M1 real test result matrix with dimensions of 5150. Reference result matrix models were formed using statistic parameters of statistics distribution and , calculated with M1 matrix. Resulting estimation of latency features and were compared against proper estimations of and of M1 matrix.
Аннотация:Состоятельность оценок максимального правдоподобия латентных параметров «трудность задания» теста и «уровень подготовки» студента однопараметрической дихотомической модели Раша при неограниченно возрас-тающем объеме выборки студентов N и числе заданий теста L подтверждена результатами вычислительного экспе-римента. Показано, что предельные значения оценок латентных параметров достигаются при N=1500 и L=1500 и с дальнейшим ростом N, L практически не изменяются. Предложен метод калибровки заданий теста по матрицам ре-зультатов тестирования ограниченного объема, позволяющий существенно снизить ее погрешность. Исследования выполнялись на основе вычислительного эксперимента. В первой его части исследовалась зависи-мость оценок максимального правдоподобия латентных параметров и от размера матрицы результатов тести-рования. Предполагалось, что распределения оценок и являются нормальными. На основе дихотомической матрицы ответов размером 60х49 и предложенного автором алгоритма были сформированы нормативные дихотоми-ческие матрицы результатов тестирования размером от 501500 до 25052505. Затем они обрабатывались, данные обработки представлялись графически. Анализировались и сравнивались между собой оценки латентных параметров , а также ( ). Во второй части вычислительного эксперимента полученные на моделях матриц ответов результаты проверялись на реальной матрице результатов тестирования М1 размером 5150. Модели нормативных матриц ответов форми-ровались с использованием статистических параметров распределения статистик и , рассчитанных по матрице М1. Полученные оценки латентных параметров и сравнивались с соответствующими значениями оценок параметров и матрицы М1.
| Authors: (ein@sssu.ru) - , Ph.D | |
| Keywords: Rush's model, the latent parameter, the test task, consistency of assessments, test, matrix model, dichotomous matrix |
|
| Page views: 14012 |
Print version Full issue in PDF (7.64Mb) Download the cover in PDF (1.33Мб) |
Экспериментальные исследования состоятельности оценок латентных параметров модели Раша
The article was published in issue no. № 3, 2012. [ pp. 166-171 ]
Consistency of an estimator of the maximum likelihood related to latency features «task severity» of the test and «preparation level» of a student in one-parameter dichotomous Rash model when the amount of selected students N and number of the test task L grows without limitation, is supported by computing experiment. It is shown that extreme values of latency features are achieved when N=1500 and L=1500, and they stay stable with following growth of N, L. They offer calibration technique to calibrate test tasks by test resulting matrix of limited amount, which significantly reduces its measure of inaccuracy.
The study was performed based on computation experiment. First part of the study examined dependence of the maximum likelihood related to latency features and from matrix size of the test results. It was assumed that estimate distribution and was normal. Based on dichotomous result matrix with dimensions of 6049 and provided algorithm, the author formed reference dichotomous resulting matrix of tests with dimensions of 501500 to 25052505. Then they were processed and the data was presented in graphic form. Data was analyzed and latency features were compared among themselves , and ( ) as well.
In the second part of the computing experiment, results received from the result matrix model were checked upon M1 real test result matrix with dimensions of 5150. Reference result matrix models were formed using statistic parameters of statistics distribution and , calculated with M1 matrix. Resulting estimation of latency features and were compared against proper estimations of and of M1 matrix.
(ein@sssu.ru) - , Ph.D
Ссылка скопирована!
| Permanent link: http://swsys.ru/index.php?page=article&id=3236&lang=en |
Print version Full issue in PDF (7.64Mb) Download the cover in PDF (1.33Мб) |
| The article was published in issue no. № 3, 2012 [ pp. 166-171 ] |
The article was published in issue no. № 3, 2012. [ pp. 166-171 ]
Perhaps, you might be interested in the following articles of similar topics:Perhaps, you might be interested in the following articles of similar topics:
- Экспериментальное подтверждение состоятельности оценок трудности заданий теста
- Модель дихотомической матрицы результатов тестирования
- RILP-Multi для расчета предельных оценок параметров индикаторов бутстреп-методом
- Калибровка заданий теста с использованием бутстреп-метода
- Алгоритмическая основа генерации тестов с учетом радиационного воздействия
Back to the list of articles
, где qi – уровень подготовки i-го студента; βj – трудность j-го задания теста; pij – вероятность правильного выполнения i-м студентом j-го задания. Точность расчета латентных параметров qi (
) зависит от того, насколько точно известны значения латентных параметров βj (
), где N – число студентов, участвующих в тестировании; L – число заданий используемого при этом теста. Чем точнее определены значения βj, тем качественнее (с меньшей погрешностью) будут рассчитаны значения qi латентного параметра «уровень подготовки» студента. Оценки
и
латентных параметров βj и qi рассчитываются по результатам тестирования, которые представляются в виде дихотомической матрицы ответов X=(xij) [1]. Расчет оценок осуществляется численными методами на основе итерационных выражений [1, 2], полученных с использованием метода максимального правдоподобия.
и
(
и «уровень подготовки» студента
от размера матрицы результатов тестирования (матрицы ответов). Предполагалось, что распределения оценок
и
(
N1=501, N2=1002, N3=1503, N4=2004, N5=2505) и
(
L1=500, L2=1000, L3=1500, L4=2006, L5=2505) при одинаковых значениях pi и pj, где pi - доля верных ответов i-го виртуального студента на все задания виртуального теста, соответствующего исходной модели матрицы; pi - доля верных ответов всех виртуальных студентов на j-е виртуальное задание этого же теста. Анализ полученных данных начинался со сравнения статистических параметров, характеризующих распределения оценок: выборочных средних
,
и оценок стандартных отклонений
и
, которые представлены в таблице 1 в строках со 2-й по 6-ю. Из сравнения видно, что значения параметров достаточно близки, поэтому можно считать представительство результатов тестирования виртуальных студентов с разным уровнем подготовки и результатов выполнения виртуальных заданий с разным уровнем трудности во всех моделях матриц примерно одинаковым, что является свидетельством их нормативности.
, логит
, логит
, логит
, логит
, полученных при разных значениях Nk (
), и кривых
, рассчитанных при различных значениях Lm (
), наиболее заметны на краях диапазонов изменения оценок
от 2 до 3 логит, а на рисунке (б) – для интервала от минус 3 до минус 4 логит. Из рисунка (а) видно, что значения
соответствующие одному и тому же значению pi, тем больше, чем меньше размер матрицы. Наибольшие расхождения наблюдаются для значений
,
и
(кривые 3, 4, 5) практически одинаковы. Данный результат позволяет сделать вывод о том, что оценки латентных параметров
На рисунке (в) изображены кривые
от размера матрицы. Как и для оценок
) и
), рассчитанных с помощью программного комплекса RILP-1M, показал, что их распределения не противоречат гипотезе о нормальном законе распределения с параметрами mq=0,447 логит, σq=0,85293 логит, mβ=0,000 логит, σβ=0,80755 логит. С использованием этих статистических параметров были сформированы 4 модели нормативных дихотомических матриц ответов [5]: М2 – 503´503, М3 – 1003´1000, М4 – 1505´1507 и М5 – 2003´2006 в предположении нормального распределения значений оценок латентных параметров
и
находились их выборочные средние арифметические
,
и оценки стандартных отклонений
,
. Нормативность исследуемых моделей матриц подтверждается данными таблицы 2.
, логит
, логит
, логит
, логит
) и
) исходной матрицы М1 представлены во вторых столбцах таблиц 3, 4, значения оценок
(
) для каждого из четырех массивов, полученных по сформированным моделям матриц М2–М5. По значениям
определялись значения
1500. Отличия их от исходных оценок
логит) составляют от 1 до 5 %, но могут достигать и 8 %. В столбцах 7 и 8 таблицы 3 показаны погрешности расчета оценок максимального правдоподобия латентных параметров модели Раша для исходной матрицы ответов М1 и для модели матрицы ответов М4 размером 1505´1507, а в столбце 9 – кратность отношения погрешностей. Видно, что погрешность расчета значений оценок
и
по значениям pi0 и pj0 (
);
,
и погрешности их расчета в качестве значений латентных параметров qi, βj и погрешностей их расчета.