- UID
- 1271562
- 在线时间
- 小时
- 注册时间
- 2017-3-29
- 最后登录
- 1970-1-1
- 主题
- 帖子
- 性别
- 保密
|
没这回事。
给小伙伴们做几点信息的澄清:
- 关于不计分的题目:
(1) 这些不计分的题目,是考试机构透过实际考试来搜集这些题目数据,进行考题的确效确认。
(2) 这些不计分题不仅是随机出现的,而且它们的难度并不受到计分题目难度变化的影响。 也就是说有可能写到很难的时候,突然来一道难度差异较大的不计分题。
提醒:
每道题目的难度是以全球考生的统计资料来决定,所以我们不应该依据自己主观的判断来判断这道题目的难度。 - CAT(电脑自适应测试)的计分概念如下:
(1) 每道题目后头会有一个难度数据,标记了该道题目的「难度参数」、「鉴别度参数」、「猜测参数(正确答案容易被猜中的参数)」。
(2) 每答对一道题,这些参数都能够反推考生的能力值。
(3) 透过CAT的机制,系统会尽可能地找出适合考生水平的题目。
(4) 最后透过这些数据计算的机率叠加,得到的最大值就是考生水平的maximum likelihood。
(5) 接著依据GMAC内部的数据转换量尺,得到最后Q和V的分数(满分51)和总分(满分800)
(6) 此外,Q和V的分数是单独计算之后再加总。
提醒:
一个有趣的事实是,假设有五道题目,难度分别为: 1~5 (数字越大,难度越高)
甲同学五道题中,答对了两道题,其难度为:1、2
乙同学五道题中,也答对了两道题,其难度为:1、4
也许会觉得乙的程度比较好,但透过事件机率反推的结果,最后甲同学的能力水平判定反而是会比乙同学高的。
动个脑筋想想就知道了,难度2和难度3的题目乙同学都答错,那么那道难度为4的题目很可能是乙同学瞎蒙中的。
自适应测试并不是在「量测考生答对了多少题」、「可以作对ˊ多ˊ难的题目」,而是「透过这些题目反推该考生能力水平的最大可能性」
所以说「库头提分,库尾压分」的说法是无稽之谈。
|
|