- UID
- 1165942
- 在线时间
- 小时
- 注册时间
- 2015-10-21
- 最后登录
- 1970-1-1
- 主题
- 帖子
- 性别
- 保密
|
首先感謝樓主跟阿爾提供ESR,這次的分析主要目的是想要對CAT(computer adaptive testing)更加理解。前兩張圖是顯示工作方式,對錯題數是從長條圖的%讀出來的就不附上了,我是第一次把難度曲線給放那麼大(當然一定有更精確的作法),所以貼個圖記錄一下。後兩張圖就是兩位Q1到Q4這四節的對錯平均難度製成表格。不考慮時間(因為官方代表說了,答題速度不影響分數,只會被用來偵測異常考試狀況-->有興趣以後再提),也不考慮 verbal 三種題型(因為ESR也看不出來哪一節哪一個題型考了幾題)。
先看阿爾:這是一張漂亮的、較典型的ESR,紅藍沒有交叉,表示每一節平均而言程式大概都知道你的程度在哪邊,給你簡單的就會做(答對率高),給你難的就不會做(答對率低),最終Q4時達到了一個收斂點:三個點極為靠近,答對率正好一半一半。這個"難度"就是阿爾在這次考試展現出的"實力"。
再看C樓主:開局Q1平均難度就衝到了3.5 (沒有數據佐證但估計換算V分數大概35+),Q2紅藍交換(且頗大),可以說Q2即便6對1錯,但錯1題難度(相對於對題)低很多的題目,讓那6題的心血可說付諸流水。Q3 Q4回復正常紅比藍高的順序,Q3的表現跟Q1類似,若Q4能維持Q3的難度與正確率的話應該就是V 35+,但Q4下滑的很快,估計5題錯題中一定有難度較低(到負值)的題目,導致演算法持續下修對樓主實力的評估(對題難度也因此大幅下滑)。
最後再次回答阿爾之前的疑問:GMAT的CAT究竟是單題適性還是一節一節適性?我會說ESR並不是一個充分的、可以回答這個問題的工具。為什麼?因為考試本身帶有隨機性(CAT本來就是個統計概念的應用),而ESR也故意不提供完整的資訊(以免暴露過多,讓考試的過多細節被破解)。我相信GMAT是單題適性是因為這就是官方歷年來的公開訊息與一致說法,用單題適性的角度來看ESR,存在有無法解釋之處(因為ESR常常無法得知單題的對錯與難度)但很少有明顯的矛盾。相對的,假如GMAT是一節一節適性,那應該每個考生的Q1平均難度都類似才對,但這兩位的ESR就提供了絕佳的反證。
Q1同樣5對3錯,但三種難度(對、錯、平均)明顯不同,所以(只看)正確率其實是假議題,要跟難度一起看才能更完整。可是即便如此,我們(考生、備考機構、ESR資料分析者)都看不出"隨機性",有那種錯一題就Q50的ESR,錯題難度也沒特別低,但此後題目的難度就再也上不去了。歌唱選秀節目如果歌單用抽籤的,整季都抽到好唱沒難度因此無法凸顯個人特色與歌唱實力的芭樂歌,結果最後淪為演藝圈路人,請問要怪誰呢?只能怪運氣吧。
這個考試的確有機率的成分存在,所以要拿Q51是需要一點運氣的,因為那是bell-shaped分布的尾端了;但相對的如果實力有到V30 (裸考),只要不粗心正常應考,考五六次可能都不會低於V25,因為那是分數分布的中間區段,樣本數夠估計就會相對準確,因為機率而產生的風險(變化)就會降低。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|