1 引言
2 研究方法
2.1 测量工具
2.2 被试
2.3 分析方法
2.3.1 主成分分析与单维性检验
2.3.2 IRT模型选择
2.3.3 项目分析
2.3.4 题库信息量与边际信度
2.3.5 模拟CAT
2.3.6 效度
2.4 研究工具
3 结果
3.1 题库构建
3.1.1 单维性检验
3.1.2 IRT模型选择
表1 模型拟合指标值 |
| 模型 | AIC | BIC | Loglik |
| 经典题库 | |||
| GRM | 47240.97 | 48167.08 | −23398.48 |
| GPCM | 47820.24 | 48746.35 | −23688.12 |
| GPT题库 | |||
| GRM | 74640.70 | 76242.64 | −36936.35 |
| GPCM | 75556.12 | 77158.05 | −37394.06 |
| 总题库 | |||
| GRM | 122730.8 | 125258.8 | −60759.38 |
| GPCM | 124201.5 | 126729.6 | −61494.76 |
3.1.3 项目分析
3.1.4 题库信息量与边际信度
3.1.5 总题库构建
3.2 模拟CAT
3.2.1 定测验精度下三个题库模拟CAT的表现
表2 不同精度停止条件下的模拟结果 |
| 题库 | 终止规则 | M题数 | SD题数 | MSE(θ) | MMR | r真值 |
| 经典题库 | 全部 | 42 | 0.15 | 0.98 | 0.986*** | |
| SE(θ)≤0.447 | 2.60 | 0.88 | 0.41 | 0.83 | 0.900*** | |
| SE(θ)≤0.387 | 3.77 | 1.73 | 0.36 | 0.87 | 0.929*** | |
| SE(θ)≤0.316 | 5.87 | 3.23 | 0.30 | 0.91 | 0.950*** | |
| SE(θ)≤0.224 | 12.90 | 4.77 | 0.22 | 0.95 | 0.978*** | |
| GPT题库 | 全部 | 75 | 0.09 | 0.99 | 0.992*** | |
| SE(θ)≤0.447 | 2.40 | 1.06 | 0.40 | 0.84 | 0.921*** | |
| SE(θ)≤0.387 | 3.06 | 1.18 | 0.36 | 0.87 | 0.930*** | |
| SE(θ)≤0.316 | 4.90 | 3.76 | 0.30 | 0.91 | 0.953*** | |
| SE(θ)≤0.224 | 10.11 | 6.94 | 0.22 | 0.95 | 0.976*** | |
| GPT 题库(42) | 全部 | 42 | 0.13 | 0.98 | 0.996*** | |
| SE(θ)≤0.447 | 2.48 | 0.86 | 0.40 | 0.84 | 0.994*** | |
| SE(θ)≤0.387 | 3.35 | 1.75 | 0.36 | 0.87 | 0.995*** | |
| SE(θ)≤0.316 | 5.15 | 3.05 | 0.30 | 0.91 | 0.996*** | |
| SE(θ)≤0.224 | 10.51 | 4.12 | 0.22 | 0.95 | 0.996*** | |
| 总题库 | 全部 | 117 | 0.08 | 0.99 | ||
| SE(θ)≤0.447 | 2.42 | 0.96 | 0.39 | 0.84 | 0.916*** | |
| SE(θ)≤0.387 | 3.15 | 1.39 | 0.36 | 0.87 | 0.932*** | |
| SE(θ)≤0.316 | 4.79 | 3.30 | 0.30 | 0.91 | 0.948*** | |
| SE(θ)≤0.224 | 10.14 | 8.38 | 0.22 | 0.95 | 0.971*** |
注:r真值代表能力估计值与能力真值的相关系数,GPT题库(42)为从GPT题库随机抽取42个项目100次后的平均结果;***p<0.001,以下同。 |
表3 达到传统测验精度所需项目数 |
| SECBF-PI-B=0.34 | SEBFI-2=0.27 | SETIPI=0.46 | SEBFAS=0.21 | |
| 传统测验题数 | 8 | 12 | 2 | 20 |
| 经典题库题数 | 5.07 | 8.44 | 2.51 | 15.13 |
| GPT题库题数 | 4.18 | 6.86 | 2.27 | 11.63 |
| GPT题库(42)题数 | 4.42 | 7.12 | 2.37 | 11.97 |
| 总题库题数 | 4.20 | 7.08 | 2.27 | 11.52 |
3.2.2 定测验长度下三个题库模拟CAT的表现
表4 相同测验长度时不同方法的测量误差 |
| 来源 | 测验长度 | Mθ (SDθ) | 测量误差 | 边际信度 | |||||
| M(SD) | t | Cohen’s d | M(SD) | t | Cohen’s d | ||||
| CBF-PI-B | 8 | −0.08 (0.87) | 0.34 (0.03) | 0.88 (0.03) | |||||
| 经典题库 | 8 | −0.03 (0.98) | 0.27 (0.03) | 48.06*** | 2.20 | 0.93 (0.02) | 41.97*** | 1.92 | |
| GPT题库 | 8 | −0.06 (0.98) | 0.24 (0.03) | 72.67*** | 3.32 | 0.94 (0.02) | 61.99*** | 2.83 | |
| GPT题库(42) | 8 | −0.06 (0.95) | 0.24 (0.03) | 70.63*** | 3.23 | 0.94 (0.02) | 59.16*** | 2.70 | |
| 总题库 | 8 | −0.06 (0.99) | 0.23 (0.03) | 68.15*** | 3.11 | 0.94 (0.02) | 57.68*** | 2.64 | |
| BFI-2 | 12 | −0.06 (0.98) | 0.27 (0.02) | 0.93 (0.02) | |||||
| 经典题库 | 12 | −0.05 (0.99) | 0.23 (0.03) | 43.73*** | 2.00 | 0.95 (0.01) | 39.20*** | 1.79 | |
| GPT题库 | 12 | −0.06 (1.00) | 0.20 (0.03) | 65.97*** | 3.01 | 0.96 (0.02) | 57.61*** | 2.63 | |
| GPT题库(42) | 12 | −0.06 (0.97) | 0.20 (0.03) | 74.32*** | 3.40 | 0.96 (0.01) | 66.13*** | 3.02 | |
| 总题库 | 12 | −0.07 (0.98) | 0.19 (0.03) | 70.91*** | 3.24 | 0.96 (0.01) | 61.47*** | 2.81 | |
| TIPI | 2 | −0.08 (0.87) | 0.46 (0.05) | 0.79 (0.05) | |||||
| 经典题库 | 2 | −0.06 (0.92) | 0.46 (0.05) | –1.27 | –0.06 | 0.78 (0.05) | –1.29 | –0.06 | |
| GPT题库 | 2 | −0.03 (0.94) | 0.43 (0.05) | 10.78*** | 0.49 | 0.81 (0.05) | 9.87*** | 0.45 | |
| GPT题库(42) | 2 | −0.05 (0.82) | 0.43 (0.03) | 10.41*** | 0.48 | 0.81 (0.03) | 10.19*** | 0.47 | |
| 总题库 | 2 | −0.08 (0.89) | 0.42 (0.05) | 13.43*** | 0.61 | 0.82 (0.05) | 12.34*** | 0.56 | |
| BFAS | 20 | −0.05 (1.00) | 0.21 (0.03) | 0.95 (0.02) | |||||
| 经典题库 | 20 | −0.06 (0.99) | 0.19 (0.02) | 41.10*** | 1.88 | 0.97 (0.01) | 29.91*** | 1.37 | |
| GPT题库 | 20 | −0.06 (1.01) | 0.16 (0.03) | 72.31*** | 3.30 | 0.97 (0.01) | 51.91*** | 2.37 | |
| GPT题库(42) | 20 | −0.06 (0.99) | 0.17 (0.03) | 77.45*** | 3.54 | 0.97 (0.01) | 52.34*** | 2.39 | |
| 总题库 | 20 | −0.06 (1.01) | 0.16 (0.02) | 78.38*** | 3.58 | 0.97 (0.01) | 48.12*** | 2.20 | |
表5 跨样本下相同测验长度的测量信度 |
| 来源 | 测验长度 | 边际信度 | |||
| M(SD) | MR增加百分比(%) | t | Cohen’s d | ||
| 样本2 CBF-PI-B | 8 | 0.88 (0.03) | |||
| 经典题库 | 8 | 0.93 (0.02) | 5.39 | 37.48*** | 1.87 |
| GPT题库 | 8 | 0.94 (0.02) | 7.12 | 50.83*** | 2.54 |
| 总题库 | 8 | 0.94 (0.02) | 7.13 | 50.66*** | 2.53 |
| 样本3 BFI-2 | 12 | 0.93 (0.01) | |||
| 经典题库 | 12 | 0.95 (0.01) | 1.77 | 20.16*** | 1.21 |
| GPT题库 | 12 | 0.96 (0.02) | 2.98 | 31.23*** | 1.88 |
| 总题库 | 12 | 0.96 (0.01) | 3.13 | 36.58*** | 2.20 |
3.2.3 效度验证
表6 三个题库与经典量表的收敛效度 |
| 题库 | CBF-PI-B | BFI-2 | TIPI | BFAS |
| 经典题库 | 0.832*** [0.804, 0.858] | 0.913*** [0.896, 0.929] | 0.860*** [0.831, 0.885] | 0.914*** [0.893, 0.930] |
| GPT题库 | 0.831*** [0.800, 0.857] | 0.917*** [0.900, 0.933] | 0.861*** [0.834, 0.886] | 0.918*** [0.898, 0.934] |
| 总题库 | 0.836*** [0.807, 0.862] | 0.921*** [0.906, 0.935] | 0.862*** [0.835, 0.885] | 0.919*** [0.899, 0.935] |
注:括号内的值代表基于1000次Bootstrap抽样的95%置信区间,以下同。 |
表7 效标效度 |
| 题目来源 | 主观幸福感 | 抑郁 |
| GPT题库 | 0.711*** [0.646, 0.774] | −0.647*** [−0.732, −0.552] |
| CBF-PI-15 | 0.533*** [0.438, 0.608] | −0.646*** [−0.710, −0.573] |
| BFI-2 | 0.658*** [0.573, 0.728] | −0.716*** [−0.780, −0.648] |
