胡姗. (2015). 基于GPCM和3PLM的CAT研究(硕士学位论文). 江西师范大学, 南昌. 纪凌开. (2002). 拓广分部评分模型(GPCM)及应用EM算法的参数估计研究(硕士学位论文). 江西师范大学, 南昌. 罗照盛. (2012). 项目反应理论基础. 北京: 北京师范大学出版社. 罗照盛, 欧阳雪莲, 漆书青, 戴海琦, 丁树良. (2008). 项目反应理论等级反应模型项目信息量. 心理学报, 40(11), 1212–1220 漆书青, 戴海崎, 丁树良. (1998). 现代教育与心理测量学原理. 南昌: 江西教育出版社. 沈励, 万雅奇. (2022). 高中学业水平等级性考试数据分析拓展研究. 中国考试, (5), 54–63 涂冬波, 蔡艳, 戴海琦, 丁树良. (2011). 多维项目反应理论: 参数估计及其在心理测验中的应用. 心理学报, 43(11), 1329–1340 熊建华, 丁树良, 漆书青, 戴海崎. (2002). 用测验信息量分析试卷质量. 江西师范大学学报(自然科学版), 26(3), 225–228 闫成海, 杜文久, 宋乃庆, 张健. (2014). 高考数学中考试评价的研究——基于CTT与IRT的实证比较. 华东师范大学学报(教育科学版), 32(03), 10–18 闫培香. (2021). 项目反应理论在英语考试分数可比性研究中的应用. 教育与考试, (4), 53–57 赵守盈, 何妃霞, 陈维, 罗杰, 关丹丹. (2012). Rasch模型在研究生入学考试质量分析中的应用. 教育研究, 33(6), 61–65 赵守盈, 石艳梅, 朱丹. (2013). 项目反应理论在大规模选拔性考试试题质量评价中的应用. 教育学报, 9(1), 71–77 庄然, 郑淑园, 田甜, 王振禹, 肖天, 刘侃. (2020). 项目反应理论在基础医学综合测试免疫学试题中的应用. 细胞与分子免疫学杂志, 36(1), 86–94 Gonçalves, F. B., Venturelli, S. L. J., & Loschi, R. H. (2023). Flexible Bayesian modelling in dichotomous item response theory using mixtures of skewed item curves. British Journal of Mathematical and Statistical Psychology, 76(1), 69–86. Lahner, F. M., Schauber, S., Lörwald, A. C., Kropf, R., Guttormsen, S., Fischer, M. R., & Huwendiek, S. (2020). Measurement precision at the cut score in medical multiple choice exams: Theory matters. Perspectives on Medical Education, 9(4), 220–228. Lee, S. S., & von Davier, M. (2020). Improving measurement properties of the PISA home possessions scale through partial invariance modeling. Psychological Test and Assessment Modeling, 62(1), 55–83. Muraki, E. (1992). A generalized partial credit model: Application of an EM algorithm. Applied Psychological Measurement, 16(2), 159–176. Rahim, A., & Haryanto, H. (2021). Implementation of item response theory (IRT) Rasch model in quality analysis of final exam tests in mathematics. Journal of Research and Educational Research Evaluation, 10(2), 57–65. Strachan, T., Cho, U. H., Ackerman, T., Chen, S. H., de la Torre, J., & Ip, E. H. (2022). Evaluation of the linear composite conjecture for unidimensional IRT scale for multidimensional responses. Applied Psychological Measurement, 46(5), 347–360. Young, J. W., Morgan, R., Rybinski, P., Steinberg, J., & Wang, Y. (2013). Assessing the test information function and differential item functioning for the toefl junior standard test. ETS Research Report Series, 2013(1), i–27.