教育部人文社会科学研究基金(11YJC190002) 作品数:16 被引量:130 H指数:8 相关作者: 涂冬波 蔡艳 丁树良 戴海琦 汪文义 更多>> 相关机构: 江西师范大学 南昌大学 更多>> 发文基金: 教育部人文社会科学研究基金 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 哲学宗教 自动化与计算机技术 理学 更多>>
认知诊断模型-资料拟合检验统计量及其性能 被引量:5 2014年 本文将IRT常用资料-模型拟合检验统计量χ2和G2引入认知诊断领域,具体讨论了这两个统计量在认知诊断资料-模型拟合检验的可行性及其侦查效果,为研究者及实际应用者在认知诊断资料模型拟合检验中提供借鉴及方法学支持。 涂冬波 张心 蔡艳 戴海琦兼顾测验效率和题库使用率的CD-CAT选题策略 被引量:14 2014年 CD–CAT中已有选题策略较注重测验效率,而对题库使用率不够重视。针对此问题,基于DINA模型,引入两种新的选题策略KLED和RHA,同时对HA进行模拟研究。结果显示:PWKL与KLED只在测验效率上具有优势;KLED若按属性向量分层,题库使用率有所提高,KLED比ED更容易推广到其他有显式表达的诊断模型场合;HA、RHA和RP–PWKL可较好兼顾测验效度和题库使用率,但RP-PWKL需设置项目的最大曝光率阈值。两种新选题方法在定长和变长CD-CAT都具有一定的应用价值。 汪文义 丁树良 宋丽红CAT中能力参数估计方法的改进:R-MLE估计法 被引量:2 2016年 本文对CAT中能力估计的常用方法——最大似然估计法(MLE)进行改进,研究中结合EAP方法提出了改进的MLE法(R-MLE)。Monte Carlo模拟研究发现:不论是在定长CAT还是非定长CAT中,不论是在1PL模型下还是在2PL或3PL模型中,不论是在何种CAT题库结构下,R-MLE法较传统的MLE法具有更佳的估计精度及更有效的测验效率;R-MLE法不仅可以提高CAT的能力估计精度还可以进一步改善CAT测试的效率,具有一定的应用前景。 蔡艳关键词:计算机化自适应测验 EAP MLE 几种常用非补偿型认知诊断模型的比较与选用:基于属性层级关系的考量 被引量:21 2013年 当前国际上开发了60多种认知诊断计量模型(Fu&Li,2007),各种模型各具特点,实际应用者应根据实际情况选用恰当的模型。本研究以属性层级关系为切入点,采用MonteCarlo模拟的研究方法,比较了属性层级关系正确及有误两种情况下,当前国际上常用的五种认知诊断模型的性能,以充分考察不同认知诊断模型对属性层级关系的依赖程度,及属性层级关系的错误界定对各认知诊断模型诊断正确率的影响,从而为实际运用者在认知诊断模型选用上提供借鉴和参考。 涂冬波 蔡艳 戴海琦关键词:认知诊断模型 教育认知诊断测验与认知模型一致性的评估 被引量:35 2012年 构建正确的认知模型是成功进行认知诊断的关键之一,如果认知诊断测验不能完整准确地代表这个认知模型,这个测验的效度就存在问题。属性及其层级可以表示一个认知模型。在认知模型正确基础上,给出了一个计量公式以衡量认知诊断测验能够多大程度上代表认知模型;对于不止包含一个知识状态的等价类及其形成原因进行了分析,对Cui等人的属性层级相合性指标(HCI)提出修改建议,以更好地探查数据与专家给出的认知模型的一致性。 丁树良 毛萌萌 汪文义 罗芬 CUI Ying一种多策略认知诊断方法:MSCD方法的开发 被引量:14 2012年 当前国内外开发的认知诊断模型基本上只能处理单策略的测验情景,并假设所有被试均采用同一种加工策略/解题策略,从而忽视了加工策略的多样性及差异性。本研究根据de la Torre和Douglas(2008)采用多个Q矩阵来表征多个加工策略的思想,并结合使用丁树良等(2009)修正的Q矩阵理论及孙佳楠,张淑梅、辛涛和包珏(2011)的广义距离判别法,开发了一种新的多策略认知诊断方法——MSCD方法。Monte Carlo模拟研究结果表明:在单策略测验情景下,传统的单策略认知诊断方法与采用MSCD方法的诊断正确率均比较理想,且差异不大;但在多策略测验情景时,传统的单策略认知诊断方法诊断正确率较低,而MSCD方法的诊断正确率却仍较理想;当加工策略增至5种时,MSCD方法仍有较高的边际判准率、模式判准率以及加工策略判准率。研究表明MSCD方法基本合理、可行。这为实现对加工策略的诊断提供了方法学支持,有利于拓展认知诊断在实际中的应用。 涂冬波 蔡艳 戴海琦 丁树良关键词:Q矩阵 多级计分题项目功能差异常用检测方法及比较 被引量:9 2015年 项目功能差异是确保测验公平的统计技术手段.多级计分题目为教育测量和心理测量中不可或缺的题型,而目前还未见有公开发表的文章较为全面地将常用多级计分题DIF检测方法作一概括,该文从参数类与非参数类2个视角对多级计分DIF检验方法进行论述与比较,为实践应用者在方法选用上提供借鉴及支持,最后对多级计分DIF检验进行讨论. 张龙 涂冬波关键词:项目功能差异 基于HO-DINA模型的多级评分认知诊断模型的开发 被引量:10 2013年 本文对具有较好发展前景的HO-DINA模型进行拓展,将仅适用于0-1评分数据资料的HO-DINA模型拓广至可用于多级评分,采用MCMC算法实现了对新模型参数的估计,并对新模型性能进行了研究。 涂冬波 蔡艳 戴海琦关键词:认知诊断模型 影响AHM与DINA诊断准确率的因素研究 被引量:11 2011年 对属性层级模型(AHM)和确定性输入、噪声"与"门模型(DINA)2个认知诊断模型,讨论不同因素对判准率的影响.实验表明,含有可达阵的测验比不含可达阵的测验判准率高.对于线型结构测验长度达到一定值以后,增加测验长度对诊断准确率的改进不大.虽然总体而言,DINA分类准确性要优于AHM,属性结构紧密度越大,判准率越高;但是AHM估计结果符合属性层级结构,而DINA估计结果却可能违背属性层级关系,这和2011年De Carlo的发现不相同. 颜远海 丁树良 汪文义关键词:可达矩阵 结合优先级指标和曝光因子的多级评分选题策略 被引量:3 2011年 在等级反应模型(GRM)下考察改进的最大优先级指标(MMPI)中引入曝光因子的选题策略与其他选题策略之间的优劣.蒙特卡洛模拟中采用定长CAT,其中能力估计采用贝叶斯期望后验估计(EAP).研究结果表明,MMPI与曝光因子相结合的选题策略,在保证精度的情况下,很大程度上解决了曝光率不均匀问题. 汤楠 丁树良 余丹关键词:计算机化自适应测验