国家科技重大专项(2010ZX01045-001-005)
- 作品数:9 被引量:49H指数:4
- 相关作者:刘三刘智郑庆华铁璐孟文婷更多>>
- 相关机构:华中师范大学西安交通大学杭州海康威视数字技术股份有限公司更多>>
- 发文基金:国家科技重大专项国家科技支撑计划教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于多元概率推理模型的中文书写纹识别
- 2013年
- 针对中文短文本分类问题,从集成学习的角度提出一种基于多元概率推理模型的书写纹识别方法。将初始样本集划分为等粒度、可交叉的样本子集,构造具有差异性的子空间,在各子空间上采用基于概率推理模型的基分类器训练样本,通过概率求和法融合所有基分类器的输出得到训练样本的最终识别结果。实验结果表明,该方法对于网络书写纹具有较好的识别效果,查全率、查准率和F1度量值分别高达81.6%、85.9%和83.69%。
- 刘三铁璐刘智孙建文
- 关键词:随机采样
- 一种基于样本空间动态划分的中文情感识别方法被引量:1
- 2013年
- 为了提高中文文本情感识别的精度,从集成学习的角度出发,提出了一种基于样本空间动态划分的机制构建文本情感分类器。该算法充分利用训练样本空间内的鉴别信息,通过引入核平滑方法对样本空间进行自适应划分,形成若干个具有差异性的多粒度样本子集,然后分别在每个子集上构造基分类器,最后将所有基分类器的输出进行融合以产生最终的预测结果。实验结果表明,该算法在查准率和查全率等方面均优于Bagging、AdaBoost等算法,并且在大规模样本集的情感识别中具有良好的应用前景。
- 刘智杨宗凯刘三铁璐
- 采用动态特征选择的中文情感识别研究被引量:4
- 2014年
- 针对中文情感识别中特征空间稀疏度和冗余度较高的特点,从集成学习视角出发,提出一种基于动态特征选择机制的情感识别方法.该方法首先采用核平滑方法构建特征子集划分的维度分布和特征空间的重要度分布,然后根据这两种分布函数,自适应划分特征空间,形成多个不同粒度的子空间,然后训练对应的基分类器,最后使用多数投票法的融合策略构造集成识别模型.在校园BBS评论数据上与其他基准算法进行对比实验,结果表明该算法在查全率和查准率等方面均优于其他算法,有效地提高了情感识别的准确性和鲁棒性.
- 刘智杨宗凯刘三王泰孟文婷王胜明
- 关键词:情感识别特征子空间
- 大规模多元化移动式学习技术被引量:2
- 2011年
- 随着云计算、网络多媒体与移动互联网的发展,移动式学习将成为下一代e-learning系统的主要特征之一。提出了"云+端"结合的大规模多元化移动式学习体系架构,阐述了移动式学习涉及的支持异构终端的大规模移动直播学习、支持服务器集群数据缓存的移动点播学习和支持有线/无线混合网络的多媒体传输3项核心技术及其解决思路与方法,完成了大规模多元化移动式学习系统实现方案设计。
- 杜海鹏张未展郑庆华
- 关键词:云计算
- 基于随机主元分析算法的BBS情感分类研究被引量:2
- 2014年
- 针对论坛(BBS)中文本的情感分类问题,提出一种改进的随机子空间算法。挖掘特征空间中的分类信息,在生成子空间的过程中,利用权重函数对特征进行分类能力评估,以较大概率选择分类能力较好的特征维度,保证分类精度;扩大选择的子空间维度,选择具有分类能力的特征,通过主元分析对子空间进行降维,保证算法效率和子空间多样性。实验结果表明,该算法分类精度达到91.3%,比基准算法具有更好的性能稳定性。
- 刘林刘三刘智铁璐
- 关键词:情感分析主元分析支持向量机
- 面向村镇的教育资源分类体系研究与应用被引量:7
- 2010年
- 村镇教育面广量大、用户对象多、教育资源类型复杂,尚没有一个实用的资源分类标准和方法。本文首先分析相关教育资源建设标准特点,总结其异同点;提出面向村镇的教育资源分类模型,并提出了资源描述策略和方法;通过面向村镇教育的资源分布式管理系统的设计和应用,证明该方法的有效性。
- 刘清堂刘梅谢燕辉李浩胡敏
- 关键词:资源分类学科课程
- 基于多SimHash指纹的近似文本检测被引量:21
- 2011年
- 近似文本检测已成为当前研究热点.基于SimHash指纹的近似文本检测是主流的检测方法之一.但使用SimHash进行近似文本检测存在如下问题:指纹位数单一,丢失了一定量的信息.针对该问题,为使SimHash指纹尽可能多地代表文档的内容或特征,通过对术语集的统计特征分析,提出基于多SimHash指纹和k维超曲面的近似文本检测算法.实验表明基于多Sim-Hash指纹的近似文本检测算法提高了检测的准确率,而且所增加的时间代价很小.
- 董博郑庆华宋凯磊田锋马瑞
- 采用半随机特征采样算法的中文书写纹识别研究被引量:1
- 2013年
- N-gram字符序列能有效捕捉文本中作者的个体风格信息,但其特征空间稀疏度高,且存在较多噪音特征。针对该问题,提出一种基于半随机特征采样的中文书写纹识别算法。该算法首先采用一种离散度准则为每个作者选取一定粒度的个体特征集,然后将个体特征集以一种半随机选择机制划分成多个等维度的特征子空间,并基于每个子空间训练相应的基分类器,最后采取多数投票法的融合策略构造集成分类模型。在中文真实数据集上与基于随机子空间和Bagging算法的集成分类器进行了对比试验,结果表明,该算法在正确率和差异度方面优于随机子空间和Bag-ging算法,并且取得了比单分类模型更好的识别性能。
- 黎冬媛刘智刘三孟文婷
- 关键词:集成分类器差异度
- e-Learning用户心理体验量化评价研究被引量:11
- 2012年
- 针对当前计算机系统服务质量评价缺乏从用户心理体验角度深入研究的问题,以e-Learning为背景,研究了用户心理体验的定量分析和评价,对用户心理体验进行了整体建模,分析了易用性、有用性、情绪等因素和特征对e-Learning用户心理体验的影响.采用资源覆盖率、推荐命中率等指标度量了易用性和有用性,构造了特征权重矩阵;基于层次分析法量化了整体的用户心理体验评价模型.在某高校e-Learning系统上的实际应用表明,采用所建模型能有效地发现e-Learning系统在用户心理体验方面存在的不足,可为进一步研究影响用户心理体验的情绪等特征、构建更加完善的用户心理体验量化评价方法提供参考.
- 吴茜媛张云强郑庆华付雁
- 关键词:层次分析法