夏建华
- 作品数:8 被引量:4H指数:1
- 供职机构:河海大学计算机与信息学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术天文地球文化科学更多>>
- 基于Word2fea模型的文本建模方法被引量:1
- 2016年
- 文本聚类在数据挖掘和机器学习中发挥着重要作用,该技术经过多年的发展,已产生了一系列的理论成果。传统向量空间模型的文本建模方法存在维度高、数据稀疏和缺乏语义信息等问题,然而仅仅引入词典的文本建模部分解决了语义问题却又受限于人工词典词量少、人工耗力大等多种问题。文中借鉴主题模型的思想,提出一种以word2vec算法得到词向量为基础,词聚类的类别为主题,结合文本中主题的频率、分布范围、位置因子等特征以获得文本在类别空间上的特征向量,完成文本建模的方法 word2fea。将其与两种文本建模方法 VSM和word2vec_base进行比较,实验结果表明该方法能够明显提高文本分类准确率。
- 卫华韩立新夏建华
- 关键词:文本分类
- 基于云端服务的藏汉双语教学构件重构平台关键技术研究与运用
- 何向真万福成孟祥和李亚超马宁徐涛马晓伟夏建华单义民傅佳瑶
- 课题组在任务下达以后,积极与国内外藏文专家、计算机专家及一线教学老师沟通交流,解决课题进展中遇到的各种问题,经过三年时间的艰苦研发,达到了课题的预期目标,超额完成了课题任务。在该期间课题组取得了一系列科技成果,其中包括申...
- 关键词:
- 关键词:藏汉双语教学
- 基于上下文语义的句子情感分类
- 2016年
- 针对现有机器学习方法在情感分析时,需要大量的训练数据和复杂的语言模型结构,但难以获取全文的情感问题,文中提出了一种在有限数据集的情况下,兼顾局部和全局的上下文信息情感模型结构。首先把词汇和语篇知识进行整合约束,然后通过后验正则化应用在条件随机场模型,最后得到句子的情感倾向。通过多组实验分析,本文使用的方法与CRF模型对情感句分类相比有明显的提升。
- 王伟韩立新夏建华
- 关键词:情感分类条件随机场
- 藏文Web网络环境下的搜索策略研究
- 2015年
- 该文分析了藏文Web网络的度分布和最大度优先搜索算法存在的问题,提出了搜索效率更高的二分度搜索算法和双遍历器的二分度与最大度同步搜索算法。根据社区划分原理,设计和构建了藏文Web社区环境下的搜索算法,实验结果表明,其平均搜索步数和平均查询信息量都优于实验中其他搜索算法。
- 陈新一夏建华杜玉祥万福成于洪志
- 关键词:度分布
- 基于藏语句多特征融合的主观题自动评分算法被引量:1
- 2014年
- 提出了一种藏语句多特征融合的主观题自动评分算法,构建了关键词词形相似度计算模型、词序相似度计算模型、句子长度相似度计算模型和句子语义相似度计算模型。该算法将计算模型与最大相似度矩阵相结合,计算主观题的标准答案与学生答案之间句子、段落的相似度,最终做出自动评分。实验结果表明,与其他方法比较,该算法能有效降低平均误差值。
- 于洪志夏建华万福成陈新一
- 关键词:多特征融合语义相似度相似度矩阵
- 无标度网络的免疫策略研究被引量:1
- 2012年
- 文章结合目标免疫和熟人免疫各自的优势,提出了一种改进的免疫算法:随机选择网络中的部分节点,对被选节点的最大度邻居进行免疫.在算法上结合了熟人免疫的优点,即无需获知全局网络结构信息,并具有目标免疫策略的高效性.通过对算法进行基于无标度网络拓扑进行仿真模拟,验证了本算法具有更高的免疫效率和更广的应用价值.
- 江静夏建华陈新一
- 关键词:最大度免疫策略网络结构
- 基于二分度的P2P优先搜索策略研究
- 2011年
- 文章通过分析最大度优先搜索策略在搜索步数大和查询信息量大的问题,并与次大度优先搜索策略进行比较,发现搜索效率的提高并不完全取决于节点的最大度.提出并设计了二分度的P2P优先搜索策略,使最大度优先搜索策略存在的问题得到了显著改善.
- 夏建华陈新一
- 关键词:最大度P2P
- 藏文Web动态网络模型和搜索策略研究
- 随着计算机科学与民族语言文字信息技术的结合,大量的藏文文字信息开始以Web形式涌现于互联网。藏文Web具有信息量大,覆盖范围广,并且时刻都在发生着动态变化。对于了解和掌握藏文Web网络信息的用户,如何实现快速有效地查找到...
- 夏建华
- 关键词:动态模型
- 文献传递