胡学钢
- 作品数:504 被引量:1,990H指数:21
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学理学经济管理更多>>
- 基于用户偏好的协同过滤推荐算法被引量:2
- 2017年
- 在用户的协同过滤推荐模型中,用户对项目评分的偏好行为会导致计算用户之间的相似性出现偏差,影响推荐的质量。文章根据用户的评分习惯划分用户,利用大间隔寻找用户的近似邻居,提出了一种基于用户偏好的协同过滤推荐算法,首先引入一种新的相似性度量方法计算用户之间的相似度,再构建一种基于用户偏好的协同过滤推荐模型。实验结果表明,该算法能有效提高推荐质量。
- 杨恒宇胡学钢林耀进
- 关键词:协同过滤用户偏好
- 基于不确定系数法约简频繁等价量化格的关联规则挖掘
- 概念格(也称为Galois格)是R.Wille在1982年首先提出的,能揭示数据中所蕴含的各种关系.然而,在实际应用时,概念格存在不足之处,Hu xue-gang.等在文[2]对Galois格进行了扩展,并作了包括量化概...
- 马玉宝胡学钢王浩
- 关键词:数据挖掘关联规则
- 文献传递
- 一种基于约简概念格的关联规则快速求解算法被引量:16
- 2005年
- 关联规则挖掘是数据挖掘领域中重要的研究分支,已形成了较多的研究成果。然而,大多数基于频繁项集求解关联规则的挖掘算法需要多次扫描数据库。该文提出了一种基于概念格的关联规则快速求解算法,该算法仅需一次扫描数据库即可确定所有的频繁项集并且进而能够快速求解出关联规则。文章首先讨论了约简概念格(RECL)的构造原理,并详细描述了基于RECL的关联规则的挖掘算法,最后以实验证明了算法的正确性和优越性。
- 胡学钢王媛媛
- 关键词:知识发现数据挖掘关联规则概念格
- 一种基于特征扩展的在线短文本数据流分类方法
- 本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构...
- 李培培胡阳胡学钢
- 文献传递
- 基于多特征选择的中文文本分类被引量:13
- 2007年
- 自动文本分类就是在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。特征选择作为文本分类中的关键,困难之一是特征空间的高维性,因此寻求一种有效的特征选择方法,降低特征空间的维数,成为文本分类中的重要问题。在分析已有的文本分类特征选择方法的基础上,实现了一种组合不同特征选择方法的多特征选择方法,应用于KNN文本分类算法,实验表明,多特征选择方法分类效果比单一的特征选择方法分类效果有明显的提高。
- 董梅胡学钢
- 关键词:文本分类
- 文本挖掘中的中文分词算法研究及实现被引量:17
- 2007年
- 文本挖掘是指使用数据挖掘技术,自动地从文本数据中发现和提取独立于用户信息需求的文档集中的隐含知识。而中文文本数据的获得是依靠中文信息处理技术来进行的,因而自动分词成为中文信息处理中的基础课题。对于海量信息处理的应用,分词的速度是极为重要的,对整个系统的效率有很大的影响。分析了几种常见的分词方法,设计了一个基于正向最大匹配法的中文自动分词系统。为了提高分词的精度,对加强歧义消除和词语优化的算法进行了研究处理。
- 许高建胡学钢王庆人
- 关键词:中文分词歧义消除
- 基于学生解题分析的认知诊断研究被引量:1
- 2019年
- 分析目前教育学研究者对于认知诊断模型的观点,指出基于试题知识点关联矩阵的DINA模型难以适应学生解题的海量数据呈现出的不同粒度层次问题,提出多粒度知识点表示模型并改进认知诊断模型,说明模型可以构建知识点之间的关联关系、解决数据稀疏问题和不同粒度的知识点表示问题。
- 胡学钢卜晨阳刘菲吴共庆
- 关键词:个性化学习DINA模型
- 一种过滤式多标签特征选择算法被引量:8
- 2015年
- 多标签数据的过滤式特征选择依靠特征评价对特征选择,快速有效得到候选特征.但现有算法多将标签集合简单化,将其视作独立标签加以研究,忽视了多标签集合内部相互关系.近年来,由于MRMR算法在单标签数据领域方面简单、快速、高效的特征选择能力,成为过滤式特征选择算法的流行算法之一.提出一种基于MRMR(Max-Relevance Min-Redundancy)过滤式多标签特征选择算法(ML-MRMR),直接通过对特征进行权重计算,得到特征与多标签集合的相互关系,以获得更好的候选特征子集.同时,算法的特征评价过程中不仅考虑了特征间以及特征与多标签的相互影响,更考虑到多标签内部可能存在的相互关系,将标签相关性加入特征评价当中,提出了可适应多标签数据的度量标准.最后,在真实多标签数据集上的实验结果表明:所提算法能够对数据大幅降维并稳定有效地提高降维后数据的分类效果.
- 胡学钢许尧李培培张玉红
- 关键词:过滤式互信息
- 基于任意分割的串行进位链规则获取的计算流程
- 2009年
- 分析了等价矩阵和联合决策矩阵规则提取算法对于大数据集低效性的根源.提出了基于任意分割的规则获取方法和相应的串行进位链计算流程.这种计算流程将大数据集上的规则获取,转化为通过分割后多个智能体(子系统)及其智能体间数据共享的"并行+串行"的规则提取计算过程,有效的解决了大数据集上规则获取问题.复杂度分析表明该算法在效率上较现有的算法有显著的提高;实例分析验证了该方法的可行性;相应的对比实验表明这种计算流程对大数据集上的规则获取的实用性和高效性.
- 程玉胜张佑生胡学钢章晓良
- 关键词:粗糙集理论智能体矩阵分块
- 数据结构课程设计的改革与创新探讨被引量:10
- 2008年
- 鉴于数据结构的课程理论和实践性强、内容丰富且抽象以及难以将理论知识应用到实际中的特点,数据结构的课程设计是将数据结构的理论知识应用到生产实践,提高分析、解决问题的能力,达到融会贯通和灵活运用所学的知识的目的。文章结合多年的数据结构课程设计实践,提出了相应的改进措施,以提高教学质量。
- 王德兴胡学钢张玉红张晶
- 关键词:数据结构课程设计教学改革