谢飞
- 作品数:41 被引量:191H指数:8
- 供职机构:合肥师范学院更多>>
- 发文基金:国家自然科学基金安徽省高校省级自然科学研究项目安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学交通运输工程机械工程更多>>
- 基于密度聚类模式的中文新闻网页关键词提取被引量:3
- 2009年
- 关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的众多新闻网页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用。由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词。通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15%,准确率平均提高了7.075%。
- 尹倩胡学钢谢飞吴信东
- 关键词:关键词提取词共现聚类自然语言处理
- 基于张量空间模型的中文文本分类被引量:2
- 2010年
- 针对传统的基于向量的中文文本表示方法预处理过程比较复杂,应用于高维数据容易产生维数灾难的局限性,文章提出了一种基于张量空间模型的中文文本分类方法,用三阶张量表示文本集,将基于向量的kNN分类器扩展到张量上以构建分类器。该方法简化了预处理过程,提高了准确率,并使得更多张量学习方法能够在中文文本分类中得以应用。实验证明其具有较高的分类准确率,有一定的实用价值。
- 何伟胡学钢谢飞
- 关键词:文本分类
- 基于词向量空间模型的文本分类方法
- 大多文本分类方法是基于向量空间模型的,基于这一模型的文档向量维数较高,导致分类器效率难以提高。针对这一不足,本文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词.类别支持度矩...
- 董学春胡学钢谢飞吴共庆
- 关键词:文本分类向量空间模型
- 文献传递
- 基于图和LDA主题模型的关键词抽取算法被引量:38
- 2016年
- 关键词是表达文档核心内容的最小单元。自动抽取一篇或多篇文档的关键词,较传统的人工标注关键词,能节省大量的时间和人力消耗。本文提出了一种基于图和主题模型的关键词抽取算法,首先利用LDA主题模型,计算出词与词之间的相似性,作为词与词之间的权重并构建一个带权无向词图。与传统TextRank不同的是,图的节点不再是单个的词,而是选择短语作为图的节点。最后,再从这些短语节点中选择Top K个词作为文章的关键词。我们选择了两个公开数据集进行了实验,结果表明我们的算法优于现有的关键词抽取算法。
- 刘啸剑谢飞吴信东
- 关键词:关键词抽取
- 基于位置权重的文本分类被引量:2
- 2008年
- 文章研究了基于向量空间模型的文本分类中特征词权重算法,综合考虑特征词在文本中出现的位置信息,提出一种改进算法并给出实验结果。
- 台德艺谢飞胡学钢
- 关键词:文本分类向量空间模型
- 社交网络中隐式事件突发性检测被引量:7
- 2018年
- 社交网络与人们的生活息息相关,其上的用户行为可用于检测社交网络中的事件突发性,进而准确定位事件的发生区间.但用户行为易受主观及外部因素的影响,有时会出现隐式事件突发性,给事件突发性检测带来困难.本文针对社交网络中的隐式事件突发性问题,在以社交行为特征进行事件突发性检测的基础上,引入关键词特征,动态调整各个时间窗口的候选关键词,将不同事件与不同的关键词特征绑定,避免事件之间及噪音带来的干扰,实现对隐式事件突发性的准确识别.相关实验表明,本文提出的算法可有效改善现有社交网络中事件突发性检测任务的效果.
- 介飞谢飞李磊吴信东
- 关键词:社交网络
- 基于语义联系的新闻网页关键词抽取被引量:10
- 2009年
- 提出一种基于语义联系的新闻网页关键词抽取方法,不仅考虑了词语在知识库《知网》中的语义相似度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词。对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于《知网》语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%。
- 谢飞吴信东胡学钢李星华江兆中
- 关键词:关键词抽取词汇链语义联系
- 新工科背景下深度神经网络课程建设与实践
- 2023年
- 分析了新工科背景下“深度神经网络”课程的教学现状及面临的问题,从优化教学内容、个性化差异化实践教学、加强过程性考核等方面对教学模式和教学方法进行探索。通过实验、实践、项目等方式让学生更好地掌握理论知识,从而培养学生的工程应用能力和创新思维,以适应未来的就业实践和科学研究,同时为新工科背景下人工智能类课程教学改革提供思路。
- 桑磊谢飞
- 关键词:人工智能教学改革
- 结合主题分布与统计特征的关键词抽取方法被引量:8
- 2017年
- 传统人工抽取关键词耗时耗力,为了能自动从文档中抽取出高质量的关键词,提出一种关键词自动抽取方法。该方法基于文档和词语的主题信息并结合词语的统计特征为候选词语打分,最终选择TopK得分的候选词作为文档关键词。实验结果表明,该方法在准确率、召回率以及F值上均优于现有的基本关键词抽取方法,能有效从文档中抽取出关键词。
- 刘啸剑谢飞
- 关键词:主题分布关键词抽取统计特征主题信息
- 基于词向量空间模型的中文文本分类方法被引量:15
- 2007年
- 大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。
- 胡学钢董学春谢飞
- 关键词:文本分类向量空间模型