您的位置: 专家智库 > >

教育部人文社会科学研究基金(12YJCZH201)

作品数:11 被引量:52H指数:5
相关作者:王荣波谌志群黄孝喜王小华陆蓓更多>>
相关机构:杭州电子科技大学天格科技(杭州)有限公司更多>>
发文基金:教育部人文社会科学研究基金国家自然科学基金杭州市科技发展计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 11篇中文期刊文章

领域

  • 11篇自动化与计算...

主题

  • 2篇支持向量
  • 2篇支持向量机
  • 2篇中文
  • 2篇自然语言
  • 2篇网络
  • 2篇向量
  • 2篇向量机
  • 1篇动态规划
  • 1篇短文
  • 1篇多层面
  • 1篇信息处理
  • 1篇信息增益
  • 1篇依存
  • 1篇移动通信
  • 1篇隐喻
  • 1篇语句
  • 1篇语言
  • 1篇语言处理
  • 1篇语言特征
  • 1篇语言网络

机构

  • 11篇杭州电子科技...
  • 1篇天格科技(杭...

作者

  • 9篇王荣波
  • 6篇黄孝喜
  • 6篇谌志群
  • 3篇王小华
  • 2篇陆蓓
  • 1篇冯凯
  • 1篇高飞
  • 1篇吴铤
  • 1篇郭飞飞
  • 1篇杜婧君
  • 1篇周建成

传媒

  • 3篇杭州电子科技...
  • 2篇数据分析与知...
  • 1篇计算机工程
  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇计算机工程与...
  • 1篇大连理工大学...
  • 1篇计算机技术与...

年份

  • 1篇2020
  • 1篇2019
  • 2篇2018
  • 1篇2017
  • 3篇2015
  • 2篇2013
  • 1篇2012
11 条 记 录,以下是 1-10
排序方式:
基于回应消息的中文微博情感分类方法
2013年
通过对中文微博情感分类的深入研究,该文提出了基于回应消息的中文微博情感分类方法。首先,对微博回应消息进行情感标注,然后利用回应消息情感分布结合SVM算法对微博文本情感进行分类;其次,对分类特征进行了详细分析。实验结果表明,该方法能够得到更高的准确率和召回率。
郭飞飞王小华谌志群王荣波
关键词:情感分类支持向量机
基于动态规划的汉语句子相似度算法被引量:8
2013年
传统汉语句子相似度计算算法在处理大量专业词汇时准确率较低。为此,提出一种基于动态规划的汉语句子相似度算法。通过获取2个句子的公共子串集合,结合链表消重机制,从集合中获取2个句子的所有最长公共子串,并以此计算相似度。实验结果表明,对于含有大量专有名词的问题集合,该算法的测试正确率达93.6%,计算效率较高。
冯凯王小华谌志群
关键词:句子相似度动态规划最长公共子串
面向中文短文本情感分析的改进特征选择算法被引量:4
2019年
在中文短文本情感分析的特征提取中,词频逆文本频率指数算法TF-IDF存在特征词分布计算片面性的缺陷,信息增益算法IG不能很好地提取短文本特征,为此,提出了一种改进特征选择算法ITFIDF-IG。根据短文本语料特点提高更具分类效果的特征词权重,降低了无关词的干扰,并考虑特征词在分布上体现的分类效果,有效提取出更具分类贡献度的特征词,更适应中文短文本的情感分析,取得较好的分类性能。
王荣波沈卓奇黄孝喜谌志群
关键词:情感分析信息增益
基于卷积神经网络与SVM分类器的隐喻识别被引量:7
2018年
【目的】针对中英文的隐喻数据集,提出一种基于卷积神经网络与SVM分类器的隐喻识别方法。【方法】将实验数据向量化,结合词性特征和关键词特征作为卷积神经网络的输入,通过卷积层和池化层提取特征,应用SVM进行分类。针对卷积神经网络的池化层中特征采样的不完全性,提出将MaxPooling与Mean Pooling组合在一起的改进方法。【结果】相对于直接使用卷积神经网络,利用本文方法进行隐喻识别的准确率在英文动宾语料、英文形容词–名词词组语料和中文隐喻语料分别提高4.12%、0.84%和4.50%。【局限】中文分词不准确,影响词向量模型训练;卷积神经网络的层数过少,影响特征的完整性。【结论】根据中英文数据集上隐喻识别的结果分析,该方法在两个数据集上都取得了良好效果。
黄孝喜李晗雨王荣波王小华谌志群
关键词:卷积神经网络支持向量机特征提取
基于中文维基百科的命名实体消歧方法被引量:3
2012年
该文提出一种面向中文命名实体的统计消歧方法。该方法采用中文维基百科作为世界知识,同时以待消歧命名实体在维基百科中的消歧页包含的词义选项为候选的命名实体概念,在充分利用维基百科页面信息和链接信息,以及命名实体上下文信息的基础上,实现中文命名实体的消歧。在一个小规模测试集上进行了实验,并获得87.5%的准确率,表明提出的方法具有可行性和有效性。
杜婧君陆蓓谌志群
关键词:词义消歧中文信息处理
基于Bi-LSTM的多层面隐喻识别方法被引量:5
2020年
以双向长短期记忆网络(Bi-LSTM)为核心,结合多层卷积神经网络以及单向长短期记忆网络构建了多层面隐喻识别模型.基于多特征协同作用的思想,利用依存关系特征、语义特征、词性特征等多特征融合输入方法,丰富了模型的学习信息.为降低信息干扰,利用基于统计学的规范化文本输入方法提升模型识别效果.在英文语料词层面和句层面实验中,各个特征均表现出明显的正向作用.裁剪和填充处理及多特征协调作用在英文语料词层面研究中使F1值分别提升2.5%和5.1%,在句层面研究中F1值分别提升3.1%和1.9%.在中文语料句层面实验中,最优效果的F1值可达88.8%.
朱嘉莹王荣波黄孝喜谌志群
关键词:自然语言理解CNN
基于多算法融合的移动通信客户流失预测模型被引量:1
2018年
针对移动通信行业中客户不断流失的现状,提出了一种优于传统单一算法模型预测的组合模型。该组合模型的元模型分别为决策树模型、Logistic回归模型和BP神经网络模型,该模型综合了各个元模型的优势。通过构造拉格朗日函数的方式来确定每个元模型的最优权重,使组合后的预测模型达到最优的预测效果,并在某移动通信公司提供的数据仓库中随机选取足够数量的流失客户作为数据集进行实验。实验结果表明,该模型在预测的正确率上比每一个元模型均有明显的提高。该方法有很好的预测效果,能够帮助移动通信公司找出即将离网的客户,对其制定相应的业务来维护自身商业利益。该方法的局限在于仅考虑了各个元模型间线性组合的情况。
王荣波王亚杰黄孝喜谌志群
关键词:移动通信客户流失数据仓库
微博语言的复杂网络特征研究被引量:5
2015年
基于大规模微博语料库,构建了3个词同现语言网络,并采用复杂网络分析工具对这些语言网络进行分析。主要目的是探索复杂网络分析方法应用于微博文本的可行性,进而研究微博语言网络的个性特征。研究结果表明,复杂网络分析方法在微博文本上是可行的,在复杂网络的相关参数,如度分布、聚类系数、平均最短路径等方面反映了微博语言的语体特征。该研究不仅拓展了复杂网络方法在语言学领域的应用,而且为基于复杂网络的微博内容挖掘提供了可行途径。
马宏炜陆蓓谌志群黄孝喜王荣波
关键词:语言特征语言网络复杂网络
基于LIBSVM的“就是”句句间关系判别方法
2015年
针对使用规则和机器学习方法判别句间关系时出现因机器学习多次迭代而导致规则权值削弱现象,进而导致判别正确率偏低的问题,提出了在规则和机器学习相结合过程中对导入的明显规则特征进行加强处理的方法。首先,抽取依存词汇、语义、句子结构等具有明显规则的特有特征;然后,基于一些句间关系指示词提取普适的特征;其次,将特征写入待输入的数据向量,并且增加一维向量用来存储出现的明显规则特征;最后,运用LIBSVM模型结合规则和机器学习进行实验。实验结果表明,加强后的实验正确率较之加强前平均提高了两个百分点,各句间关系准确率、召回率、F1值整体上都取得了较好的结果,平均值达到了82.02%、88.95%、84.76%。实验思路和方法对研究句子间联系紧密度具有重要价值。
周建成吴铤王荣波常若愚
关键词:LIBSVMKAPPA值
基于多权值的SlopeOne协同过滤算法被引量:4
2017年
【目的】针对Slope One算法未考虑项目相似性、项目属性和对目标用户已有评分同等考虑进而导致推荐准确度降低的问题进行改进。【方法】提出一种基于改进的项目相似性度量、改进的项目属性相似性度量和用户评分概率函数的多权值的Slope One协同过滤算法,在项目相似性度量方面将共同评价的两个项目的用户数量和Pearson相关系数相融合,在项目属性相似性度量方面将修正的拉普拉斯平滑与Jaccard系数相结合,同时利用用户评分概率函数对用户已有评分进行有效区分。【结果】实验结果表明,本文方法相比于原Slope One算法,MAE值下降了5.4%,能够获得更好的推荐准确度。【局限】只关注推荐系统中用户对项目产生的评分,并没有关注用户对项目给出的评论,在一定程度上影响了推荐效果。【结论】本文方法更能适应评分数据稀疏性,有效提高了推荐系统的推荐质量。
覃幸新王荣波黄孝喜谌志群
关键词:协同过滤SLOPEONE
共2页<12>
聚类工具0