搜索到552篇“ 问句相似度“的相关文章
一种垂直领域问句相似计算的实现方法
本发明公开一种垂直领域问句相似计算的实现方法,涉及自然语言处理及信息检索领域;利用word2vec训练得到垂直领域问句的词向量模型,同时对垂直领域问句进行依存句法分析,识别出主语、谓语和宾语,利用主语、谓语和宾语的相似...
彭云龙翟超
一种结合同义词词典和词嵌入向量的问句相似计算方法
本发明公开了一种结合同义词词典和词嵌入向量的问句相似计算方法,包括句子级别的相似融合方法和词语级别的相似融合方法;将句子级别的相似融合方法和词语级别的相似融合方法进行结合计算,本发明具有以下优点:相对于单纯使用...
张家重赵亚欧王玉奎付宪瑞张金清
基于CoSENT的航空装备领域问句相似匹配算法
2023年
针对航空装备使用和保障人员获取信息效率低的问题,将文本相似匹配技术引入航空装备维修保障问答领域,结合规则模板、生成模型等方法生成相似问句,提出一个航空装备维修保障领域问句相似数据集;融入外部信息知识,通过领域词典识别问句对中的关键词,对CoSENT(Cosine Sentence)模型引入关键词注意力机制和特征交互机制提升模型性能。在自建数据集和讯飞文本相似数据集上进行验证,与基准模型CoSENT相比,论文方法的Spearman相关系数分别提升了2.3%和1.7%。
翟一琛顾佼佼刘涛姜文志
关键词:文本相似度
基于SA-BiLSTM的中文问句相似计算方法被引量:1
2022年
在智能客服问答系统中,用户所提的问句存在着特征稀疏性强、口语化严重以及错别字等特点,导致问句相似计算的准确率不高,出现答非所问的情况。提出一种基于双向长短时记忆神经网络的问句相似计算模型SA-BiLSTM。通过对问句进行字向量的表示方法,采用Bi-LSTM提取句子语序关系特征并结合Self-Attention机制动态的调整特征权重,提高模型对问题的理解能力。在微众银行智能客服问句匹配大赛数据集(CCKS2018 Task3)上的实验结果表明,对问句采用字向量表示比词向量表示效果更好,使用自注意力机制可以使模型能学习更多问句中关键特征,SA-BiLSTM模型对问句的识别能力更强,其F1值提高了1.42%。
黄晓洲段隆振周玲元
关键词:句子相似度计算
基于混合式问句相似的TransMR模型及其应用研究
近年来,由于网络的发达,知识总量的增加,人们获取到的有用信息却少之又少。常见的搜索引擎使得很多用户不能及时的从网络上获取到有用信息,同时存在噪声数据过多和信息重复等问题,针对此类问题,问答系统应运而生。一方面,问答系统可...
张懿媛
关键词:知识图谱问答系统问句相似度
基于双向循环卷积神经网络的水稻知识问句相似匹配方法研究
全球气候变化和植物病害的爆发是水稻种植的主要威胁。农民缺少科技信息服务,影响水稻种植、病虫害防治等,及时、准确、高效地解决水稻生产问题,是水稻改良生产的保证和改善质量的关键。在中国农技推广信息平台问答社区,每天新增100...
刘志超
关键词:向量化相似度匹配
基于BiLSTM-CNN的水稻问句相似匹配方法研究被引量:3
2022年
中国农技推广信息平台(NJTG)问答社区可以帮助用户与农业专家进行交互,从而获得精准的问题答案以解决农业场景问题。在平台问答社区中,每天会新增关于水稻的提问语句上千百条,检测相同语义问句是农业智能问答的关键技术环节,针对此问题采用字符级别的Word2Vec表示初始化问句表征,使用Siamese神经网络作为基础模型框架,学习句子的语义特征,获取上下文信息,然后使用BiLSTM长短期神经网络提取语义时序特征,最后在语义层次上使用一种包含语义信息的余弦函数计算问句相似,并与其他语义匹配模型进行对比试验。通过构建7 820对水稻问句相似对数据集,用来优化和训练模型的重要参数。试验结果表明:本文提出的BiLSTM-CNN模型可高效提取文本不同粒的特征,提高水稻问句相似匹配效果,在所构建的数据集上BiLSTM-CNN模型准确率和F1值均高于其他文本匹配模型,达到98.2%和88.75%。与此同时,所提出的模型在6种不同类别的水稻问句对的准确率也优于其他对比模型,在数据量较小的情况下,仍然可以取得较高的准确率,证明提出的模型具有良好的鲁棒性。
刘志超王晓敏吴华瑞王郝日钦许童羽
关键词:水稻卷积神经网络相似度匹配
基于BERT-Attention-DenseBiGRU的农业问答社区问句相似匹配被引量:7
2022年
为了解决问答社区中相同语义问句文本的快速自动检测,提出一种基于BERT的Attention-DenseBiGRU农业问句相似匹配模型。针对农业文本具备的特征,采用12层的中文BERT文本预训练模型对文本数据进行向量化处理,并与Word2Vec、Glove、TF-IDF方法进行对比分析,得出BERT方法能够有效地解决农业文本的高维性和稀疏性问题,并且解决多义词在不同语境下具有不同含义的问题。该网络的每一层都使用注意特征的连接信息以及前面所有递归层的隐藏特征,为了缓解由于密集拼接而导致特征向量尺寸不断增大的问题,在模型的最后使用自动编码器进行特征降维。试验结果表明:基于BERT的Attention-DenseBiGRU农业问句相似匹配模型可以提高文本特征的利用率,减少特征丢失,能够实现快速及准确的农业问句文本相似匹配,在本文所构建的农业问句相似对数据集上精确率及F1值达到97.2%和97.6%,与其他6种问句相似匹配模型相比,效果提升明显。
王郝日钦王晓敏缪祎晟缪祎晟刘志超许童羽
关键词:自然语言处理
一种面向问答领域含有人名的问句相似计算方法
本发明公开一种面向问答领域含有人名的问句相似计算方法,分别计算人名与非人名部分的相似,并且考虑到句子的结构,从句子的语序以及长短两方面进行句子相似的计算,最终根据句子语义相似和结构相似加权求得整体句子的相似。...
常亮时雨宾辰忠古天龙孙彦鹏孙磊匡海丽
文献传递
基于深学习的中文问句相似计算方法研究
近几年以来,网络上的文本数据越来越多对海量的文本数据如何进行有效的管理已成为信息管理领域中热门的研究内容之一。信息管理领域首要的任务就是理解文本的语义,其中句子相似的计算就是常用的方法之一,它在智能客服、机器翻译、信息...
黄晓洲
关键词:句子相似度计算

相关作者

林鸿飞
作品数:446被引量:2,893H指数:27
供职机构:大连理工大学计算机科学与技术学院
研究主题:生物医学 关系抽取 情感分析 查询扩展 情感
余正涛
作品数:828被引量:1,183H指数:15
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
叶正
作品数:12被引量:73H指数:6
供职机构:大连理工大学
研究主题:CAPP 向量空间模型 问句相似度 语义相似度 问答系统
杨志豪
作品数:115被引量:655H指数:13
供职机构:大连理工大学计算机科学与技术学院
研究主题:生物医学 关系抽取 文本挖掘 生物医学文献 自然语言处理
古天龙
作品数:485被引量:1,418H指数:17
供职机构:桂林电子科技大学
研究主题:OBDD 装配序列规划 有序二叉决策图 离散事件系统 景点