搜索到1099篇“ 统计语言模型“的相关文章
一种基于统计语言模型的加密方法
本发明公开了一种基于统计语言模型的加密方法,包括:建立基础统计语言模型;获取包含若干语言资料的语言资料集;将所述语言资料集作为训练数据对所述基础统计语言模型进行训练,得到目标统计语言模型;根据所述目标统计语言模型对待加密...
李超王亚东
一种基于统计语言模型的加密方法
本发明公开了一种基于统计语言模型的加密方法,包括:建立基础统计语言模型;获取包含若干语言资料的语言资料集;将所述语言资料集作为训练数据对所述基础统计语言模型进行训练,得到目标统计语言模型;根据所述目标统计语言模型对待加密...
李超王亚东
一种基于统计语言模型得分规整的语音识别方法及系统
本发明一种基于统计语言模型得分规整的语音识别方法,所述方法包括:步骤1)建立和训练若干个基于多尺度马尔科夫假设的统计语言模型;包括:k阶统计N元文法语言模型,k‑1个不同阶数的统计N元文法语言模型和k‑1个不同阶数的改进...
张鹏远张一珂潘接林颜永红
统计语言模型的解码方法研究
自然语言处理中的文本生成是一个重要的研究方向,并拥有广泛的应用空间,如机器翻译,摘要生成,开放性文本生成等。现阶段利用统计语言模型和解码算法构建的文本生成系统取得了最好的结果。相比于基于语言模型训练和结构的改进而导致的生...
陶锐文
关键词:统计语言模型解码算法概率分布
基于统计语言模型的个性化API补全方法研究
API补全是当今开发者们使用最为频繁的代码补全方法之一。近年来,大数据与人工智能技术发展迅猛,这为API补全带来了新的可能。其中,统计语言模型在代码补全领域取得了广泛关注,它先使用程序表示技术将程序代码转化成语句序列,再...
马张驰
关键词:统计语言模型循环神经网络个性化推荐
文献传递
一种基于统计语言模型得分规整的语音识别方法及系统
本发明一种基于统计语言模型得分规整的语音识别方法,所述方法包括:步骤1)建立和训练若干个基于多尺度马尔科夫假设的统计语言模型;包括:k阶统计N元文法语言模型,k‑1个不同阶数的统计N元文法语言模型和k‑1个不同阶数的改进...
张鹏远张一珂潘接林颜永红
文献传递
统计语言模型内在机制及应用
要实现计算机对语言的处理,就必须采用数学的或逻辑的方法对自然语言进行精确描述和刻画,以便用计算机自动处理。统计语言模型是应用概率论与数理统计的知识和方法,试图刻画、记录并使用自然语言中存在的规律。本书对朴素贝叶斯、隐马尔...
于江德
关键词:文字处理统计语言学
基于统计语言模型改进的Word2Vec优化策略研究被引量:12
2019年
该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,而改进的语言模型通过文本关键词建立了词本身与整个文本之间的联系,在词向量训练结果的查准率和相似度方面,改进模型训练出的词向量较skip-gram、CBOW语言模型有一个小幅度的提升。通过基于维基百科1.5GB中文语料的词向量训练实验对比后发现,使用CBOW-TFIDF模型训练出的词向量在相似词测试任务中结果最佳;把改进的词向量应用到情感倾向性分析任务中,正向评价的精确率和F1值分别提高了4.79%、4.92%,因此基于统计语言模型改进的词向量,对于情感倾向性分析等以词向量为基础的应用研究工作有较为重要的实践意义。
张克君史泰猛李伟男钱榕
关键词:统计语言模型TFIDF
基于统计语言模型算法的智能信息评估和营销系统
本发明公开了一种基于统计语言模型算法的智能信息评估和营销系统,其技术方案要点是包括统计语言模型、双向匹配分词算法、统计语言模型算法与双向匹配分词算法协同工作、提取关键词和内部评估这一系列步骤,本发明的优点在于可以代替人工...
吴俊哲吴剑东
文献传递
基于统计语言模型与多目标优化算法推荐相似缺陷报告
在软件开发过程中,开发人员会收到并处理用户提交的大量缺陷报告。为了提高开发人员处理缺陷报告效率,对于一份查询缺陷报告,本文旨在对其推荐相似缺陷报告进行研究,以供开发人员参考修复缺陷。若修复缺陷报告中问题涉及到的相同源代码...
樊田田
关键词:软件开发统计语言模型多目标优化算法
文献传递

相关作者

黄永文
作品数:12被引量:87H指数:6
供职机构:重庆大学计算机学院
研究主题:统计语言模型 数据稀疏 互信息 文本分类 支持向量机
方刚
作品数:18被引量:35H指数:4
供职机构:西安文理学院
研究主题:DNA计算 合成生物学 动态规划算法 统计语言模型 三链核酸
何中市
作品数:149被引量:570H指数:12
供职机构:重庆大学
研究主题:支持向量机 自然语言处理 云模型 向量空间模型 特征提取
钟义信
作品数:279被引量:2,240H指数:26
供职机构:北京邮电大学
研究主题:人工智能 神经网络 全信息 方法论 自然语言处理
王晓龙
作品数:173被引量:1,173H指数:20
供职机构:哈尔滨工业大学
研究主题:音字转换 语句 自然语言处理 中文信息处理 语言模型