吕萍
- 作品数:12 被引量:15H指数:3
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划中国科学院“百人计划”更多>>
- 相关领域:电子电信自动化与计算机技术理学语言文字更多>>
- 音频匹配技术及其在音频检索中的应用
- 吕萍王炜颜永红
- 一种基于带语言模型并行音节解码器的语种识别系统
- 本文介绍了中科院声学所研发的电话语音多语种识别系统。该系统采用多音素解码器并行处理框架,其中每一个解码器对每个目标语种都构建了N元语言模型─它表征了目标语种在语法层上的内在联系。多解码器对测试语音并行解码后,生成多个音节...
- 索宏彬李明吕萍颜永红
- 关键词:电话语音支持向量机
- 文献传递
- 一种基于混淆网络的语音解码方法
- 本发明属于语音识别领域,具体的说,涉及一种基于混淆网络的语音解码方法,包括步骤:1)对语音特征进行深度优先帧同步Viterbi-Beam搜索,输出N-Best句子或者词格;2)将N-Best句子或者词格按照时间相似度算法...
- 吕萍颜永红潘接林韩疆
- 文献传递
- 广播新闻语料识别中的自动分段和分类算法被引量:3
- 2006年
- 该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于单音素解码的分段算法。仿效说话人鉴别中的方法,文中提出了基于混合高斯模型的分类算法。该算法较好地解决了音频段的多类判决问题。在“新闻联播”测试数据中的实验结果表明,该文提出的自动分段和分类算法性能与手工分段分类性能几乎相当。
- 吕萍颜永红
- 关键词:语音识别
- 广播新闻语料自动识别系统
- 广播新闻类语料作为真实语音的主要来源之一,已成为语音识别的研究重点。本文针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统一ThinkIT-BNR系统。该系统包括:音频匹配、音频自动分段、音频分类、...
- 吕萍颜永红
- 关键词:音频分类说话人聚类
- 文献传递
- 广播新闻语料自动识别系统
- 本文针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统一ThinkIT-BNR系统.该系统包括:音频匹配、音频自动分段、音频分类、说话人聚类、识别后处理,以及多阶段识别策略等多个模块.本文还通过半自...
- 吕萍颜永红
- 关键词:语音识别音素分析音频分类
- 文献传递
- 基于倒谱分析和距离测度的音频检索方法被引量:2
- 2006年
- 介绍一种基于倒谱分析的快速音频检索方法。该算法以倒谱特征参数为基础,在特征空间上采用距离测度的检索方法。在对CCTV1频道100 h音频库的测试中,该方法搜索均长为12.5 s的模板音频时的时速达到0.0014倍实时,而等错误率(Equal Error Rate,EER)仅为1.5%。实验结果表明,在保证了搜索速度的前提下,该方法有较低的误识率。文章最后针对所提出算法的不足之处提出了改进意见。
- 王炜吕萍颜永红
- 关键词:音频检索倒谱
- 广播新闻语料自动识别系统
- 近年来,语音识别的研究对象从实验室内朗读式语音转向现实生活中的真实语音信号.广播新闻类语料作为真实语音的主要来源之一,成为语音识别的研究重点.本报告针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统...
- 吕萍
- 关键词:语音识别说话人聚类识别后处理
- 文献传递
- 一种基于带语言模型并行音节解码器的语种识别系统
- 本文介绍了中科院声学所研发的电话语音多语种识别系统。该系统采用多音素解码器并行处理框架,其中每一个解码器对每个目标语种都构建了 N 元语言模型—它表征了目标语种在语法层上的内在联系。多解码器对测试语音并行解码后,生成多个...
- 索宏彬李明吕萍颜永红
- 关键词:语种识别支持向量机
- 文献传递
- 一种基于混淆网络的语音解码方法
- 本发明属于语音识别领域,具体的说,涉及一种基于混淆网络的语音解码方法,包括步骤:1)对语音特征进行深度优先帧同步Viterbi-Beam搜索,输出N-Best句子或者词格;2)将N-Best句子或者词格按照时间相似度算法...
- 吕萍颜永红潘接林韩疆
- 文献传递