潘接林
- 作品数:74 被引量:168H指数:6
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术语言文字理学更多>>
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 本文提出的分段算法先使用距离测算的方法将音频流分为较为零碎的片段,再利用贝叶斯信息判据(BIC)对相邻的片段进行合并,力图使每一个音频片段中仅含有单一的声学特征.此算法在广播新闻语料和访谈性质的电话交谈中均取得了较好的效...
- 徐燃刘晓星潘接林
- 关键词:语音信号处理
- 文献传递
- 迭代数控制的稀疏约束波束形成算法被引量:2
- 2017年
- 研究了基于L1范数约束的快速迭代算法,分析了其迭代过程以及与波束形成算法相结合的方式。提出了一种基于迭代数控制的波束形成算法,并给出了实现过程。所提算法避免了现有算法对信噪比估计的依赖,并提高了算法在低信噪比环境下的干扰抑制能力。经验证,该方法在维持了较低复杂度的前提下,其信干噪比在不同信噪比条件下的稳健性要优于对比算法。
- 曹占中胡冬妮李煦李煦颜永红
- 关键词:波束形成自适应滤波阵列信号处理
- 小资源下基于神经网络的声学建模
- 小资源条件是指用于搭建语音识别系统的训练数据受限的情况。在该情况下,声学建模的精度亦受到影响。本文主要研究了小资源条件下神经网络声学模型的选择问题,重点对比了p-norm DNN(Deep Neural Networks...
- 杨晋仪张鹏远潘接林颜永红
- 关键词:语音识别声学模型
- 文献传递
- 一种基于距离测算和贝叶斯信息判据的音频分段算法
- 音频流分段技术在语音识别的前端信号处理过程中有着重要的意义。好的音频分段算法应能根据说话人、信道等声学环境的变化对输入音频流进行分段,从而为后续的聚类和自适应过程做好准备。本文提出的分段算法先使用距离测算的方法将音频流分...
- 徐燃刘晓星潘接林
- 关键词:声学特征
- 文献传递
- 基于长时特征与扩展音素集的韩语语音识别改良算法
- 韩语是黏着语的一种,其特点是音素发音会受到上下文影响。这一特点使语音识别中声学模型的建模产生混淆,从而影响系统的识别性能,鉴于传统短时特征的上下文信息极为缺乏,本文引入长时特征对分布于时域的信息进行收集与分析,进而缓解声...
- 徐及潘接林颜永红
- 关键词:语音识别韩语
- 文献传递
- 一种演唱的评分系统和方法
- 本发明公开了一种演唱的评分系统和方法,通过对演唱语音信号进行音符切分、量化,搜索歌曲中的对应演唱歌曲片段,计算多种距离,并综合得到演唱评分。通过应用本发明,使得只要演唱数据在旋律上与原声有较好的一致性,就可以得到较准确的...
- 颜永红李明曹川刘建潘接林
- 文献传递
- 口语障碍者的语音特征分析与变换
- 声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景。本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音。在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(G...
- 张建平潘接林韩疆颜永红
- 文献传递
- 语音识别系统
- 本发明公开一种语音识别系统,包括:模数变换单元,将输入语音的模拟信号变换为数字信号;特征提取单元,对该数字信号进行分帧处理,提取每一帧语音的特征参数,得到其特征矢量序列;特征码本,由一定数量的码字组成;量化编码单元,根据...
- 潘接林韩疆刘建颜永红庹凌云张建平
- 文献传递
- 基于异构计算的语音识别解码加速方法被引量:1
- 2019年
- 提出一种基于异构计算方法加速基于神经网络声学模型的语音识别解码器的方法。该方法通过GPU和CPU协同计算,利用GPU的浮点运算能力和并行计算能力加速神经网络计算,从而加快语音识别解码过程。为了充分利用计算资源,本文实现了多卡多线程GPU-CPU协同解码系统,并对神经网络计算过程进行了优化,以提升计算并行程度。所提出的加速方法与仅使用CPU的解码方法相比,取得了3倍以上的解码加速比,并保持解码精度不变。
- 张舸张鹏远张鹏远颜永红
- 关键词:语音识别解码器异构计算神经网络
- 语音识别系统及用于语音识别系统的特征矢量集的压缩方法
- 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提...
- 潘接林韩疆刘建颜永红庹凌云张建平
- 文献传递