陈永彬
- 作品数:13 被引量:40H指数:4
- 供职机构:东南大学信息科学与工程学院无线电工程系更多>>
- 发文基金:国家自然科学基金中国博士后科学基金江苏省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 全音节汉语语音识别系统的声学模型研究被引量:7
- 1994年
- 本文在分析了汉语单音节发音的音节结构的基础上,定义了基于声韵母类的语音识别单元,从声学角度确定了用于汉语全音节识别系统的声学单元,并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计,给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明,本文定义的语音识别单元具有很高的检测一致性,建立在其上的识别,系统也具有很高的鲁棒性;文中给出的预选方法在最好的情况下,可以减少一半以上的运算量,而预选精度几乎达到100%。
- 关存太陈永彬吴伯修
- 关键词:语音识别系统汉语声学模型
- 与文本无关的讲话人辨认研究
- 本文首先对比了几种传统的语音特征参数用于辨认讲话人的有效性,然后介绍了一种实用的与文本无关的讲话人辨认系统-TISI(Text-Independent Speaker Identification)。 TISI使用长时间...
- 杨伟东陈永彬
- 文献传递
- 人工智能在语音处理中的应用
- 1994年
- 引言 语音信号处理应包括:语音通信(人讲话、人听话)、语音识别(人讲话、机器听话)和语音合成(机器讲话、人听话)三类。 语音通信是指人讲了话形成语音信号之后,如何通过机器进行变换(压缩)和传输,最后到达人耳之前的处理过程。
- 陈永彬关存太
- 关键词:语音处理元音识别人工智能
- 汉语讲话者辨别方法研究被引量:8
- 1998年
- 根据讲话者在讲话时鼻腔相对固定以及汉语鼻音声母少(只有m-和n-两种)的特点,使用极零模型,并以所有汉语鼻声母音节的零点谱为参数,实现汉语讲话者辨别.所选择的参数稳定、有效,系统模板存储量少.系统训练和识别的运算量小,其规模在20个人时的性能为:用各个人所有单个声母测试时.首选总正识率为67.02%;随机地用3,4,5个声母平均后测试时,则首选正识率分别可达93.33%、96.7%、98.3%.
- 林宝成陈永彬
- 关键词:鼻音声母语音信号处理
- HMM语音识别模型与一种修正训练算法被引量:5
- 1994年
- 本文在统一的框架下描述了隐马尔柯夫模型(HMM)用于语音识别时的各种形式,包括离散HMM、连续混合密度HMM、半连续HMM和最大分量连续HMM等,指出各种模型均是统一形式下的导出形式.文中就离散HMM、连续混合密度HMM和最大分量连续HMM在非特定人全音节汉语语音识别中的应用,从识别率和复杂度两方面进行了性能比较.为提高最大分量连续HMM的识别性能;提出了一种修正的训练算法.
- 关存太陈永彬吴伯修
- 关键词:隐马氏模型元音识别
- 中低码率高质量声码器的研究
- 1989年
- 语音波形的压缩编码过去均用标量量化的方法,且已研究得相当深入,如APC、ATC等都可在32kbps时获得较高质量的话音,其信噪比已接近率失真理论所预测的水平,约达20dB左右,但当比特率降至2比特/样本时,性能就迅速变坏。矢量量化技术的问世,使得这一问题发生了根本性的变化。目前,对于语音波形的矢量量化在8kbps左右的传输码率上,人们已做了大量研究,并可得到较好的语音质量,但在较低的比特率上进行高保真度的话音编码尚须深入研究,本文就是这种研究的一个初步尝试。
- 向增俊陈永彬
- 关键词:声码器
- 基于ARMA模型的汉语讲话者识别被引量:14
- 1998年
- 实现了一个仅用鼻音声母且与文本无关的汉语讲话者识别系统,根据讲话者在讲话时鼻腔相对固定、发鼻音时咽腔稳定,以及汉语鼻音声母(只有m-和n-两种)少(全部音节分别只有53和48个)的特点,使用极零(ARMA)模型获得所有汉语鼻声母音节的极点和零点系数的谱参数。系统在对20个讲话者识别时,其性能为:各个人所有单个声母测试时,总正识率为87.92%;分别随机地选用各人的人3、4、5个声母平均后测试时,则平均正识率可达91.67%、95.00%、96.67%、99.97%。
- 林宝成陈永彬
- 关键词:ARMA模型汉语语音识别
- 用于话者识别的一种自适应端点自动检测方法
- 端点自动检测是指用计算机技术在语言流中自动检测出各个音节字的起点及终点, 不论是在语音识别还是在话者识别研究中,这都是研究人员面临的首要问题。本文针对目前话者识别研究中端点自动检测方法不通用的缺陷,提出一种对不同信噪比的...
- 杨伟东陈永彬
- 文献传递
- 调型作预处理器的普通话双音词识别方案
- 1989年
- 基于超音段信息在语音感知中的显著作用。本文提出了一种新颖的汉语双音节词(二字词)识别方案。首先将输入语音调型进行时、频归一化处理,并将其和参考调型匹配;再对由此得到的候选集进行精确的谱匹配。在这步处理中结合了动态能量信息,并采用了修正的动态规划算法。实验结果表明,这种方案对于高混淆性汉语二字词识别十分有效。
- 许利群陈永彬
- 关键词:调型预处理器汉语
- 实时低码率话音编码器
- 1993年
- 本文用双片TMS320C25实现了一个码率约为7kbps的实时CELP编码器(如附图)。该编码器构造了一个结构化的高斯噪声码本,并推导出适合双片处理器工作的双向递推求加权滤波器响应的公式,用以完成码本的快速搜索。该编码器还包含有一个话音检测器(VAD),用以实现有/无话检测。
- 关存太陈永彬吴伯修
- 关键词:语音编码器低码率语音信号处理