国家自然科学基金(60535030) 作品数:10 被引量:50 H指数:4 相关作者: 颜永红 杨琳 张建平 吴玺宏 李量 更多>> 相关机构: 中国科学院 北京大学 山东大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 电子电信 自动化与计算机技术 生物学 理学 更多>>
基于听觉感知子带的自适应谷点形成算法 自适应谷点形成算法具有结构小巧,算法简单而易于实现,性能显著等特点。在噪声消除、语音识别前端和助听器的设计领域有较强的实用价值。本文介绍了一种基于听觉感知的自适应谷点形成算法,在利用分带减弱由窄带效应引起的系统性能下降的... 张恒 付强 颜永红关键词:听觉感知 子带 文献传递 The dual-pathway model of auditory signal processing 2008年 Similar to the visual dual-pathway model, neurophysiological studies in non-human primates have suggested that the dual-pathway model is also applicable for explaining auditory cortical processing, including the ventral "what" pathway for object identification and the dorsal "where" pathway for spatial localization. This review summarizes evidence from human neuroimaging studies supporting the dual-pathway model for auditory cortical processing in humans. 王雯洁 吴玺宏 李量基于频率调制信息的人工耳蜗语音处理算法研究 被引量:4 2009年 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。 杨琳 张建平 王迪 颜永红关键词:人工耳蜗 语音处理 噪声环境 演唱水平评价因素的客观性分析 <正>1引言卡拉OK是一种喜闻乐见的娱乐方式,但目前绝大部分卡拉OK系统的演唱评价系统往往和歌手真正的演唱水平相关性甚远。如果能够研究影响演唱评价的主要因素,对于演唱水平的提高会有很大的帮助。 李明 曹川 刘建 颜永红文献传递 自由空间中的吸声系数测量方法 本文利用参量阵非线性自解调可听声在参量阵长内的平面波特性,使用单频声信号,在自由空间内对材料反射表面的驻波声场进行测量,并与传统驻波管测量结果进行了对比。结果表明在不使用驻波管的情况下,可以通过驻波比方法对材料的吸声系数... 匡正 叶超 张倩 杨军关键词:声学 驻波比 吸声系数 文献传递 参量阵差频声波指向性的研究 基于参量阵原理,将经过声频信号调制的超声载波,经过超声传感器阵列发射后,由于传播过程中的自解调作用,可以形成具有高指向性的可听声频声。本文分析了参量阵的Westervelt模型和Berktay模型,并重点研究了Berkt... 叶超 吴鸣 武帅兵 黄晨曦 杨军关键词:声学 指向性 文献传递 基于混合模型状态修正算法的非母语语音识别 <正>1引言随着现代社会信息的全球化,非母语语音识别成为语音识别技术领域研究热点之一。非母语口音说话人的语音识别相对母语口音说话人而言,识别性能将会大幅度降低,特别是对于 张晴晴 潘接林 颜永红文献传递 单通道语音增强算法对汉语语音可懂度影响的研究 被引量:18 2010年 考察了当前常用的几种单通道语音增强算法对汉语语音可懂度的影响。受不同类型噪音干扰的语音经过5种单通道语音增强算法的处理后,播放给具有正常听力水平的被试进行听辩,考察增强后语音的可懂度。实验结果表明,语音增强算法并不能改进语音的可懂度水平;通过分析具体的错误原因,发现听辩错误主要来自于音素错误,与声调关系不大;而且,同英文的辨识结果相比,一些增强算法对于中、英文可懂度影响差异显著。 杨琳 张建平 颜永红关键词:语音增强算法 汉语语音 可懂度 单通道 听力水平 噪音干扰 混合双语语音识别的研究 被引量:2 2010年 随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。 张晴晴 潘接林 颜永红关键词:语音识别系统 混合语言 双语 聚类方法 聚类算法 控制系统 基于音色单元分布的音乐结构分析 被引量:3 2010年 音乐的结构是音乐作品表达作者思想的一种重要形式,也是听众理解音乐作品内涵的有效途径。本文研究了基于音乐特征的音色单元建模方法,研究了在Fisher准则下,根据局部范围音色单元的分布,采用非监督聚类方法分析音乐的结构。实验结果证明了基于离散余弦变换的音色特征,用音色单元分布聚类算法进行音乐结构分析的有效性。 李相莲 李明 刘若伦 颜永红关键词:音乐作品 音色 FISHER准则 离散余弦变换 聚类方法