周若华 作品数:39 被引量:40 H指数:4 供职机构: 中国科学院声学研究所 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国科学院战略性先导科技专项 更多>> 相关领域: 电子电信 自动化与计算机技术 文化科学 更多>>
一种应用于语种识别的鉴别性特征提取方法 本发明涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语... 袁庆升 周若华 云晓春 张健 陈训逊 颜永红 徐杰 李锐光文献传递 一种基于共有鉴别性子空间映射的语种识别方法及装置 本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到... 周若华 颜永红 王宪亮 刘建文献传递 一种说话人识别方法 本发明涉及一种说话人识别方法,该方法首先生成说话人识别模型,把背景语音和目标说话人语音作为训练数据,训练出第一高斯混合-通用背景模型,总变化空间,第二高斯混合-通用背景模型,局部线性鉴别分析模型;利用第一高斯混合-通用背... 周若华 许云飞 颜永红 杨琳基于非负矩阵分解的钢琴多音符估计 被引量:1 2014年 提出了一种基于能量谱包络非负矩阵分解的钢琴多音符估计算法。首先对钢琴88个单音片段进行RTFI时频分析,求得对应平均能量谱,经过时序平均、归一化求得平均能量谱包络,拼接成钢琴的单音能量谱包络基矩阵。之后对测试的多音片段,采用同样处理方法求得多音平均能量谱包络,通过非负矩阵分解求得各音符的权重系数,最后通过阈值限定求得多音符估计结果。性能评估实验基于MAPS数据集的UCHO集和RAND集展开,与MIREX中最好的钢琴音乐自动记谱系统相比,本文提出的钢琴多音符估计算法性能有很大幅度的提升。 万玉龙 王宪亮 周若华 颜永红关键词:钢琴音乐 非负矩阵分解 一种基于降噪自动编码器的语种识别分类方法及装置 本发明提供一种基于降噪自动编码器的语种识别分类方法,其包括:步骤1)从待识别的语音片段中提取待识别的语音信号,获得底层声学特征;步骤2)从步骤1)获得的底层声学特征提取原始i‑vector;步骤3)计算并获得音素向量p<... 周若华 苗晓晓 颜永红文献传递 高斯PLDA在说话人确认中的应用及其联合估计 被引量:3 2014年 近年来,基于总变化因子的说话人识别方法成为说话人识别领域的主流方法.其中,概率线性鉴别分析(Probabilistic linear discriminant analysis,PLDA)因其优异的性能而得到学者们的广泛关注.然而,在估计PLDA模型时,传统的因子分析方法只更新模型空间,因此,模型均值不能很好地与更新后的模型空间耦合.提出联合估计法对模型均值和模型空间同时估计,得到更为严格的期望最大化更新公式,在美国国家标准与技术局说话人识别评测2010扩展测试数据库以及2012核心测试数据库上,等错率得到一定提升. 许云飞 杨海 周若华 颜永红关键词:期望最大化 一种基于条件生成式对抗网络的语种识别分类方法 本发明提供了一种基于条件生成式对抗网络的语种识别分类方法,该方法具体包括:步骤1)利用现有的DBF‑DNN语种识别系统,获得训练集的i‑vector和测试集的i‑vector;步骤2)建立并训练生成模型G和判别模型D,构... 周若华 苗晓晓 颜永红文献传递 一种应用于语种识别的鉴别性特征提取方法 本发明涉及一种应用于语种识别的鉴别性特征提取方法,包括:在训练阶段为训练集中的语音数据的帧级的音素后验概率特征向量计算F比指标,所述F比指标反映了音素后验概率特征向量中每一维对语种鉴别性的贡献大小;在测试阶段为待测试的语... 袁庆升 周若华 云晓春 张健 陈训逊 颜永红 徐杰 李锐光文献传递 一种基于音视频信息的自动音乐记谱方法及系统 本发明涉及一种基于音视频信息的自动音乐记谱方法及系统,所述方法包含:采集钢琴演奏的视频和音频数据;依据采集的视频信息用视频跟踪算法获取手部在钢琴上的所有位置信息,根据所述手部位置信息确定演奏者所演奏的弹奏音符和各弹奏音符... 周若华 颜永红 万玉龙文献传递 一种基于共有鉴别性子空间映射的语种识别方法及装置 本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到... 周若华 颜永红 王宪亮 刘建文献传递