李琳
- 作品数:66 被引量:83H指数:6
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学经济管理更多>>
- 基于端到端的多语种语音识别研究被引量:4
- 2021年
- 端到端语音识别模型无需发音词典进行训练,可以大幅降低开发新语种语音识别系统的负担。本文利用端到端模型的这一优势,建立了一种语种无关的端到端多语种语音识别系统。该模型使用基于字符的建模方法进行训练,同时构建多语种输出符号集,使其包括所有目标语言中出现的字符。模型训练生成单一模型,其网络参数为所有语种共享。在OLR竞赛提供的10个语种数据集上,相较于单语种语音识别系统,本文提出的多语种语音识别系统在所有语言上的表现都更加优秀。
- 胡文轩王秋林李松洪青阳李琳
- 关键词:端到端语音识别多语种
- 跨信道说话人识别语音库的设计与研究
- 建立一个适合于特定说话人识别系统的汉语语音数据库,对推动说话人识别技术的研究和应用具有重要意义。本文针对说话人识别中信道差异问题,设计并建立了跨信道说话人识别语音库XMU-Multi Channel。本文首先分析比较了国...
- 李琳万丽虹黄玲洪青阳
- 关键词:语音数据库说话人识别
- 文献传递
- 我国货币政策股市传导机制的实证分析
- 随着我国经济的发展和改革开放的进行,我国的资本市场从无到有,从不成熟走向成熟,用十几年的时间走过了发达国家上百年走过的路程。现在股票市场在整个国民经济的影响力日益加深。股票市场在传递货币政策,发挥货币政策对实体经济活动的...
- 李琳
- 关键词:金融市场货币需求货币政策信息传导
- 文献传递
- 基于FPGA的LUKS认证芯片电路及其密码恢复方法
- 基于FPGA的LUKS认证芯片电路及其密码恢复方法。芯片电路设控制、密码生成、3个用户密钥PBKDF2、用户密钥选择、AES128密钥扩展、AES128解密、BRAM存储、反取证合并、哈希校验值PBKDF2和比较共12个...
- 李晓潮曹春辉吴孔程李鹏涛李琳郭东辉
- 文献传递
- 基于概率生成和非自回归模型的多说话人语音合成方法
- 本发明提出了一种基于概率生成和非自回归模型的多说话人语音合成方法,包括:S1、说话人个性化编码器和概率生成编码器接收目标梅尔频谱并分别提取说话人个性化向量和概率生成向量;S2、基于深度网络的编码器对拼接融合的输入向量进行...
- 李琳欧阳贝贝洪青阳
- 快速有效的视频图像序列拼接方法被引量:14
- 2009年
- 针对现有的视频图像序列拼接方法处理速度慢的问题,提出一种基于SURF特征的快速有效的拼接算法。该算法用鲁棒性强且计算性能优越的SURF算子取代传统的SIFT算子进行特征点提取;在特征点匹配方面,提出了一种基于哈希映射和双向最近邻距离比的匹配算法,可以快速有效地获得特征点间的对应关系。为了消除由于运动物体干扰带来的误匹配,采用随机采样一致性(RANSAC)方法来消除外点确保匹配的有效性,再通过最小二乘法估计视频帧之间的全局运动参数,最终拼接形成全景图。实验结果表明,该拼接算法快速有效,鲁棒性强,具有较高的使用价值。
- 林武洪景新张昊李琳
- 关键词:视频拼接SURF特征点匹配运动参数估计图像配准
- 基于最小分类误差准则的呼吸音分类技术
- 2016年
- 从大量呼吸音样本中归纳综合出肺部病理特征的科学表示,实现自动化、定量化的呼吸音分类,是现代医疗信息化技术的重要研究内容之一.提出了一种基于最小分类误差(minimum classification error,MCE)准则的呼吸音分类方法,建立呼吸音类别的分类误差损失函数,采用广义概率下降法(generalized probabilistic decent,GPD)估计得到呼吸音的隐马尔科夫模型(hidden Markov model,HMM)参数,以增强不同类型呼吸音模型的区分能力.实验结果表明,与传统的最大似然(maximum likelihood,ML)法相比,基于MCE准则求解的HMM模型,具有更好的分类效果,提高了识别准确率,客观证明了基于MCE准则的呼吸音分类技术的有效性.
- 李琳徐文皓洪青阳童峰吴谨准颜卫源
- 关键词:隐马尔可夫模型最大似然
- 一种基于嵌入特征融合的防伪说话人识别方法及系统
- 公开了一种基于嵌入特征融合的防伪说话人识别方法及系统,包括,获取注册语音数据集和测试语音数据集;搭建说话人识别模型,提取注册语音数据集中的说话人嵌入特征和测试语音数据集中的说话人嵌入特征;搭建语音防伪检测模型,提取测试语...
- 李琳谢兴嘉洪青阳
- 一种用于闽南语的合成方法及其装置
- 本申请公开了一种用于闽南语的合成方法及其装置,该方法的一具体实施方式包括:通过汉语‑闽南语音素映射词典和闽南语录音分别构建汉语文本库、闽南语音素库和闽南语语音库,通过闽南语音素库和编码解码器将文本数据转换为Mel频谱序列...
- 洪青阳颜世江许彬彬陈越李琳
- 文献传递
- 生物声带振动发声的非线性特性研究
- 声音已经贯穿于生物之间信息传达、嗓音医学、声乐艺术、语音识别、人工智能等众多领域中,是信息传递和科学探索必不可少的工具。然而,对于大多数哺乳动物包括人在内,声带组织振动是产生声音的根源。因而,研究生物的声行为具有重要的科...
- 李琳
- 关键词:生物学