凌震华
- 作品数:128 被引量:69H指数:5
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学语言文字更多>>
- 一种融合激励和颤音建模的端到端歌唱合成方法
- 2024年
- 近年来,歌唱合成技术快速发展,基于变分推理和流模型的端到端歌唱合成(VISinger)成为主流,但其在效果上和真人仍有一定差距,主要体现在合成歌声中的音高听感不连续、颤音合成不佳及发音不稳定等。为此,本文针对性地提出了一系列改进方法:针对基频稳定性问题,提出在解码器中增加激励模块,将基频信息以激励信号的形式显式提供给解码器;针对颤音合成不自然问题,增加颤音预测模块,通过流式模型和变分数据增强,显式对歌声中的颤音进行建模;进一步在先验网络中增加ReZero策略。实验结果显示,增加激励信号能提升合成基频的稳定性,颤音建模对颤音的恢复有显著提升作用,ReZero策略对训练速度和发音稳定性有一定提升。主观测听中,本文提出的模型在歌唱合成自然度上相比VISinger有显著优势,平均意见分(Mean opinion score,MOS)达到3.95,对比两阶段建模方法DiffSinger+HiFiGAN也有明显优势,证明了本文所提方法的有效性。
- 周骁胡亚军潘嘉胡国平凌震华
- 关键词:神经网络
- 基于短时谱一致性的神经网络声码器训练方法
- 本发明公开了一种基于短时谱一致性的神经网络声码器训练方法,包括:使用自然声学特征和自然对数幅度谱训练幅度谱预测器,使用自然对数幅度谱、自然基频和自然波形训练相位谱预测器;将训练后的幅度谱预测器和相位谱预测器进行连接,通过...
- 艾杨凌震华
- 文献传递
- 基于韵律发音解耦的元学习多语种语音合成模型及方法
- 本发明公开一种基于韵律发音解耦的元学习多语种语音合成模型及方法,属语音合成领域,该模型包括:由发音编码器、发音流参数生成器和发音解码器组成的发音流声学子模型;由韵律编码器、韵律流参数生成器和韵律解码器组成的韵律流声学子模...
- 彭宇坤凌震华
- 一种基于受限玻尔兹曼机的语音合成方法
- 本发明公开了一种基于受限玻尔兹曼机的语音合成方法。使用自适应加权谱内插STRAIGHT合成器提取的频谱包络取代高层频谱特征用于频谱建模;利用训练得到的Gaussian-HMM模型对训练数据库中的声学特征序列进行状态切分;...
- 凌震华陈凌辉戴礼荣
- 文献传递
- 一种计算节点的空间分配方法及装置
- 本发明实施例公开了一种计算节点的空间分配方法及装置,对神经网络的各个计算节点进行分类,得到多个的计算形状节点和多个的计算张量节点;将与每个计算张量节点相关的计算形状节点融合成一个新节点;将待推理数据输入神经网络;根据计算...
- 姚文军张海俊汪锦想 陈旭凌震华
- 构建个性化歌唱风格频谱合成模型的方法及装置
- 本发明公开了一种构建个性化歌唱风格频谱合成模型的方法及装置,该方法包括:训练源发音人朗读风格频谱合成模型和歌唱风格频谱合成模型;获取目标发音人朗读风格数据;根据所述源发音人朗读风格频谱合成模型及所述目标发音人朗读风格数据...
- 孙见青王影江源凌震华胡国平胡郁
- 一种四层负载均衡的数据处理方法及相关装置
- 本申请公开了一种四层负载均衡的数据处理方法及相关装置,可用于计算机技术领域。该方法中,首先,接收访问端发送的数据包,然后,基于数据包携带的信息从多个网卡接收队列中确定用于接收数据包的第一网卡接收队列;接着,通过第一网卡接...
- 张致江张浩凌震华
- 表格识别方法及装置、存储介质及电子设备
- 本发明提供了一种表格识别方法及装置、存储介质及电子设备,该方法包括:对待识别的表格图像进行表格元素检测,获得单元格图像和线条图像;对单元格图像进行处理,以获得表格区域;在线条图像中,确定表格区域对应的表格线条图像,并经细...
- 胡金水李立夫刘驰凌震华
- 基于话者无关模型的说话人转换方法
- 2013年
- 提出一种基于话者无关模型的说话人转换方法.考虑到音素信息共同存在于所有说话人的语音中,假设存在一个可以用高斯混合模型来描述的话者无关空间,且可用分段线性变换来描述该空间到各说话人相关空间之间的映射关系.在一个多说话人的数据库上,用话者自适应训练算法来训练模型,并在转换阶段使用源目标说话人空间到话者无关空间的变换关系来构造源与目标之间的特征变换关系,快速、灵活的构造说话人转换系统.通过主观测听实验来验证该算法相对于传统的基于话者相关模型方法的优点.
- 陈凌辉凌震华戴礼荣
- 关键词:说话人转换高斯混合模型
- 基于动态剪枝束宽预测的语音识别效率优化方法
- 本发明公开了一种基于动态剪枝束宽预测的语音识别效率优化方法,该方法针对传统语音解码剪枝算法中存在较多冗余路径,以及已有改进算法中剪枝有效性不足问题,提出基于声学特征进行动态剪枝束宽的预测思路,并根据实现复杂度的不同,提出...
- 刘俊华凌震华戴礼荣
- 文献传递