- 标题
- 摘要
- 关键词
- 实验方案
- 产品
-
[IEEE 2019年第八届可再生能源研究与应用国际会议(ICRERA) - 罗马尼亚布拉索夫(2019.11.3-2019.11.6)] 2019年第八届可再生能源研究与应用国际会议(ICRERA) - 传统铁路引入光伏发电系统研究
摘要: 本文提出一种利用近期提出的概率模型——循环时序受限玻尔兹曼机(RTRBM)的语音转换(VC)方法。每个说话人对应一个RTRBM,旨在捕捉声学序列中的高阶时序依赖关系。我们的算法首先使用说话人相关训练数据分别训练源说话人和目标说话人的RTRBM。由于每个RTRBM都试图发现能最大程度表达每个时间步训练数据及其时序依赖关系的抽象特征,我们预期这些模型能在高阶空间中表征与语言相关的潜在特征。本方法通过神经网络(NN)将源说话人的重音特征转换(匹配)为目标说话人的相应特征,从而使整个网络(由两个RTRBM和NN组成)作为深度循环神经网络进行微调。通过语音转换实验,我们证实本方法相比基于高斯混合模型和神经网络等传统VC方法具有优异性能,尤其在客观指标方面表现突出。
关键词: 循环时间受限玻尔兹曼机(RTRBM)、语音转换、说话人特征、循环神经网络、深度学习
更新于2025-09-23 15:19:57
-
[IEEE 2019研究、发明与创新大会(RI2C) - 泰国曼谷(2019.12.11-2019.12.13)] 2019研究、发明与创新大会(RI2C) - 基于交错式零电流导通E类整流器的单级高功率因数LED驱动器
摘要: 本文提出一种利用新近提出的概率模型——循环时序受限玻尔兹曼机(RTRBM)的语音转换(VC)方法。每个说话人对应一个RTRBM,旨在捕捉声学序列中的高阶时序依赖关系。我们的算法首先使用说话人相关训练数据分别训练源说话人和目标说话人的RTRBM。由于每个RTRBM都试图发现能最大程度表达每个时间步训练数据及其时序依赖关系的抽象特征,我们预期这些模型能在高阶空间中表征与语言相关的潜在特征。本方法通过神经网络(NN)将源说话人的重音特征转换(匹配)为目标说话人的对应特征,使整个网络(由两个RTRBM和NN组成)作为深度循环神经网络进行微调。通过语音转换实验,我们证实本方法性能优异——尤其在客观指标方面,相比基于高斯混合模型和神经网络等传统VC方法具有显著优势。
关键词: 循环时间受限玻尔兹曼机(RTRBM)、说话人特征、语音转换、深度学习、循环神经网络
更新于2025-09-19 17:13:59
-
[2019年IEEE光子学与电磁学研究秋季研讨会(PIERS-Fall)- 中国厦门(2019.12.17-2019.12.20)] 2019年光子学与电磁学研究秋季研讨会(PIERS-Fall)- 用于SPICE仿真的太赫兹量子级联激光器改进等效电路模型
摘要: 本文提出一种利用新近提出的概率模型——循环时序受限玻尔兹曼机(RTRBM)的语音转换(VC)方法。每个说话人对应一个RTRBM,旨在捕捉声学序列中的高阶时序依赖性。我们的算法首先使用说话人相关训练数据分别训练源说话人和目标说话人的RTRBM。由于每个RTRBM都试图发现能最大程度表达各时间步训练数据及其时序依赖性的抽象特征,我们预期这些模型能在高阶空间表征语言相关的潜在特征。本方法通过神经网络(NN)将源说话人的重音特征转换(匹配)为目标说话人特征,使整个网络(由两个RTRBM和NN构成)作为深度循环神经网络进行微调。通过语音转换实验,我们证实本方法(尤其是客观指标方面)相比基于高斯混合模型和神经网络的传统语音转换方法具有更优性能。
关键词: 循环时间受限玻尔兹曼机(RTRBM)、循环神经网络、语音转换、说话人特征、深度学习
更新于2025-09-19 17:13:59