共有回帖数 0 个
-

EpR(Excitation plus Resonance)是一个用于构建语音频谱形状的模型。于2001年由庞培法布拉大学Music Technology Group与Yamaha Advanced System Development Center合作发表。在Vocaloid系列歌声合成软件中被用来处理音渡、改变语音特性。
这篇帖子与其说是教程,不如说是讨论。因为我也有一些问题要问。写此帖目的有三:
1. 混精
2. 我正考虑用EpR代替CVE3中使用的LCFESOLA,向其他开发者介绍这种算法(似乎网上除了少数几篇论文找不到其他介绍了)。
3. 探讨如何对EpR作改进。
我会先根据我的理解(有错误请指正),写一个EpR的教程,并附上一个octave、C++混编实现的EpR滤波器。
然后提出一些问题和论文中没有提及的研究方向。
参考文献:
Bonada, Jordi, et al. "Singing voice synthesis combining excitation plus resonance and sinusoidal plus residual models." Proceedings of International Computer Music Conference. 2001.
Sanjaume, Jordi Bonada. Voice processing and synthesis by performance sampling and spectral models. Diss. Universitat Pompeu Fabra, 2008.
Serra, X. 1989. "A System for Sound Analysis/Transformation/Synthesis based on a Deterministic plus Stochastic Decomposition" Ph.D. Thesis. Stanford University.
以上都可以在UPF网站上下载到:
http://mtg.upf.edu/node/219
http://mtg.upf.edu/node/1231
http://mtg.upf.edu/node/304
话说MTG真是厉害……这么多关键技术都是他们搞出来的。
此坑大概要拖一段时间,先把帖子开在这,有空就写。
楼主 2015-10-23 13:51 回复
Copyright © 2010~2015 直线网 版权所有,All Rights Reserved.沪ICP备10039589号
意见反馈 |
关于直线 |
版权声明 |
会员须知