语音驱动虚拟说话人的自然头动生成

Journal of Tsinghua University(Science and Technology)(2013)

引用 2|浏览31
暂无评分
摘要
从语音信号预测伴随头动时,基于隐Markov模型(hidden Markov model,HMM)的头动合成方法的效果依赖于头动模式的划分和头动模式的正确识别.该文尝试了不同头动模式划分方法的头动合成效果.由于语音和头动之间是非确定性的多对多的映射关系,很难用固定的类别描述清楚,因此该类方法的头动模式识别率不高,头动合成效果受限.该文尝试采用逆传播(back-propagation,BP)神经网络的非线性回归方法,通过学习语音与头动之间的映射关系,实现语音信号到头动参数之间的直接连续映射,避免了HMM方法中头动模式不明确、头动模式识别错误带来的负面影响.实验表明,基于BP神经网络的回归方法有效地提高了语音到头动预测的准确度和头动合成的自然度.
更多
查看译文
关键词
Head motion generation,Hidden Markov model,Neural network,Talking avatar,Talking head
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要