说话人确认中以音素为中心的特征端因子分析

Journal of Signal Processing(2016)

引用 0|浏览14
暂无评分
摘要
在说话人确认中,特征端因子分析(Acoustic Factor Analysis,AFA)利用MPPCA(Mixtures of Probabilistic Principal Component Analyzers,MPPCA)算法在通用背景模型(Universal Background Model,UBM)的每个高斯上分别对特征降维以去除语音特征中文本、信道和噪声等信息的干扰,获得增强的说话人信息并用于提升说话人确认的性能.但是通用背景模型属于无监督的聚类方法,其每个高斯成分物理意义不够明确,不能区分不同说话人发不同音素时的情况.为解决这一问题,本文利用语音识别中的声学模型深度神经网络(Deep Neural Network,DNN)取代传统的通用背景模型并结合特征端因子分析分别对不同音素上的语音特征进行降维提取出说话人信息,进而提取DNN i-vector用于说话人确认.在RSR2015数据库PartⅢ上的实验结果表明该方法相对于基于UBM的特征端因子分析方法在男女测试集上等错误率(Equal Error Rate,EER)分别下降13.49%和22.43%.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要