基本信息
浏览量:408
![](https://originalfileserver.aminer.cn/sys/aminer/icon/show-trajectory.png)
个人简介
针对对话语音的动态情感变化,研究提出多尺度融合的情感检测方法。针对真实环境的语音情感识别,研究提出了一种多特征多分类器的决策级别融合的语音情感识别框架。从时间多尺度和空间多尺度的不同角度,研究音频信号时间序列的结构信息提取与建模,基于层次化认知机制,提出了一种基于注意力机制融合多尺度上下文信息的动态维度情感识别算法。以长短时记忆模型LSTM为基础,融合深度神经网络和注意力机制,把多尺度信息的融合过程与不同尺度下的上下文建模过程整合到一个算法框架中,对上下文信息和结构信息的建模过程进行联合优化,实现对维度动态情感建模与识别。
跨媒体情感计算方面,聚焦跨媒体数据的认知表征与语义描述之间的关联关系,提出了一种基于异构熵的跨媒体非监督特征学习算法,融合文本、图片、网络行为等跨媒体数据,用于预测社交用户的情感风格(性格)。
在鲁棒说话人识别研究方面,聚焦因信道差异、情感状态变化以及发音方式不同等因素引起的训练与识别的不匹配,研究开发了一个多种发音方式的说话人识别语音库,提出基于群集的说话人模型合成方法,提出情感属性投影算法来提高说话人识别对情感变化的鲁棒性。
跨媒体情感计算方面,聚焦跨媒体数据的认知表征与语义描述之间的关联关系,提出了一种基于异构熵的跨媒体非监督特征学习算法,融合文本、图片、网络行为等跨媒体数据,用于预测社交用户的情感风格(性格)。
在鲁棒说话人识别研究方面,聚焦因信道差异、情感状态变化以及发音方式不同等因素引起的训练与识别的不匹配,研究开发了一个多种发音方式的说话人识别语音库,提出基于群集的说话人模型合成方法,提出情感属性投影算法来提高说话人识别对情感变化的鲁棒性。
研究兴趣
论文共 130 篇作者统计合作学者相似作者
按年份排序按引用量排序主题筛选期刊级别筛选合作者筛选合作机构筛选
时间
引用量
主题
期刊级别
合作者
合作机构
arxiv(2024)
引用0浏览0引用
0
0
Advances in Computer Vision and Pattern Recognitionpp.387-419, (2023)
ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (2023): 12426-12430
arXiv (Cornell University) (2022)
PROCEEDINGS OF 2022 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC)pp.911-916, (2022)
加载更多
作者统计
合作学者
合作机构
D-Core
- 合作者
- 学生
- 导师
数据免责声明
页面数据均来自互联网公开来源、合作出版商和通过AI技术自动分析结果,我们不对页面数据的有效性、准确性、正确性、可靠性、完整性和及时性做出任何承诺和保证。若有疑问,可以通过电子邮件方式联系我们:report@aminer.cn