存在标签噪音的数据中基于低秩矩阵分解的多输出回归

LIU Zhigang, LIU Senze

Microelectronics & Computer(2022)

Cited 0|Views3
No score
Abstract
多输出回归是指针对一组输入变量来估计其对应的多个连续属性值,其在数据挖掘领域有着广泛的应用.当前关于多输出回归任务的研究都是基于标签值准确的假设下实现的.然而在实际情况中,数据集的部分标签可能并不准确,即部分标签存在一定的噪声.在这种情况下,传统多输出回归方法性能较差.为了解决上述情况下的多输出回归问题,利用大数据中数据样本大的特点来提炼各个标签间的相关性,从而利用标签间的相关矩阵重构标签.由于多输出问题中的标签个数通常较多,因此可以一定程度上稀释掉部分标签的噪声干扰.此外,利用低秩矩阵分解对上述思路建立数学优化问题,并在此基础上引入核技巧以提升模型的非线性拟合能力.最后,采用非凸近似的手段求解该优化问题,从而保证了多输出回归模型的预测性能.实验18个数据集上同现有的6种多输出回归方法进行了比较,提出的方法在样本量较大的场景下性能优势较为明显.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined