融合矩阵分解和代价敏感的微生物数据扩增算法

Journal of Data Acquisition & Processing(2023)

引用 0|浏览2
暂无评分
摘要
微生物会对人类健康产生直接影响,对相关数据的分析有助于疾病诊断.然而,采集到的数据存在类不平衡与高稀疏性两个问题.现有的过采样方法在一定程度上可缓解数据的类不平衡,但是难以应对微生物数据的高稀疏性.本文提出了一种融合矩阵分解和代价敏感的数据扩增算法,其包含3个技术.首先,将原始矩阵分解为样本子空间和特征子空间;其次,利用样本子空间的正向量及其近邻向量生成合成向量;最后,根据合成向量与所有负向量的距离对其过滤.实验在8个微生物数据集上进行,同时与5种过采样算法对比,结果表明本文所提算法能够增强正样本的多样性,在识别出更多正样本的同时,分类结果的代价更低.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要