一种改进的半监督集成软件缺陷预测方法

Journal of Chinese Computer Systems(2021)

引用 1|浏览5
暂无评分
摘要
针对半监督软件缺陷预测中的类不平衡以及特征中含有过多无关特征和冗余特征的问题,提出一种改进的半监督集成软件缺陷预测方法FeSSTri(semi-supervised software prediction using Feature Selecting and Sample and Tri-training).首先使用ADASYN自适应综合过采样算法对部分标记样本进行采样,来解决数据集类不平衡问题;其次利用采样后的数据构建分类器,给未标记数据做预标记,将标记样本与预标记样本结合,使用最小冗余最大相关mRMR算法对数据集进行特征选择,解决无关特征过多和特征冗余问题,最后使用半监督集成算法Tri-training构建最终的半监督缺陷预测模型.本文在NASA数据集和AEEEM数据集上以F1值为评测指标对提出的模型进行了验证.实验结果表明:FeSSTri方法要优于初始的Tri-training算法,并且与经典的机器学习方法相比,FeSSTri方法均可以取得更好的预测结果.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要