软件缺陷预测模型超参数的稳健优化方法

Journal of Shanxi University(Natural Science Edition)（2021）

引用 0|浏览0

暂无评分

摘要

高性能的软件缺陷预测模型可为软件自动化测试奠定重要的基础.当前的软件缺陷预测模型主要采用机器学习分类算法进行构建.其中,基于集成学习的软件缺陷预测模型通常可以达到当前最优的性能.然而,基于集成学习的软件缺陷预测模型的性能受到分类器的超参数取值的明显影响.因此,如何优化基分类器中的超参数,是提升基于集成学习的软件缺陷预测模型性能的主要问题之一.为此,文章利用稳健设计中的望大特性信噪比,提出了一种基于稳健设计的超参数优化方法.该方法在优化模型性能的同时,还提升了模型性能的稳定性.本文采用支持向量机作为基分类器,采用块正则化m×2交叉验证方法的随机下采样算法来构建集成学习的软件缺陷预测模型.本文在跨版本缺陷预测(CVDP)的16个数据集和跨项目缺陷预测(CPDP)的22个数据集上验证了超参数优化方法的效果.结果表明(1)基于稳健设计的超参数优化方法可以提高软件缺陷预测模型的预测性能.在CVDP任务上,F1值的平均值可以提升1.2％;在CPDP任务上,F1值的平均值可以提升4.1％.(2)基于稳健设计的超参数优化方法可以提高软件缺陷预测模型的稳定性.在CVDP任务上,F1值的置信区间的平均长度可以缩减3.5％;在CPDP任务上,F1值的置信区间的平均长度可以缩减2.6％.这表明,基于稳健设计的超参数优化方法是有效的.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要