基于高光谱成像技术和主成分分析对粉葛年限的鉴别

Spectroscopy and Spectral Analysis(2023)

引用 0|浏览6
暂无评分
摘要
粉葛是一种药食两用的植物,含葛根素、淀粉、纤维素、维生素等,具有极高的药用和食用价值.相关研究表明粉葛中化学成分的含量与其生长年限密切相关.目前对粉葛年限鉴别主要依靠传统的理化技术,其操作周期长,破坏样品的完整性,无法快速批量检测.高光谱成像技术(HIS)的发展为粉葛年限的快速、无损鉴定提供了新思路.为了避免因生长年限不足而导致粉葛质量问题,采用高光谱成像技术结合机器学习对其年限进行鉴别.然而高光谱图像数据存在冗余性,所含数据量巨大,且波段之间高度相关,容易对后续的分类效果产生影响.采用主成分分析法(PCA)对高光谱数据进行特征提取,并基于全波段和 PCA降维后的数据建立了支持向量机(SVM)、逻辑回归(LR)、多层感知机(MLP)、随机森林(RF)四种分类模型,旨在实现对不同年限粉葛的精准鉴别.使用全波段数据建模时,四种不同的分类模型在不同镜头下测试集的精度分别为 78.09%、77.03%、81.43%、72.09%;93.11%、93.79%、94.23%、89.77%.其中 MLP 模型在 SN0605VNIR(VNIR)与 N3124SWIR(SWIR)镜头下均取得的了最好的效果.使用 PCA 降维后的数据建模时,四种不同的分类模型在两个镜头下的测试集精度分别为 96.12%、87.53%、95.02%、93.41%;99.26%、97.09%、99.16%、97.91%,其中 SVM模型在 VNIR和 SWIR镜头下均取得了最优的预测精度.结果表明,基于PCA构建的模型能优化数据质量,有效降低波段冗余,进一步提高模型分类性能.对模型参数进一步分析,探究了主成分占比对四种模型预测精度的影响.在VNIR镜头下,四种模型的测试集准确率达最高时,其主成分占比分别为 65%、75%、80%、45%;在 SWIR镜头下,四种模型的测试集准确率达最高时,其主成分所占比分别为 20%、60%、35%、30%.其中,PCA-SVM模型的综合效果最佳,在主成分所占比为 20%时达到了较高的预测精度(99.28%).研究结果表明,高光谱成像技术结合机器学习能够实现对粉葛年限的快速、无损、准确鉴别.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要