Page 17 - 理化检验-化学分册2025年第三期
P. 17
苏涵君,等:基于可见-近红外光谱技术快速检测水质酸度
因此在建立模型前,采用合适的特征波长优选方法, 结合PLS建立水质酸度预测模型。
2
对光谱数据进行变量筛选是光谱分析中不可或缺的 将校正集决定系数(R c )、预测集决定系数(R p )、
2
关键步骤。本工作采用SPA和CARS两种方法对水 RMSECV、预测均方根误差(RMSEP)和RPD作为
质样本酸度的光谱数据进行特征波长的筛选,并对 模型预测精度评价指标。均方根误差越低,决定系
比其建模的计算速率和精度。 数越接近1,表明预测值与真实值之间的相关程度
SPA是光谱分析中一种常用的正向变量选择方 越好,所建PLS模型的预测能力越强,预测精度就
法 [19] 。该方法是一种确定性算法,具有很好的重复 越高。RPD是真实值的标准偏差与RMSEP的比
性,可通过逐次投影运算筛选波长变量并构建预测 值,RPD也会影响模型的性能:当RPD小于1. 4时,
模型,进而根据均方根误差最小原则获得最优特征 表明所建模型不可靠,不能实际运用;当RPD为
波长组合。CARS是一种蒙特卡洛随机采样与PLS 1. 4~2. 0时,表明所建模型较为可靠;当RPD大于
回归系数相结合的特征波长选择方法,该方法利用 2. 0时,表明所建模型具备较高的可靠性,能够实际
指数衰减函数和自适应重加权采样,经过n次采样 运用于定量分析。
后,选择交叉验证均方根误差(RMSECV)最小的
波长子集 [20] 。CARS运用了达尔文进化论中的适者 2 结果与讨论
生存原理,选择特征波长的最优组合,并结合PLS 2. 1 不同样本集划分的模型效果
回归 [21] 。 试验将 60 个样本按 2∶1 的比例分成校正集和
1. 7 模型的建立与评价 预测集,即分别有40个样本 (占总样本的2/3)构成
为消除原始光谱中可能存在的高频随机噪声、 校正集,20 个样本 (占总样本的1/3)构成预测集。
光散射等因素的影响,采用S-G卷积平滑、SNV等 以光谱数据为X变量,强度为Y变量,同时计算样
多种方法对原始光谱数据进行预处理并对比;为提 本间距离,以确保最大限度地表征样本分布。由此
升预测模型的建模速率和精度,采用SPA和CARS 可以得出不同样本集划分方法下的pH统计结果,见
两种特征波长优选方法对全光谱进行变量筛选对比; 表1。
表1 不同样本集划分方法下的pH统计结果
Tab. 1 Statistical results of pH values by different sample set partition methods
校正集 预测集
划分方法
样本数量 pH最大值 pH最小值 pH平均值 标准偏差 样本数量 pH最大值 pH最小值 pH平均值 标准偏差
K-S算法 40 12. 22 2. 71 7. 564 0 2. 523 2 20 10. 28 2. 88 5. 560 5 2. 083 8
SPXY算法 40 12. 22 2. 71 7. 307 0 2. 422 4 20 10. 09 2. 98 6. 074 5 2. 667 6
由表 1 可知:使用K-S算法进行样本集划分 2. 2 不同酸度样本的原始光谱及预处理光谱
后,校正集和预测集的标准偏差分别为 2. 523 2和 图1(a)为不同 pH 水质样本的原始光谱图,可
2. 083 8。而使用SPXY算法进行样本集划分后,校 以看出,原始光谱数据量较大,其光谱共线性严重。
正集和预测集的标准偏差分别为2. 422 4和2. 667 6, 图 1(b)为 3 个代表样本 (pH 10. 34,pH 4. 10,pH
并且校正集与预测集的标准偏差和pH平均值更为 7. 14)的光谱图,可以看出,由于样本的pH存在差
接近,这说明样本集划分合理,所得数据更具有代表 异,相应的光谱强度值也存在差异。此外,从原始光
性,有利于建立更加稳定、可靠、鲁棒性更好的定量 谱强度数据中不能直接观测到特征峰。由于光谱采
分析模型。因此,试验采用SPXY算法对样本集进 集过程中会受到随机噪声、光散射等因素影响,因此
行划分。 需要对原始光谱数据进行预处理。
使用SPXY算法划分样本集后建立的PLS预测 试验采用S-G卷积平滑、SNV、1D、2D、OSC等
模型结果显示, R c 和R p 分别为0. 970 3和0. 923 7, 5种方法对原始光谱数据进行预处理,不同方法预处
2
2
RMSECV和RMSEP分别为0. 412 4和0. 718 2,RPD 理后的光谱图如图2所示。
为3. 372 9,说明使用SPXY算法进行样本集划分后 由图 2(a)和图 2(b)中 700 nm附近局部谱图
建立的PLS模型有着较好的预测精度,这为后续工 可知,经SNV预处理后的谱图与经S-G卷积平滑预
作提供了有效的支撑。 处理后的谱图相比,前者质量相对较好,并降低了光
• 251 •

