基于偏最小二乘法的近红外光谱定量分析模型预测蛹虫草中腺苷含量
佚名 2010-09-01
作者:李晓光,关泽华,田鸿儒,胡长峰, 孟庆繁
【摘要】 目的采用偏最小二乘法(PLS)建立测定蛹虫草中腺苷含量的近红外光谱定量分析模型。方法应用光谱预处理方法分别对蛹虫草样品的近红外光谱进行预处理,并采用预处理后的光谱分别建立定量分析模型。结果经过比较各个模型的内部交互验证均方根误差(RMSECV)和交互验证预测值与真实值间的相关系数(Rv),外部均方根误差(RMSEP),选取最优的模型,其RMSECV、Rv和RMSEP分别为0.737 6,0.904 9和0.541 0。结论近红外光谱在中药有效成分定量分析方面有很大的应用前景。
【关键词】 近红外光谱 偏最小二乘法 蛹虫草 腺苷
蛹虫草Cordyceps militaris(L.ex Fr.)Link又名北冬虫夏草、北虫草等[1], 与冬虫夏草同属异种,是虫草属的模式种,属于子囊菌亚门虫草属,是蛹虫草寄生在昆虫纲鳞翅目夜蛾科昆虫蛹体上所长出的子座与僵死蛹体的复合体。作为一种具有多种药理功能、抗癌活性的药用真菌蛹虫草[2],随着人们逐渐发现和认识蛹虫草的滋补疗效和提高人体免疫功能的功效,它的开发利用备受世人的极大关注。腺苷是合成三磷酸腺苷(ATP) 的主要原料,ATP 已被广泛应用于治疗心脏功能不全、脑动脉硬化及肌肉萎缩等症。现行常用的腺苷测定方法主要是高效液相法,该方法具有材料损耗大,测定过程复杂,化学试剂消耗量大且分析时间长等缺点。 随着光谱学和计算机的发展,近红外光谱分析技术也得到飞快发展。近红外光谱技术在建立可靠的校正模型的基础上,可直接对样品进行无损检测,具有分析速度快、效率高、成本低和实现在线检测等优点,近年来在农业、化工、食品、药物分析等方面有着广泛应用[3,4],在中药材的分类和活性成分分析中还处于起步阶段。偏最小二乘法(Partial Least Square, PLS)是目前化学计量学中最有效的分析方法之一。它从自变量矩阵和因变量矩阵中提取偏最小二成分,有效地降维,并消除自变量间可能存在的复共线关系,明显改善数据结果的可靠性和准确度[5,6]。 本文应用近红外光谱法结合PLS(NIR-PLS)建立蛹虫草中腺苷含量的定量分析模型,并用所建模型对预测集样品进行预测,得到较好的结果,该方法有望成为一种代替现行真菌活性成分测定的快速绿色分析方法。
1.1 材料、试剂与设1 材料与方法备
蛹虫草(CGMCC 5.699),购于中国科学院微生物研究所; 甲醇(色谱纯),葡萄糖,磷酸二氢钾,硫酸镁,维生素B1,磷酸氢二钠,磷酸二氢钠,均为分析纯。日本岛津UV-3150型紫外可见近红外分光光度计,日本岛津ISR-3100积分球附件,联想家悦E3030微型计算机,真空冻干机,德国Eppendorf 5810R型高速冷冻离心机,日本岛津LC-10AT高效液相色谱仪。
1.2 样品光谱的测定
通过化学诱变法获得478株诱变蛹虫草菌株,分别通过液体深层发酵获得不蛹虫草菌丝体,冻干粉碎过60目筛,制备蛹虫粉备用;应用积分球,光谱通带宽度为12 nm,扫描波长范围800~2 500 nm,每个样品进行近红外光谱扫描3次,取平均值作为该样品的近红外光谱。
1.3 蛹虫草腺苷含量的测定
1.3.1 菌丝体腺苷的提取方法
准确称取0.10 g经预处理后的菌丝体,加蒸馏水在恒温水浴锅内浸提一定的时间。8 000 r/ min,离心10 min,分离上清液用于腺苷含量测定。
1.3.2 腺苷含量的测定方法
根据2005版《中国药典》,利用高效液相色谱法测定腺苷的含量[7]。 流动相为pH 6.5的磷酸盐缓冲液∶甲醇(体积比)=85∶15。HPLC的测定条件为色谱柱:C-18,流速:1 ml/min,检测波长:260 nm,柱温:35℃,进样量:20 μl。
1.3.3 菌丝体腺苷得率的计算
腺苷得率(W/W)=腺苷质量(mg)/菌丝体质量(g)
1.4 建模标准
将样品分为校正集和预测集,校正集样品用于建立校正模型,采用交互验证的方法检验模型的内部稳健性和拟合效果,其评价参数为交互验证均方根误差(RMSECV)和交互验证预测值与真实值间的相关系数(Rv),采用预测集检验模型的预测能力,防止模型过拟合,其评价参数为预测均方根误差(RMSEP),RMSECV和RMSEP的计算方法参如下: RMSE=ni=1(CNIRi-CREFi)n 对于RMSECV,CNIRi为校正集中各组分含量的交互验证预测值,CREFi为校正集中各组分含量的HPLC测定值,对于RMSEP,CNIRi为模型对预测集样品中各组分含量预测值,CREFi为预测集中各组分含量的HPLC测定值。
2 结果与讨论
2.1 校正集与预测集的选择
本实验以367个校正集和111个预测集样品的光谱数据在第一主成分(PC1)和第二主成分(PC2)上的得分分布见图 1。由图 1可以看出预测集样品较均匀地分布于校正集样品之中。校正集样品中HPLC法测定的腺苷含量的值最大值为6.268 mg/g,最小值为0.268 mg/g,平均值为2.783 mg/g;而预测集样品中HPLC法测定的腺苷含量的值最大值为6.172 mg/g,最小值为0.399 mg/g,平均值为2.924 mg/g。
2.2 光谱预处理方法的选择
分别采用FFT、卷积平滑、一阶导数、二阶导数和小波变换对蛹虫草菌丝体样品的NIR光谱进行预处理,分别采用预处理后的光谱,在全光谱区域下建立定量分析模型,每个模型经过内部交互验证和外部预测集的验证,结果如见表1。表1 不同预处理方法处理后的光谱所建立的定量分析模型的分析结果(略) 通过对表 1分析可知,从模型的稳定性和拟合度角度来考察,原始光谱和在db2函数下尺度为5小波变换处理后的光谱所建立的PLS定量分析模型较好,其RMSECV分别为0.667 5和0.670 7,RP分别为0.906 8和0.904 9。但从模型的预测能力考查,移动窗口为20的一阶导数处理后的光谱所建立的PLS模型预测能力最强,RMSEP为0.541 0,明显低于其他模型。而该模型的稳定性和拟合度与原始光谱和小波变换处理后光谱所建立模型相比,没有明显差距。因此本实验选取一阶导数为最佳预处理方法。
2.3 最适主因子数的选择
使用PLS方法建立定量校正模型时,主因子数的选择直接关系到模型的实际预测能力。若建立模型时使用的主因子数过少,不能充分反映样品被测组分产生的光谱信息,导致不充分拟合;若使用主因子数过多则会将一些包含了噪音的信息也掺入计算,就会导致过拟合,从而降低模型的预测能力。本实验采用留一交互验证法,考察主因子数对PRESS与RMSECV的影响,当PRESS与RMSECV均最小的时候,所选的主因子数最适。由图2知,测定蛹虫草菌丝体中腺苷的PLS定量分析模型的最适主因子数为9。
2.4 最优模型的内部交互验证
采用最优的条件,建立测定蛹虫草样品中腺苷含量的最优模型,对最优模型进行内部交互验证,结果见图3所示,腺苷含量的交互验证预测值与实验测定值间的相关系数(Rv)为0.904 9,说明模型的拟合效果较好。
2.5 样品腺苷含量的预测
采用最优PLS定量分析模型对校正集样品和预测集样品中腺苷含量进行预测,预测值与HPLC测量值间的相关图如图 4所示。由图 4可以看出,预测值与真实HPLC法测定值相吻合的很好,预测集样品的腺苷含量的预测值与HPLC方法测定值的相关系数(Rp)为0.938 1。
2.5 样品腺苷含量的预测
采用最优PLS定量分析模型对校正集样品和预测集样品中腺苷含量进行预测,预测值与HPLC测量值间的相关图如图 4所示。由图 4可以看出,预测值与真实HPLC法测定值相吻合的很好,预测集样品的腺苷含量的预测值与HPLC方法测定值的相关系数(Rp)为0.938 1。
3 讨论 本文应用PLS方法结合NIR光谱建立了测定蛹虫草中腺苷含量的定量分析模型,模型经过校正集样品的内部的交互验证和预测集对模型预测能力的检验,选择最适的主因子数,得到最优的PLS定量分析模型,其RMSECV、Rv和RMSEP值分别为0.737 4,0.904 9,0.541 0。该模型具有较好的稳健性、拟合度和较高的预测精度,且方便快捷、无污染、无破坏性,能够实现在线检测,可在中药有效成分检测方面推广应用。