穿山甲色谱指纹谱的建立及其在基源鉴别和质量(2)
相似度评价是指纹谱分析的基本手段,其中余弦相似度是常用相似度之一,具体计算见式(1)[20]:
其中,A为样本指纹谱峰面积构成的向量,S为对照指纹谱各峰面积构成的向量。余弦相似度反映的是样品化学成分与对照指纹图谱化学成分在分布比例上的相似程度,其特点是峰面积越大峰计算权重越大,易对小峰造成掩蔽作用,更适用于大类别样品的区分。
为了消除大峰对小峰的掩蔽作用,可先对样本进行归一化处理,再进行相似度计算,所得相似度为比率定性相似度[15],此方法更适用于小类别样品的区分,具体计算见式(2)[15]:
其中Ai为样本指纹谱峰面积构成的向量的第i个分量,n为样本峰个数,Si为对照指纹谱峰面积构成的向量的第i个分量。
考虑到穿山甲的等级区分相比于种属鉴别属于小类别区分,小峰的差异同样重要,本文统一采用比率定性相似度作为评价标准。
1.4.2判别分析
判别分析又称“分辨法”,是在分类确定的条件下,根据研究对象的特征值判别其类型归属问题的一种多变量统计分析方法,通过参数调整及模型训练,可使样品判错率达到最小。支持向量机(support vector machine, SVM)是一种常用判别分析模型,其利用支持向量对样本进行学习并处理未知样品,实现经验风险和置信范围的最小化,有良好的统计规律和泛化能力,数学表述见式(3)和(4)[21]。
其中为每一次迭代对于样本i设定的约束条件,xi为样本i的峰面积数据构成的向量,yi为样本标签(即统货或一等品),w*为每一次迭代计算得出的特征矩阵,xj为支持向量样本j的峰面积数据构成的向量,yi为支持向量样本j标签(即统货或一等品),b*为每一次迭代计算得出的常数向量。最终迭代结果使支持向量样本j满足式(5)[21]:
对于非线性、高维度数据,核函数引入的支持向量机可以很大程度上克服“维数灾难”的问题,具有独特的优势[22]。其中,sigmoid感知核为一种常用核函数,其数学表达式见式(6)[21]:
其中,x为样本峰面积构成的数据矩阵。
本文中使用python 3.7作为编程语言,借用scikit-learn 0.22.1编写以sigmoid为核函数的核支持向量机模型,正则化参数设为10,使用十折交叉验证对模型进行验证并可视化预测结果。
2 结果与讨论
2.1 方法优化
2.1.1提取条件的考察
穿山甲的主要成分为角蛋白,高温、高酸条件下蛋白质容易发生水解,产生质量不一的肽段,本文分别对穿山甲的提取溶剂、提取方式和提取时间进行考察。分别以水、0.2 mol/L HCl、0.5 mol/L HCl、1 mol/L HCl为提取剂,加热回流1 h,前3种条件下的提取效果基本一致,当HCl浓度达到1 mol/L时,提取效果明显改善,可以获取更多的指纹信息(见图1a)。提取方式考察结果表明,超声提取到的物质明显减少(见图1b),因此采用加热回流提取法。当提取时间缩短为0.5 h时,提取效果下降(见图1c)。
图 1不同(a)提取溶剂、(b)提取方式、(c)提取时间下的穿山甲色谱图Fig. 1Chromatograms ofSquamaManisunder different (a) extraction solvent, (b) extraction mode, and (c) extraction timeColumn: Symmetry 300 C18 (150 mm×4.6 mm, 5 μm). Mobile phase A: 0.1% (v/v) trifluoroacetic acid (TFA) in water, mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient elution: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
2.1.2色谱条件的考察
为了获得最佳的分离体系和分离条件,我们分别对色谱柱、流动相体系、检测波长和流动相梯度条件进行了考察。
首先考察Unitrary C4 300 (150 mm×4.6 mm, 5 μm,华谱科仪(北京)科技有限公司)、Symmetry 300 C4 (150 mm×4.6 mm, 5 μm,沃特世科技(上海)有限公司)和Symmetry 300 C18 3种类型色谱柱对穿山甲供试液的分离能力,结果表明,穿山甲供试液在Symmetry 300 C18色谱柱上具有更好的选择性和色谱峰形(见图2)。
图 2不同色谱柱上的穿山甲色谱图Fig. 2Chromatograms ofSquamaManison different columnsMobile phase A: 0.1% (v/v) TFA in water; mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient condition: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
在Symmetry 300 C18色谱柱上考察不同的流动相体系,包括三氟乙酸-乙腈-水、磷酸二氢钠/高氯酸钠(pH 4)-乙腈-水、磷酸二氢钠/高氯酸钠(pH 6)-乙腈-水,结果表明三氟乙酸-乙腈-水体系下的分离效果最佳。
对比230、254、280、300 nm下的色谱图,结果表明280 nm波长下色谱峰响应普遍更高,故选其为检测波长。
为了进一步改善分离效果,对流动相梯度进行了考察,不同梯度下的色谱分离结果见图3。综合考虑主要色谱峰(6~30 min)的分辨率、分离度和保留时间,条件c为最佳梯度条件。
文章来源:《中药药理与临床》 网址: http://www.zyylylc.cn/qikandaodu/2021/0708/648.html