欢迎来到工作报告网!

关节软骨的红外光谱成像及支持向量机定量研究

企业自查报告 时间:2021-07-18 10:31:42


打开文本图片集

摘 要 傅里叶变换红外光谱成像(FTIRSI)技术可同时获得样本组织的显微结构信息和红外光谱信息,结合化学计量学算法可用于样品光谱信息的定量分析和组织判别的研究。基于此,本实验采用FTIRSI技术结合支持向量机分类(SVC),实现健康和病变关节软骨组织的判别,其识别率分别为100.0%和95.4%,准确率达到97.7%; 基于FTIRSI建立支持向量回归(SVR)模型定量研究关节软骨样本中胶原蛋白和蛋白多糖两种生物大分子的含量与分布,发现病变关节软骨中蛋白多糖的含量发生流失,尤其在表层区。研究结果表明,FTIRSI与支持向量机(SVM)相结合有望成为一种新型的骨关节炎诊断工具,对骨关节炎监测和诊断研究具有重要意义。

关键词 关节软骨; 骨关节炎; 傅里叶变换红外光谱成像; 支持向量机; 蛋白多糖; 胶原蛋白

1 引 言

关节軟骨是维持关节正常生理功能的重要组织之一,在关节运动时可与其周围组织(滑液、韧带以及骨小梁等)精确地相互作用,使关节的磨损度降到最小。健康关节软骨组织主要由软骨细胞和细胞外基质构成,表面光滑且有一定的弹性。细胞外基质的主要成分有胶原蛋白(Ⅱ型胶原)、蛋白多糖、水和无机盐,此外还有结构糖蛋白及少量脂肪等[1]。胶原蛋白和蛋白多糖作为基质的两种主要成分,胶原蛋白纤维排列成网络结构以维持软骨的结构和形状[2],蛋白多糖包埋于胶原纤维网络中,具有一定的抗压和分散负荷的能力[3]。关节软骨具有明显的板层状结构,大多分为表层区(Superficial zone, SZ)、过渡区(Transitional zone, TZ)、放射区(Radial zone, RZ)和钙化区(Calcified zone, CZ)。值得注意的是,不同区域的胶原蛋白和蛋白多糖的浓度、分布以及结构不同[4]。

若胶原纤维网络破坏或者蛋白多糖缺失,关节软骨的组织功能便开始退化,最终会导致骨关节炎(Osteoarthritis, OA)等关节疾病的发生。目前大多数OA患者表现出明显的临床症状时已经处于OA的中后期,难以进行有效的治疗,而OA早期的症状不明显,仅表现为软骨基质主成分浓度及细胞形态和活性的改变[5]。因此,采用常规的临床手段和实验手段[6~10]很难进行OA的早期诊断。

傅里叶变换红外光谱成像(Fourier transform infrared spectroscopic imaging, FTIRSI)技术将傅里叶变换红外光谱测量和微区成像技术有机结合起来,可同时采集样品的分子光谱和表面形貌信息,具有高精度、高灵敏度以及高空间分辨率等优点[11,12]。支持向量机(Support vector machine, SVM)由Vapnik等在1995年首次提出,是基于统计学习理论发展起来的一种模式识别方法,通过非线性映射将数据样本映射到高维特征空间,以寻求最小化结构风险,从而在这个空间获得良好的线性分类或回归结果[13]。从某种意义上讲,支持向量机分类(Support vector machine classification, SVC)和支持向量回归(Support vector regression, SVR)的本质是相同的。SVC是通过寻找最优分类超平面,让两个分类集合的支持向量或者所有的数据离分类平面最远; SVR是通过寻找最优回归平面,让一个集合的所有数据到该平面的距离最近。SVM相较于其它传统方法,它的分类和回归能力在解决小样本数、非线性以及高维数据空间等问题上有其独特的优势[14,15]。首先,通过寻求最小化结构风险,提高了回归模型的泛化能力,经验风险和置信范围最小化也因此得以实现,进而可以使小样本训练集有良好的回归预测结果; 其次,该算法可以转换成一个凸优化(二次规划)问题,理论上,得到的将是全局最优解,它通过引入核函数,既解决了样本分类过程中线性不可分问题,也解决了高维空间中的“维数灾难”等问题,从而避免了过拟合问题[16,17]。目前常用的核函数类型主要有以下4类:线性核函数(Linear kernel function, LF)、采用多项式形式的内积核函数(Polynomial kernel function, PF)、径向基核函数(Radial basis kernel function, RBF)以及Sigmoid核函数。支持向量机性能的优劣主要取决于核函数及其参数的选择,其中核函数的选择更为重要[18],但没有一种公式化的方法进行二者的选择,通常采用不断尝试的方式确定最优参数。

红外光谱技术结合SVM算法在诸多领域已得到广泛应用[19,20]。Cheng等[19]通过基于小波特征提取的傅里叶变换红外光谱和支持向量机相结合,将正常、发育异常、早期癌变以及晚期癌变进行分类,实现早期结肠癌的诊断检测。张录达等[20]用小麦样品蛋白质含量与其近红外光谱建立SVR模型,以此预测小麦样品中蛋白质的含量,预测结果与凯氏定氮法确定的结果平均误差小于0.32,并与偏最小二乘(PLS)回归模型的预测结果进行对比,表明所建SVR模型可与近红外光谱相结合用于实际样品的定量分析,且有较好的分析效果。本研究将傅里叶变换红外光谱技术与SVM算法相结合用于OA的研究,首先(SVC)对健康和2年病变的关节软骨样本进行判别分类研究,进而(SVR)研究两种主成分在两种样本中的定量分布和含量变化,为软骨的退化和修复过程研究提供实验依据。本方法有助于发展新型的OA诊断工具。

图2是健康和2年病变关节软骨组织的可见光图像,全吸收图像以及AmideⅡ、糖带的特征吸收图像。通过观察健康关节软骨AmideⅡ(图2C)以及糖带(图2D)的特征吸收图像,发现从软骨表层区到软骨下组织,胶原蛋白的含量分布不均匀,表层区高于深层区,而蛋白多糖恰相反,表层区含量明显少于深层区。根据以上的定性分析可知,关节软骨组织中胶原蛋白和蛋白多糖的含量随组织径向深度的增加呈不同的含量分布。

将健康和病变关节软骨的红外光谱图像进行对比分析发现,OA关节软骨组织中软骨细胞的数量减少,大小和形态也发生了变化,已不能将软骨细胞与周围物质明显区分(图2A); OA关节软骨在表层区和过渡区吸光强度减弱,说明此区域组织内生物大分子物质含量可能有损失(图2B)。OA关节软骨的胶原蛋白含量在表层区和过渡区出现少量丢失,深层区基本没变(图2C),胶原蛋白含量的损失则可能代表OA的发生时间较长[24],而蛋白多糖在表层区和过渡区出现了明显的丢失,深层区相对较弱(图2D)。客观上,红外吸收图像中的吸光度代表同一样本成分含量的相对变化,不能表示不同样本之间的绝对含量差异。因此,对健康和病变关节软骨进行定量判断与预测,需要借助化学计量学算法进行分析。

3.2 SVC模型的评估和预测

通过不同核函数(LF,RBF,2nd-PF和3rd-PF)及其相应参数的不斷尝试,几组较优SVC模型对预测集的准确率如表1所示,核函数及其参数的选择会影响SVC模型预测能力。通过对比预测集的结果,SVC模型的构建最终选用径向基核函数,参数C=1,且G=10。

SVC预测集的结果如表2所示,健康组全部被正确识别; 对于OA-2Y组,3个光谱被误判到健康组,即来自于切片OA-2Y-2sec的最后3组光谱。两组最终预测鉴别准确率为97.69%。出现误判的原因可能是:其一,该软骨组织切片较其它切片OA病变程度轻,蛋白多糖含量丢失主要发生在SZ,而TZ及更深区域含量变化较小,因而造成误判[25]; 其二,因OA软骨细胞形态、大小等发生变化[26],可能会带来更强的光散射效应,这也会对判别

结果造成影响。

前期的研究工作中,采用FTIRSI结合各种化学计量学算法来识别软骨的退化程度[21,27],其中,偏最小二乘判别分析(PLS-DA)和主成分分析-Fisher判别分析(PCA-FDA)的鉴别准确率分别为90.2%和86.7%,相比之下,SVC模型具有极高的判别准确率。最重要的是,SVC可以通过使用特定的核函数,克服了关节软骨变性期间其非线性变化和不明显的界限,更适合于不同类型的样本分布。但是该方法有其局限性,首先,核函数及其参数的确定是非常耗时的,通常,核函数和参数的优化组合取决于样本的类型,需要在不断尝试之后确定; 其次,SVC的结果输出是分类值而不是得分(如PCA-FDA或PLS-DA),分类值不能反映组内每个光谱的分布情况及其退化程度,因此难以确定不同组的谱图差异,也难以进行有效的统计分析。

3.3 SVR模型的评估和预测

SVR模型中采用的预处理组合是最大值标准化(Maximum normalization)+扩展多元散射校正(Extended multi-scatter calibration, EMSC),选用线性核函数: ε=0.1, C=0.0005。SVR模型性能的优劣可以通过均方根误差(Root mean square error, RMSE)和拟合优度(R-Square)两个参数进行评估。OA-2Y模型校正集和验证集的RMSE和R-Square见表3。其中,RMSE代表样本相对于回归线的离散程度,其值越小说明离散程度小; R-Square代表拟合优度或相关系数的平方,其值越大,越接近1, 说明两个集合相关程度高。由此可知,预测值与真实值二者的相关性很强,所建SVR模型具有良好的预测能力。然而,SVR存在过拟合的问题,以上两个参数的评估仅做参考,而最终模型好坏的确定,还需要依据模型预测未知样本的结果,并不断调整相关参数以达到最理想的效果。

图3为SVR模型计算的病变关节软骨组织中胶原蛋白和蛋白多糖的分布情况和PLS模型结果[28]的比较。发现SVR计算得到的OA关节软骨胶原蛋白的平均浓度(67.6%)远高于蛋白多糖的平均浓度(32.4%),并且与PLS计算的结果接近(胶原蛋白和蛋白多糖的平均浓度分别为70.7%和31.9%),两种方法对胶原蛋白和蛋白多糖的预测结果分别仅相差3.05%和0.52%。此结果与文献[22,28]报道基本一致,并且两种生物大分子的分布情况与其特征吸收图像的定性分析基本吻合(图2C和2D),验证了SVR模型对病变样本较好的预测能力。

关节软骨中主成分含量随组织深度变化明显。与健康样本预测结果对比发现[22,28],在2年病变关节软骨中,蛋白多糖含量在表层区、过渡区以及深层区末端丢失比较严重,在深层区中部含量基本不变。蛋白多糖的损失发生在软骨表面下200 μm深度之前,这足以引起软骨表面纤维化及其功能变性,影响患者的正常活动。深层区末端蛋白多糖浓度的减弱则可能与OA期间深层区的部分钙化有关,钙化作用及软骨细胞功能退化造成了蛋白多糖的生成减少[29]。

4 结 论

采用FTIRSI技术对犬膝关节软骨组织切片进行红外光谱成像,与化学计量学方法SVM相结合,成功应用于关节软骨组织的判别分析及其主成分(胶原蛋白和蛋白多糖)含量分布的研究。FTIRSI-SVC用于健康和病变关节软骨的判别,其预测鉴别准确率达97.7%,优于PCA-FDA以及PLS-DA结果,为OA的早期临床诊断及相关研究提供了一种方便可靠的方法,此外,因其使用特定的核函数,可应用于多组样本数据的分类识别; FTIRSI-SVR用于定量分析关节软骨中胶原蛋白和蛋白多糖的含量分布,一定程度揭示了病变过程中生物大分子含量的变化规律,有助于监测关节疾病进展及组织损伤和修复。

致 谢: 感谢美国奥克兰大学Xia Yang教授课题组所提供的研究支持。

References

1 Kuettner K E. Clin. Biochem., 1992, 25(3): 155-163

2 Eyre D. Arthritis Res. Ther., 2001, 4(1): 30

3 Mcdevitt C A. Ann. Rheum. Dis., 1973, 32(4): 364-378

4 Ramakrishnan N, Xia Y, Bidthanapally A, Lu M. Appl. Spectros., 2007, 61(12): 1404-1409

5 MAO Zhi-Hua, ZHANG Xue-Xi, WU Yue-Chao, YIN Jian-Hua, XIA Yang. Chinese J. Anal. Chem., 2015, 43(4): 518-522

毛之华, 张学喜, 吴曰超, 尹建华, XIA Yang. 分析化学, 2015, 43(4): 518-522

6 Zheng S K, Xia Y, Bidthanapally A, Badar F, Duvoisin N, Ilsar I. Magn. Reson. Imaging, 2009, 27(5): 648-655

7 Wilson W, Huyghe J M, van Donkelaar C C. Biomechan. Modeling Mechanobiol., 2007, 6(1): 43-53

8 Chen SS, Falcovitz Y H, Schneiderman R, Maroudas A, Sah R L. Osteoarthr. Cartilage, 2001, 9(6): 561-569

9 Xia Y, Alhadlaq H, Ramakrishnan N, Bidthanapall A, Badar F, Lu M. J. Struct. Biol., 2008, 164(1): 88-95

10 Tan A H, Mitra A K, Chang P C, Tay B K, Nag H L, Sim C S. J. Orthopaedic Surg., 2004, 12(2): 199-204

11 YIN Jian-Hua, HUANG Feng-Ling, QIAN Zhi-Yu, XIE Jie-Ru. Spectroscopy and Spectral Analysis, 2014, 34(2): 340-343

尹建华, 黄凤玲, 钱志余, 谢捷如. 光谱学与光谱分析, 2014, 34(2): 340-343

12 Yin J, Xia Y. Appl. Spectros., 2010, 64(11): 1199-1208

13 Deris A M, Zain A M, Sallehuddin R. Procedia Engineer., 2011, 24(8): 308-312

14 Kumardash C S, Sahoo P, Dehuri S, Cho S B. Inter. J. Artificial Intell. Tools, 2015, 24(4): 1550013

15 Nieto P J G, Combarro E F, Díaz J J D C, Montaésb E. Appl. Mathemat. Comput., 2013, 219(17): 8923-8937

16 CHU Xiao-Li. Molecular Spectroscopy Analytical Technology Combined with Chemometrics and its Applications. Beijing: Chemical Industry Press, 2011: 41-61, 196-214

褚小立. 化學计量学方法与分子光谱分析技术. 北京: 化学工业工业出版社, 2011: 41-61, 196-214

17 OUYANG Ai-Guo, TANG Tian-Yi, ZHOU Xin, LIU Yan-De. Chinese Journal of Luminescence, 2016, 37(10): 1253-1258

欧阳爱国, 唐天义, 周 鑫, 刘燕德. 发光学报, 2016, 37(10): 1253-1258

18 He S, Zhou W. IEEE Comput. Soci., 2012: 2047-2051

19 Cheng C G, Tian Y M, Jin W Y. Spectroscopy, 2008, 22(5): 397-404

20 ZHANG Lu-Da, JIN Ze-Chen, SHEN Xiao-Nan, ZHAO Long-Lian. LI Jun-Hui, YAN Yan-Lu. Spectroscopy and Spectral Analysis, 2005, 25(9): 1400-1403

张录达, 金泽宸, 沈晓南, 赵龙莲, 李军会, 严衍禄. 光谱学与光谱分析, 2005, 25(9): 1400-1403

21 Mao Z H, Yin J H, Zhang X X, Wang X, Xia Y. Biomed. Optics. Express., 2016, 7(2): 448-453

22 Yin J, Xia Y, Lu M. Spectrochim. Acta, 2012, 88(3): 90-96

23 WU Yue-Chao, YIN Jian-Hua, LIU Yu, MAO Zhi-Hua. Journal of Nanjing University of Aeronautics & Astronautics, 2015, 47(3): 421-427

吳曰超, 尹建华, 刘 玉, 毛之华. 南京航空航天大学学报, 2015, 47(3): 421-427

24 Bi X, Yang X, Bostrom M P G, Bartusik D, Ramaswamy S, Fishbein K W, Spencer R G, Camacho N P. Anal. Bioanal. Chem., 2007, 387(5): 1601-1612

25 Yin J, Xia Y. Spectrochim. Acta A, 2014, 133: 825-830

26 Pearle A D, Warren R F, Rodeo S A. Clin. Sports. Med., 2005, 24(1): 1-12

27 Zhang X X, Yin J H, Mao Z H, Xia Y. J. Biomed. Optics., 2015, 20(6): 60501

28 Zhang X X, Mao Z H, Yin J H, Xia Y. Vib. Spectros., 2015, 78: 49-53

29 Yin J H, Xia Y, Ramakrishnan N. Vib. Spectros., 2011, 57(2): 338-341

Abstract Fourier transform infrared spectroscopic imaging (FTIRSI) technology can simultaneously obtain microstructure information and infrared spectral information of the samples. The method of FTIRSI combined with chemometric algorithms can be used for quantitative analysis of sample spectral information and tissue discrimination research. Based on this, FTIRSI and support vector machine classification (SVC) for the first time were used in this work to discriminate healthy and degenerated articular cartilage, with high accuracies of 100% and 95.4%, respectively, and sum accuracy of 97.7%. The support vector regression (SVR) model was used to quantitatively study the contents and distribution of two biomacromolecules, collagen and proteoglycan, in articular cartilage. The proteoglycan loss occurred in the degenerated articular cartilage, especially in the superficial area. This study indicates that the combination of FTIRSI and support vector machine (SVM) is expected to become a new diagnostic tool for osteoarthritis, which is of great significance for the early diagnosis and research of osteoarthritis.

Keywords Articular cartilage; Osteoarthritis; Fourier transform infrared spectroscopic imaging; Support vector machine; Proteoglycan; Collagen

(Received 8 January 2018; accepted 24 March 2018)

推荐访问:向量 软骨 光谱 成像 定量

热门文章