肺孢子菌肺炎的致病因子纤维连接蛋白作为蛇毒胶原蛋白酶作用位点的预测
张雪薇1, 李锴1, 邹晓毅1,2, 陆合1,2, 张静1,2
1.重庆医科大学分子医学与肿瘤研究中心,重庆 400016
2.重庆医科大学病原生物学教研究,重庆 400016
通讯作者:张 静,Email: ZHANG jingcy@sohu.com
摘要

目的 分析和预测纤维连接蛋白与胶原蛋白具有功能相似性,从而预测蛇毒胶原蛋白酶可以水解破坏纤维连接蛋白。方法 利用NCBI,BLAST,ProtParam,ExPAsy,BioEdit,TMHMM,Signalp3.0,COILS,SWISS-MODEL等生物信息学软件对纤维连接蛋白的序列,理化性质,疏水性,跨膜区,空间结构等进行分析和预测。结果 纤维连接蛋白与胶原蛋白具有功能相似性,两者有共同的保守结构域。构成纤维连接蛋白的氨基酸中苏氨酸所占比例最高,而甲硫氨酸所含比例最低。纤维连接蛋白在0-50位氨基酸之间有一个疏水区,在2200-2300位氨基酸之间有一个亲水区。通过信号肽软件分析,预测纤维连接蛋白为分泌蛋白,存在信号肽,可能在跨膜运输中起信号识别作用,其分泌通路为s型。纤维连接蛋白的第231-270位氨基酸之间是个高度保守的结构功能域。结论 纤维连接蛋白和胶原蛋白的结构功能具有相似性,可以预测蛇毒胶原蛋白酶能够水解破坏纤维连接蛋白。

关键词: 肺孢子菌肺炎; 纤维连接蛋白; 胶原蛋白酶; 生物信息学; 蛇毒
中图分类号:R382.3 文献标志码:A 文章编号:1002-2694(2018)09-0769-05
Pathogenic factor of fibronectin in Pneumocystis pneumonia as a predictor of venom collagen enzyme interaction site
ZHANG Xue-wei1, LI Kai1, ZOU Xiao-yi1,2, LU He1,2, ZHANG Jing1,2
1.Research Center for Molecular Medicine and Tumor, Chongqing Medical University, Chongqing, 400016, China
2.Department of Pathogenic Biology, Chongqing Medical University, Chongqing, 400016, China
Corresponding author: Zhang jing,Email:ZHANGjingcy@sohu.com
Abstract

We analysed and predicted the similar functions between the fibronectin and collagen. It is predicted that the snake venom collagenase can hydrolyze the fibronectin. The biological information softwares, including NCBI, blast, protparam ExPAsy, bioedit, tmhmm, Signalp3.0, COILS and SWISS-MODEL,were used to analyse and predict the sequence, physical and chemical properties, hydrophobicity, transmembrane region and the spatial structure of fibronectin. Result showed that there were similar function and common conserved domains between fibronectin and collagen. Threonine contained the highest proportion, and methionine contained the lowest proportion in the amino acid composition. There was a hydrophobic region between 0-50 amino acid of fibronectin, a hydrophilic region between 2 200-2 300 amino acids of fibronectin. The signal peptide analysis software, prediction of fiber connection protein was a secreted protein, signal peptide, may play a role in the signal recognition of transmembrane transport in the secretory pathway as the path of s. Fibronectin was a function of amino acid structure of highly conserved domain between the 231-270. The structural function of fibronectin and collagen is similar, and it can be predicted that snake venom collagenase can hydrolyze and destroy fibronectin.

Keyword: PCP; fibronectin; collagenase; bioinformatics; venom

肺孢子菌肺炎[1], 又称卡氏肺孢子虫肺炎, 卡氏肺囊虫肺炎, 是由肺孢子菌引起的间质性浆细胞性肺炎, 为条件性肺部感染性疾病。本病20世纪50年代前仅见于早产儿, 营养不良婴儿, 近10年来随着免疫抑制剂的应用, 肿瘤化疗的普及尤其是HIV感染的出现, 发病率明显上升, 已成为HIV感染患者最常见的机会感染与致死的主要病因。肺孢子菌[2]主要定位在肺泡内, 主要通过纤维连接蛋白等黏着蛋白被固着在肺泡巨噬细胞上。此外, 菌体的一些抗原成分如主要表面糖蛋白(Major surface glycoprotein, MSG)[3]和P55同时激发宿主产生细胞免疫和体液免疫反应, 产生包括α -肿瘤坏死因子、白细胞介素-2、调理素和特异性抗体等一系列细胞和体液因子, 使菌体迅速被活化的巨噬细胞吞噬杀灭。但是在免疫功能缺陷的宿主体内, 菌体却能逃脱巨噬细胞的吞噬而不断繁殖并充满肺泡腔。如果能够通过破坏纤维连接蛋白从而阻断菌体侵入肺泡的桥梁, 就可以为PCP的治疗提供新的研究方向。蛇毒[4], 其组成的蛋白质中几乎半数以上是具有各种催化活性的酶类, 这些酶无论在生物化学研究上, 还是在临床应用实践中, 都有其重要意义[5]。如果证明纤维连接蛋白结构具有不稳定性, 就可以预测纤维连接蛋白很容易被破坏, 然后探索纤维连接蛋白和胶原蛋白的空间结构的相似性, 就可以利用蛇毒中的胶原蛋白酶[6]来破坏纤维连接蛋白, 从而阻断纤维连接蛋白与肺孢子菌MSG(主要表面糖蛋白, Major surface glycoprotein)的结合, 阻止肺孢子菌侵入肺泡。

1 材料与方法
1.1 蛋白质序列的获取与分析

1.1.1 从GenBankTM(ftp://ncbi.nlm.nih.gov/genbank)中获得蛋白质序列

1.1.2 用NCBI中的BLAST软件进行蛋白质的序列比对

1.2 蛋白质的理化特性及结构分析

1.2.1 用ProtParam(http://us.expasy.org/tools/protparam.html)预测纤维连接蛋白及胶原蛋白的分子量、等电点、氨基酸组成、稳定指数等一系列理化特性

1.2.2 用ProtScale(http://www.expasy.org/cgi-bin/protscale.pl)预测纤维连接蛋白的亲水性/疏水性

1.2.3 用BioEdit(http://www.mbio.ncsu.edu/BioEdit/BioEdit.html)分析纤维连接蛋白的亲水性/疏水性

1.2.4 用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)预测纤维连接蛋白的跨膜结构域

1.2.5 用SignalP(http://www.cbs.dtu.dk/services/SignalP/)对纤维连接蛋白进行信号肽的预测

1.2.6 用TargetP(http://www.cbs.dtu.dk/services/TargetP/)预测纤维连接蛋白的亚细胞定位

1.3 蛋白质的高级结构分析

1.3.1 为准确预测纤维连接蛋白和胶原蛋白的高级结构, 利用 SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html/)和Verify3D, 通过同源建模法对纤维连接蛋白和胶原蛋白进行预测, 然后通过Verify3D进行质量评估

1.3.2 采用expasy系统中的SMART软件预测纤维连接蛋白和胶原蛋白的保守结构域。

2 结 果
2.1 纤维连接蛋白的序列查找结果

根据发现纤维结合素的文章所提供的提交在NCBI上的纤维连接蛋白序列号P02751从NCBI上调出该蛋白质的序列, 包含2 386个氨基酸。

2.2 P02751蛋白的理化性质分析

利用ProtParam工具分析P02751蛋白的理化性质分析得知, P02751的蛋白分子量约为259 kDa, 理论等电点PI为5.39, 总共包括35 841个原子, 分子式为C11351H17590N3169O3644S88。在组成P02751蛋白的20种氨基酸中, 苏氨酸所占的比例最高, 达到10.8%, 而甲硫氨酸所占的比例最低, 为1.1%。P02751蛋白的不稳定指数为40.56, 脂肪指数为66.02。根据Guruprasad方法表明P02751蛋白不稳定。

2.3 P02751蛋白的疏水区

通过访问ExPAsy服务器, 计算基于K-D法的蛋白质疏水性, 结果得知P02751蛋白有疏水区(图1)。

图1 ProtScale程序分析P02751蛋白的疏水性Fig.1 Analysis on the hydrophobicity of P02751 protein by ProtScale program

2.4 P02751 蛋白的疏水性分析

使用生物信息学软件BioEdit分析蛋白质的疏水性, 结果表明P02751蛋白在0-50位氨基酸之间有一个疏水区, 在2200-2300位氨基酸之间有一个亲水区, 与ProtScale程序分析结果一致(图2)。

图2 利用BioEdit软件分析P02751蛋白的疏水性Fig.2 Using BioEdit software to analyze the hydrophobicity of P02751 protein

2.5 P02751蛋白的跨膜区分析

使用TMHMM对P02751蛋白进行跨膜区分析, 结果显示P02751蛋白的1-2386位氨基酸全部位于细胞膜表面, 表明该蛋白可能不是一个与细胞信号转导有关的膜受体蛋白, 它发挥生物学功能的方式可能不是以信号转导的方式。

2.6 P02751 蛋白的信号肽预测结果及分析

使用SignalP3.0服务器对P02751蛋白进行信号肽预测, 从结果中分析s平均值> 0.5, 则预测该蛋白为分泌蛋白, 存在信号肽。基于神经网络算法的结果表明, 该蛋白具有信号肽序列, 最可能的剪切位点位于第26-27位氨基酸之间, 具体序列为MLRGPGPGLLLLAVQCLG, 说明P02751蛋白可能在跨膜运输中起信号识别作用, 剪切位点在第26-27位氨基酸之间, 表明成熟肽始于第26位氨基酸(图3, 表1)。

图3 使用SignalP3.0软件预测信号肽Fig.3 Using SignalP3.0 to predict signal peptide

表1 基于神经网络算法的SignalP预测结果 Tab.1 Prediction results of SignalP based on neural network algorithm
2.7 P02751蛋白的亚细胞定位预测结果及分析

通过TargetP对P02751蛋白的亚细胞定位进行预测, 结果显示目的蛋白P02751的分泌途径为S型, 即分泌通路, 可靠性级别为2级(0.800> diff> 0.600), 与SignalP3.0服务器预测的结果一致(表2)。

表2 TargetP1.1Server亚细胞定位结果 Tab.2 TargetP1.1Server subcellular localization results
2.8 P02751蛋白和Q99715蛋白的序列相似性比对结果

P02751蛋白质在人类基因组数据库用Blastp命令、选择Swissprot and TREMBL proteins(AA)数据库进行蛋白质序列比对, 结果得出p02751蛋白和q99715蛋白的各个种属均有不同程度的相似性, 一致性在30%(表3)。

表3 之间的相似性分析p02751蛋白和q99715蛋白 Tab.3 The similarity analysis between P02751 protein and Q99715 protein
2.9 Q99715蛋白的理化性质分析

同样对胶原蛋白(Q99715)进行理化性质分析, 结果显示胶原蛋白(Q99715)的分子质量约为330 kDa、理论等电点pI为7.62, 总共包括46 349个原子, 分子式为C14662H23037N3975O4610S65; 在组成Q99715蛋白的20种氨基酸中, 甘氨酸所占的比例最高, 为9.2%, 半胱氨酸所占的比例最低, 为0.7%; Q99715蛋白的不稳定指数为32.52, 脂肪指数为74.92, 根据Guruprasad方法表明该蛋白稳定。

2.10 同源建模结果

同源建模结果及通过Verify 3D软件对建模结果进行质量评估, 得出p02751蛋白的质量评估结果是89.95%, q99715蛋白的质量评估结果是80.5%(在3D结构中, 至少80%的氨基酸的得分≥ 0.2分, 建模结果属于可信)。(图4(1, 2), 图5(1, 2))。

图4(1) 纤维连接蛋白的三级结构Fig.4(1) Three level structure of P02751 protein

图4(2) 纤维连接蛋白的同源性建模及质量评价结果Fig.4(2) The results of homology modeling and quality evaluation of fibronectin

图5(1) 胶原蛋白的三级结构Fig.5(1) Three level structure of Q99715 protein

图5(2) 胶原蛋白的同源性建模和质量评价结果Fig.5(2) The results of collagen homology modeling and quality assessment

2.11 蛋白保守结构域的预测结果

纤维连接蛋白和胶原蛋白的保守结构域的预测结果及它们所属蛋白家族, 得出纤维连接蛋白和胶原蛋白的保守结构域所属家族同是Ensembl家族(图6(1, 2))。

图6(1) 纤维连接蛋白的保守结构域图Fig.6(1) Conserved domain of P02751 protein

图6(2) 胶原蛋白的保守结构域图Fig.6(2) Conserved domain of Q99715 protein

3 讨 论

PCP是一种严重的机会感染性疾病, AIDS患者应用磺胺甲恶唑/甲氧苄啶或喷他脒疗程要长, 为3周或更长[7]。初期疗效同非AIDS患者相似, 但药物副作用的发生率和严重性更明显, 复发率可高达50%[8]。目前, 尚没有研制出针对肺孢子菌的疫苗, 也没有研制出副作用较小的药物, 加之肺孢子菌在不同的生物体中的基因型有很大差异[9], 如此一来对于研究靶向疫苗就成为难题了, 由于该虫种的体外培养和获取都有一定的难度, 动物模型的建立需要很长的时间, 最后的结果也不尽如人意, 所以对于其治疗手段的研究就出现了挑战。

近年来, 随着科学发展, 国内外蛇毒研究工作迅速兴起, 蛇毒应用越来越广, 蛇毒的科学价值和经济价值逐步被认识。例如磷酸二酯酶被用作核酸和核苷酸类辅助因子结构的分析[4]; 蛋白酶被用作蛋白质和多肽一级结构的测定, 磷脂酶A2用作细胞膜结构和功能的研究等[10]。胶原蛋白不被一般水解酶水解, 而对动物体内的胶原蛋白酶(EC3, 4, 24)敏感。动物体内的胶原蛋白酶作用于胶原蛋白三螺旋体特殊部位, 释放出二种肽, 分别称为TcA和TcB, 长度分别为胶原蛋白单体的3/4和1/4。很早就有人怀疑蛇毒中也含有胶原蛋白酶, 直到近些年才得以证实[11]。该酶和其他动物胶原蛋白酶相似, 作用于胶原蛋白螺旋区的特异部位, 水解产生两种肽, 大小和其他动物胶原蛋白酶水解的产物相似, 只不过TcA分子量稍大而已, 可能蛇毒胶原蛋白酶水解的部位更接近C端。它不能水解合成的蛋白酶底物TAME和A-TEE, 这说明它与胰蛋白酶、胰凝乳蛋白酶不同, 而是一种特异的胶原蛋白酶[12], 因此蛇毒的应用就显得更有意义了。但是蛇毒的获取比较困难加上考虑到生态问题, 科学家不能大量捕杀蛇类来做科学研究, 那么通过生物信息学手段探索出哪些蛋白质能够被蛇毒成分中的哪些酶类水解和破坏就显得极其重要了。

生物信息学软件分析[13]显示纤维连接蛋白疏水区没有亲水区有典型优势。因为氨基酸的疏水的相互作用[14], 在保持蛋白质三级结构的形成和稳定性中起着重要作用, 所以可以推测纤维连接蛋白结构不够稳定[15]。而分析得知胶原蛋白属于较稳定蛋白, 纤维连接蛋白(P02751)与胶原蛋白(Q99715)具有序列相似性, 空间结构具有相似性以及具有相似的保守结构域, 它们所属的蛋白家族也具有相似性。纤维连接蛋白相对于胶原蛋白又较不稳定, 蛇毒中的胶原蛋白酶可以水解胶原蛋白, 因此推测蛇毒中的胶原蛋白酶可以水解纤维连接蛋白, 为PCP的研究提供了新的方向。纤维连接蛋白广泛存在于动物组织和组织液中, 是一种高分子糖蛋白, 具有多种生物学功能。纤维连接蛋白在进化过程中保守性很强, 各种动物体液中的纤维连接蛋白具有相近的结构性质和生物学功能, 因而不同来源的纤维连接蛋白可以相互替代使用, 这也给下一步探索肺孢子菌寄生在动物和人体两类宿主内的联系和区别提供了新的线索。从另一个方面来研究, 因为蛇毒中还有一些细胞毒素, 神经毒素等可以对细胞等结构进行破坏, 也可以作为肺孢子菌治疗的研究热点, 后续的研究需要各国科学家极力探索。

The authors have declared that no competing interests exist.

参考文献
[1] Amber K, T Lamberts A, Solimani F, et al. Determining the incidence of Pneumocystis Pneumonia in patients with autoimmune blistering diseases not receiving routine prophylaxis[J]. JAMA Dermatol, 2017. DOI: DOI:10.1001/jamadermatol.2017.2808 [本文引用:1]
[2] Wang D, Hu Y, Li T, et al. Diagnosis of Pneumocystis jirovecii pneumonia with serum cell-free DNA in non-HIV-infected immunocompromised patients[J]. Oncotarget, 2017, 8(42): 71946-71953. [本文引用:1]
[3] Rudramurthy S, M Sharma, M Sharma M, et al. Reliable differentiation of Pneumocystis pneumonia from Pneumocystis colonization by quantification of Major Surface Glycoprotein gene using real-time polymerase chain reaction[J]. Mycoses, 2017. DOI: DOI:10.1111/myc.12708 [本文引用:1]
[4] Mitra J, Bhattacharyya D. Phosphodiesterase from Daboia russelli russelli venom: purification, partial characterization and inhibition of platelet aggregation[J]. Toxicon, 2014, 88: 1-10. [本文引用:2]
[5] Gomis-Ruth FX, LF Kress W Bode. First structure of a snake venom metalloproteinase: a prototype for matrix metalloproteinases/collagenases[J]. Embo J, 1993, 12(11): 4151-7. [本文引用:1]
[6] Gomis-Ruth F, X Kress, LF Kellermann J, et al. Refined 2. 0 A X-ray crystal structure of the snake venom zinc-endopeptidase adamalysin II. Primary and tertiary structure determination, refinement, molecular structure and comparison with astacin, collagenase and thermolysin[J]. J Mol Biol, 1994, 239(4): 513-44. [本文引用:1]
[7] Urbancic K. F Ierino, F Phillips E, et al. Taking the challenge: A protocolized approach to optimize Pneumocystis pneumonia prophylaxis in renal transplant recipients[J]. Am J Transplant, 2017. DOI: DOI:10.1111/ajt.14498 [本文引用:1]
[8] 任翊, 宋营改, 李若瑜. 耶氏肺孢子菌与宿主免疫防御相互作用[J]. 中国真菌学杂志, 2013, (1): 51-54. [本文引用:1]
[9] 骆晓练, 姚云清, 谭燕. siRNA治疗大鼠卡氏肺孢子菌肺炎的实验研究[J]. 重庆医科大学学报, 2011, (6): 681-685. [本文引用:1]
[10] Trummal K, Aaspollu A, Tonismagi K, et al. Phosphodiesterase from Vipera lebetina venom- structure and characterization[J]. Biochimie, 2014, 106: 48-55. [本文引用:1]
[11] Simpson JW, AC Taylor, BM Levy. Collagenolytic activity in some snake venoms[J]. Comp Biochem Physiol B, 1971, 39(4): 963-7. [本文引用:1]
[12] Simpson JW. Collagenolytic activity of snake venom: the absence of collagenolytic activity in the trypsin-like enzyme from Crotalus atrox venom[J]. Comp Biochem Physiol B, 1971, 40(3): 633-6. [本文引用:1]
[13] 徐建华, 朱家勇. 生物信息学在蛋白质结构与功能预测中的应用[J]. 医学分子生物学杂志, 2005, (3): 227-232. [本文引用:1]
[14] 张松, 黄波, 夏学峰. 蛋白质亚细胞定位的生物信息学研究[J]. 生物化学与生物物理进展, 2007, (6): 573-579. [本文引用:1]
[15] 马袁君, 程震龙, 孙野青. 生物信息学及其在蛋白质组学中的应用[J]. 生物信息学, 2008, (1): 38-39+48. [本文引用:1]