问号钩端螺旋体GGDEF和EAL/HD-GYP结构域蛋白生物信息学分析
丁士标1,2, 肖国辉2, 孔亮亮2, 严杰2, 林旭瑷2
1.浙江省杭州市红十字会医院检验科,杭州 310003
2.浙江大学医学院病原生物学系,杭州 310058
林旭瑷,Email:lxai122@163.com
摘要

目的分析问号钩端螺旋体(钩体)环二鸟苷酸(Cyclic dimeric-GMP,c-di-GMP)调节相关的GGDEF和EAL/HD-GYP结构域蛋白生物信息学结果,为后续的功能研究奠定基础.方法PSI-BLAST方法分析编码GGDEF和EAL/HD-GYP结构域蛋白的基因;利用相应生物信息学软件对蛋白信号肽序列,跨膜序列,蛋白结构,同源性进行分析并构建目的蛋白进化树.结果 问号钩体中22个蛋白分别含有GGDEF或EAL/HD-GYP结构域,多数蛋白均有感受器结构域和跨膜区.7个具有PAS输入感受器的GGDEF结构域蛋白进化较为独立,位于单独的一个分支,其余6个GGDEF结构域蛋白则分散在不同的分支上.4个EAL结构域蛋白和2个HD-GYP结构域蛋白进化上也较为独立,分别处于同一进化分支.3个GGDEF和EAL结构域耦合的蛋白在进化关系上更趋向于PDE活性蛋白.结论 钩体具有多拷贝的合成和降解c-di-GMP相关蛋白编码基因,表明在钩体中c-di-GMP网络具有高度复杂性,同时反映出钩体对环境条件的改变具有复杂的应对机制.

关键词: 问号钩端螺旋体; 环二鸟苷酸; 鸟苷酸环化酶; 磷酸二酯酶
中图分类号:R377 文献标志码:A 文章编号:1002-2694(2016)02-0109-05
Bioinformatic analysis of proteins with GGDEF/EAL/HD-GYP domain in Leptospira interrogans
DING Shi-biao1,2, XIAO Guo-hui2, KONG Liang-liang2, YAN Jie2, LIN Xü-ai2
1.Department of Clinical Laboratory, Zhejiang Hangzhou Red Cross Hospital, Hangzhou 310003, China
2.Department of Microbiology and Parasitology, College of Medicine, Zhejiang University, Hangzhou 310058, China
Corresponding author: Lin Xü-ai, Email: lxai122@163.com
Abstract

To further understand the function and regulation of c-di-GMP, the second messenger of bacteria, bioinformatic methods were used to analysis the proteins in Leptospira interrogans with GGDEF or EAL/HD-GYP domain, which regulate the synthesis and delegation of c-di-GMP. Genes, encoded proteins with GGDEF or EAL/HD-GYP domain, in the genome of Leptospira interrogans Lai, were analyzed by PSI-BLAST. The signal peptide sequences were analyzed by Signal P 4.0 software. Protein structures were analyzed by SMART and CCD in NCBI. The transmembrane sequences were detected by EMBNET. Homology analysis of protein sequences were detected by DNAstar. The phylogenetic tree was constructed using Neighbor-joining method. There are 22 proteins of Leptospira interrogans with GGDEF or EAL/HD-GYP domain, most of them contain receptor domain, such as PAS, GAF or REC, and the transmembrane region. Seven proteins with PAS receptor domain are more independent and located in a separate evolutionary branch, while the remaining 6 proteins with GGDEF domain are distributed in different branches. Four proteins with EAL domain and 2 proteins with HD-GYP domain are also more independent and are in the different evolutionary branch. Three proteins coupling GGDEF and EAL domains are more likely to be related to PDE activity, based on the analysis of evolutionary relationships. The genes coded proteins with GGDEF and EAL/HD-GYP domain are widely exist in Leptospira interrogans genome. The analysis of related protein indicated that 1) c-di-GMP signal network with a high degree of complexity; 2) L. interrogans can reflect a hook on the environmental alteration with a sophisticated mechanism.

Keyword: Leptospira interrogans; cyclic dimeric-GMP (c-di-GMP); diguanylic cyclase (DGC); phosphodiesterase (PDE)

致病性钩端螺旋体(简称钩体)感染引起的钩体病是全球流行的人畜共患传染病, 钩体可在水或湿土中存活较长时间, 通过疫水或污染的土壤感染宿主[1].感染是病原微生物与宿主相互作用的过程, 在长期的进化过程中, 病原菌拥有了感受环境条件变化并作出适应性应答的机制, 尤其在感染的早期阶段, 病原菌识别环境改变并调整靶基因表达水平, 以便侵入宿主, 对抗宿主免疫力, 达到在宿主体内生存与繁殖的目的.近年发现一些原核生物中存在一类环二鸟苷酸(Cyclic dimeric-GMP, c-di-GMP)分子, 主要控制细菌对不同环境条件的适应性应答[2, 3].c-di-GMP由具有GGDEF结构域的二鸟苷环化酶(DGC)合成, 而由EAL/HD-GYP结构域的磷酸二酯酶(PDE)降解, 具有感受温度, 氧分子, pH等外界信号并广泛调控多种靶基因表达的功能, 尤其在细菌生物膜形成, 毒力因子表达, 细菌在宿主体内生存过程中发挥重要作用[4, 5].

本文分析了钩体赖型赖株中的GGDEF和EAL/HD-GYP结构域蛋白, 包括保守的GGDEF, EAL/HD-GYP结构域, 与这些蛋白相关的感受器结构域, 信号肽及跨膜片段等, 同时对这些结构域蛋白进行了同源性和进化树分析.结果发现钩体中有多拷贝的GGDEF和EAL/HD-GYP结构域蛋白, 有些是赖株特有的, 有些与其它细菌菌株中的蛋白有同源性.通过进一步对这些蛋白的功能研究必将丰富对钩体致病机制的认识.

1 材料与方法
1.1 钩体基因组

钩体赖株基因组(GenBank Nos. AE010300, AE010301).

1.2 蛋白序列分析

采用PSI-BLAST方法分析GGDEF和EAL/HD-GYP结构域蛋白的编码序列.Signal P 4.0分析蛋白信号肽序列(http://www.cbs.dtu.dk/services/SignalP/); 采用EMBNET方法分析蛋白中的跨膜序列(http://www.ch.embnet.org/software/TMPRED_form.html); 采用SMART和NCBI中的CDD方法分析蛋白中的结构域(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi, http://smart.embl-heidelberg.de/); 采用DNAstar软件进行蛋白序列间的同源性分析.

1.3 进化树构建

采用MEGA 6.06程序构建蛋白的进化树.首先将获得的蛋白序列用ClustalW进行序列比对, 默认参数.比对后的序列用邻位相连法(Neighbor-joining, NJ法)构建进化树.进化树检验采用Bootstrap法(Bootstrap replication=1 000), 模型使用Poisson model.蛋白序列来自于Signal Census database.

2 结果
2.1 GGDEF和EAL结构域蛋白编码基因的多样性

为了统计致病性钩体赖株中GGDEF和EAL/HD-GYP结构域蛋白的数量, 用Position-Specific Iterated(PSI)-BLAST程序鉴定了钩体赖株基因组中的保守结构域基因.赖株钩体中有多拷贝的GGDEF结构域蛋白(表1):仅含有GGDEF结构域蛋白13个, 大部分为GGEEF基序, 只有LA2704和LA3929为GGDEF基序, LA1185和LA3909为退化的GGDEF基序.单纯EAL结构域蛋白的拷贝数相对于GGDEF少, 仅有4个; 另有两个具有与EAL结构域蛋白功能类似的HD-GYP结构域蛋白.在已经研究的一些细菌中, 亦发现很多蛋白同时具有GGDEF和EAL结构域, 其中有的活化位点已退化而失去相应的合成或降解c-di-GMP的功能, 但可作为c-di-GMP结合效应蛋白或直接与非c-di-GMP大分子相互作用[5], 钩体赖株基因组中亦有3个GGDEF-EAL结构域偶联蛋白, 其具体的生物学功能尚需进一步的实验验证.

结构域蛋白通常含有一至两个跨膜区和信号肽, 这有助于蛋白锚定在膜上, 并有利于不同的GGDEF和EAL蛋白从独特的微环境分离[5].为进一步了解钩体中这些蛋白的特性, 通过软件对其信号肽和保守结构域等进行了分析.结果发现所有的GGDEF和EAL/HD-GYP结构域蛋白均不含信号肽序列, 表明它们不能穿过或锚定在膜上.大部分的蛋白(77%的GGDEF, 86%的EAL/HD-DYP和100%的GGDEF-EAL结构域偶联蛋白)含有转膜片段(表1), 表明调控和/或酶活性主要发生在膜上.

2.2 预测的GGDEF结构域蛋白催化活性

活化的DGC蛋白包括2个亚单位:在两个亚单位表面结合GTP分子的A位点和抑制c-di-GMP结合的I位点.A位点为保守的特征性GGD/(E)EF基序, 发生突变则酶活性丧失[5]; I位点距离A位点5个氨基酸, 为DGC蛋白的变构抑制位点, 通过结合c-di-GMP至特征性RxxD基序而发生变构控制, R突变导致抑制功能和变构控制的改变, 目前尚未发现D突变对其功能的影响[4].在赖株中, GGDEF结构域蛋白均包含完整的A位点, LA1483和LA2926的I位点R突变为G; 在3个GGDEF-EAL结构域偶联蛋白则无典型的A或I位点.已有研究表明, GGDEF退化蛋白通常缺失DGC活性但拥有其它功能, 如结合c-di-GMP或其它大分子物质等[7, 8].

2.3 GGDEF和EAL/HD-GYP蛋白中的传感器结构域

c-di-GMP能够感受外界环境条件的改变主要是由于其具有接受信号输入的保守结构域, 包括周质, 胞质和完整的膜结构域等.已有研究表明在GGDEF结构域蛋白中除了C末端的催化活性位点A, 很多在N端具有传感器结构域以感应不同的内在或外在信号, 从而启动DGC或PDE功能的活化[9].因此, 本文对钩体GGDEF和EAL/HD-GYP结构域蛋白中相关的传感器结构域进行了分析, 结果发现大部分的GGDEF结构域蛋白含有相关结构域(FAS, GAF和REC)(表1), 7个为PAS结构域(54%), 两个(LA1483和LA3929)为GAF结构域, 还有一个(LA2528)为REC结构域; 在EAL结构域蛋白中仅有LA2827含有REC结构域; 而在3个GGDEF-EAL结构域偶联蛋白中则有2个含有REC结构域.目前已知PAS结构域能够结合亚铁血红素, 核黄素和腺嘌呤等小分子物质[10]; GAF与PAS结构相似, 是胞质内感受器结构域, 能够结合包括单环核苷, 氧气等小分子[11].不同感受器结构域的存在表明钩体对不同环境刺激调控应答具有多样性.

表1 问号钩端螺旋体赖株GGDEF和EAL/HD-GYP结构域蛋白 Tab.1 List of proteins with GGDEF or EAL/HD-GYP domain from the genomes of L. interrogans strain Lai
2.4 GGDEF和EAL/HD-GYP结构域蛋白的进化分析

我们将赖株中的GGDEF与EAL/HD-GYP结构域蛋白与NCBI数据库中相关蛋白序列进行了比对分析, 13个仅GGDEF结构域蛋白中有6个与其它各型钩体中相应蛋白同源性较高, 基本超过80%, 7个具有PAS结构域的蛋白与其他型钩体的同源性相对较低, 但与寇氏钩端螺旋体(L.Kirschneri), 冲绳钩端螺旋体(L. Noquchii)同源性较高, 均超过90%; 与非致病性的双曲钩体Protoc I相比, LA1483, LA2704, LB240有较低同源性(分别为67%, 35%, 56%)的对应蛋白, 其余10个蛋白为致病性钩体赖株所特有.3个GGDEF-EAL结构域偶联蛋白除了LA1185外, LA3909和LB235与其它各型致病性钩体同源性较高, 均达到80%以上; 3者与Protoc I同源性均低于50%.5个EAL与2个HD-GYP结构域蛋白与其它致病性钩体中对应蛋白同源性均高, 与Protoc I中蛋白同源性较低或无同源蛋白.

为了进一步分析钩体中的GGDEF和EAL/HD-GYP结构域蛋白, 我们分别针对GGDEF和EAL/HD-GYP结构域蛋白构建了相应的进化树(图 1, 图2).如图1所示, 仅含GGDEF结构域蛋白与分别来自于伯氏疏螺旋体和非致病性双曲钩体Protoc I的GGDEF结构域蛋白归于同一群, 其中7个具有PAS输入感受器的蛋白处于一个独立的分支; 两个具有GAF输入感受器的蛋白则相距较远; 位于钩体小染色体上的LB237和LB240只含有GGDEF结构域且处于相对较近的进化分支, 而位于大染色体上的LA2704虽然也只含有GGDEF结构域, 但与另外两个蛋白相距较远, 却与双曲钩体中蛋白亲缘较近; 具有GGEEF和REC结构域的LA2528则与伯氏螺旋体中的蛋白相距较近.REC结构蛋白的进化情况如图2所示, 4个仅含EAL结构域蛋白中, LA1983和LA3104归于同一进化分支, LB133则处于相对独立的分支中, LA2827带有REC感受器, 进化位置与另外的3个蛋白更远些.钩体中仅两个蛋白具有HD-GYP结构域, 二者也分别属于不同的进化分支, 与双曲钩体中相应蛋白进化关系较近.本文中, 我们将3个GGDEF-EAL结构域偶联蛋白同时分别归于GGDEF和EAL/HD-GYP结构域的那边分析, 如图1所示, 3个偶联蛋白处于独立的进化分支, 且带有REC感受器的两个蛋白亲缘关系更近; 图2则表明, 带有REC感受器的两个蛋白亲缘较近, LA3909则与EAL结构域蛋白处于类似的进化分支.

图1 问号钩端螺旋体赖株GGDEF结构域蛋白进化分析Fig.1 Phylogeny of L. interrogans strain Lai proteins with GGDEF domain

图2 问号钩端螺旋体赖株EAL/HD-GYP结构域蛋白进化分析Fig.2 Phylogeny of L. interrogans strain Lai proteins with EAL/HD-GYP domain

3 结论

细菌对外部环境变化的感应往往通过信号转导的方式进行, 这种调控过程非常复杂, 需依赖许多不同组份相互作用来协调完成细菌的生理生化反应, 其中一个重要的组份是第二信使分子.近年发现c-di-GMP是细菌中广泛存在的第二信使分子, 其与鸟苷酸环化酶(DGC), 磷酸二酯酶(PDE)和下游的效应分子共同组成c-di-GMP信号系统.不同浓度c-di-GMP调控下游不同靶基因及其表达水平, 从而控制细菌众多功能, 如细菌生物膜形成, 毒力因子表达, 耐药性, 细胞分化等.

c-di-GMP由二鸟苷环化酶(DGC)合成, 磷酸二酯酶(PDE)分解.DGC含特征性GGDEF(Gly-Gly-Asp-Glu-Phe)基序的酶功能结构域, 而PDE含EAL(Glu-Ala-Leu)或HD-GYP(His-Asp, Gly-Tyr-Pro)基序的酶功能结构域, PDE属于金属依赖磷酸水解酶超家族蛋白, 发挥酶活性时需Mg2+和Mn2+, 但其活性可被Ca2+和Zn2+所抑制, 分子结构显示大多数GGDEF和EAL/HD-GYP结构域蛋白胞外区都有一个含PAS, GAF, REC或HTH基序的胞外信号感受器结构域[7, 12].全基因组测序结果显示细菌中存在数量较多的GGDEF和EAL结构域蛋白, 例如大肠埃希菌有29个GGDEF或EAL结构域蛋白, 肠炎沙门菌Typimurium有19个, 新月柄杆菌(Caulobacter crescentus)有14个, 而弧菌属细菌则超过50个, 而HD-GYP结构域蛋白相对较少或缺失[5].钩体中同样具有众多的GGDEF和EAL/HD-GYP结构域蛋白且多具有PAS, GAF或REC感受器结构域和转膜片段, 表明DGC和PDE的酶活性调控主要通过感受外环境因素变化并在膜上完成.GGDEF-EAL结构域蛋白是一种较为特殊的蛋白, 这类蛋白可能是单功能酶或双功能酶, 活性可能互相激活或抑制.例如, 葡糖醋杆菌有6个GGDEF-EAL结构域蛋白, 其中3个表现为GDC活性, 3个为PDE活性, 其功能主要是调控细菌纤维素合成[13], 而耻垢分枝杆菌中调控细菌长期饥饿状态下存活的GGDEF-EAL结构域蛋白MSDGC1同时具有DGC和PDE活性, 但两个结构域分离后均无活性[8].钩体中有3个GGDEF-EAL结构域偶联蛋白, 其中两个带有REC感受器结构域, 但功能尚不清楚.

基因序列比对和进化构建可以分析同一结构域蛋白在不种属细菌中是否来自同一进化祖先, 推测其功能是否有差异.本研究根据蛋白结构域的不同分别构建了相应的进化树, 在GGDEF结构域蛋白中, 与非致病性双曲钩体Protoc I相关蛋白比较, 7个具有PAS感受器结构域和1个具有GAF感受器结构域蛋白分别处于相对独立分枝, 推测其在钩体致病过程中可能具有独特的调控作用.具有REC感受器的LA2528蛋白与伯氏疏螺旋体B31的NP212553蛋白处于同一分枝, 提示来源于同一进化祖先, REC感受器主要感知光, 气体(如NO和氧分子), 磷酸化, 抗生素压力等, 进而产生相应的细胞生物学行为来适应外界环境的变化[14].虽然EAL和HD-GYP均是PDE蛋白的酶功能结构域, 但在进化上分别处于独立群, 显示两者来自不同的进化祖先.令人感兴趣的是, 钩体3个GGDEF-EAL结构域偶联蛋白与GGDEF结构域蛋白在进化上分别处于独立群, 而与EAL结构域蛋白有同一进化分枝, 提示GGDEF-EA偶联L结构域蛋白发挥的作用可能更倾向PDE活性.

综上所述, 利用生物信息学方法对钩体GGDEF和EAL/HD-GYP结构域蛋白数量和结构特征分析发现其与其它细菌中的相应蛋白具有同源性, 且有些蛋白具有复杂的结构域, 提示在钩体中可能存在复杂的c-di-GMP网络, 在钩体生长和在不同环境中存活的过程中发挥重要作用, 其中某些蛋白或许与钩体毒力有关并在钩体感染过程中具有重要作用.进一步对这些蛋白的功能研究必将有助于更好的了解钩体在不同的环境条件中生长, 存活的调节机制.

The authors have declared that no competing interests exist.

参考文献
[1] Adler B, Moctezuma A. Leptospira and leptospirosis[J]. Vet Microbiol, 2010, 140: 287-296. [本文引用:1]
[2] Galperin MY, Nikolskaya AN. Identification of sensory and signal-transducing domains in two-component signaling systems[J]. Methods Enzymol, 2007, 422: 47-74. [本文引用:1]
[3] Pesavento C, Hengge R. Bacterial nucleotide-based second messengers[J]. Curr Opin Microbiol, 2009, 12: 170-176. [本文引用:1]
[4] Schirmer T, Jenal U. Structural and mechanistic determinants of c-di-GMP signaling[J]. Nat Rev Microbiol, 2009, 7(10): 724-735. [本文引用:2]
[5] Hengge R. Principles of c-di-GMP signalling in bacteria[J]. Nat Rev Microbiol, 2009, 7(4): 263-273. [本文引用:5]
[6] Ryan RP, Fouhy Y, Dow JM. Cyclic di-GMP signaling in bacteria: recent advances and new puzzles[J]. J Bacteriol, 2006, 188: 8327-8334. [本文引用:1]
[7] Seshasayee AS, Fraser GM, Luscombe NM. Comparative genomics of cyclic-di-GMP signaling in bacteria: post-translational regulation and catalytic activity[J]. Nucleic Acids Res, 2010, 38(18): 5970-5981. [本文引用:2]
[8] Jenal U, Malone J. Mechanisms of cyclic-di-GMP signaling in bacteria[J]. Annu Rev Genet, 2006, 40: 385-407. [本文引用:2]
[9] Cotter PA, Stibitz S. c-di-GMP-mediated regulation of virulence and biofilm formation[J]. Curr Opin Microbiol, 2007, 10(1): 17-23. [本文引用:1]
[10] Zhulin IB, Nikolskaya AN, Galperin MY. Common extracellular sensory domains in transmembrane receptors for diverse signal transduction pathways in bacteria and archaea[J]. J Bacteriol, 2003, 185(1): 285-294. [本文引用:1]
[11] Ho YS, Burden LM, Hurley JH. Structure of the GAF domain, a ubiquitous signaling motif and a new class of cyclic GMP receptor[J]. EMBO J, 2000, 19(20): 5288-5299. [本文引用:1]
[12] Schmidt AJ, Ryjenkov DA, Gomelsky M. The ubiquitous protein domain EAL is a cyclic diguanylate specific phosphodiesterase: enzymatically active and inactive EAL domains[J]. J Bacteriol, 2005, 187: 4774-4781. [本文引用:1]
[13] Tal R, Wong HC, Calhoon R, et al. Three cdg operons control cellular turnover of cyclic di-GMP in Acetobacter xylinum: genetic organization and occurrence of conserved domains in isoenzymes[J]. J Bacteriol, 1998, 180(17): 4416-4425. [本文引用:1]
[14] Galperin MY. Diversity of structure and function of response regulator output domains[J]. Cuur Opin Microbiol, 2010, 13(2): 150-159. [本文引用:1]