蛋白质分子设计

蛋白质的分子设计就是为有目的的蛋白质工程改造提供设计方案。虽然经过漫长岁月的进化,自然界已经筛选出了数量众多、种类各异的蛋白质,但天然蛋白质只是在自然条件下才能起到最佳功能,在人造条件下往往就不行,例如工业生产中常见的高温高压条件。因而需要对蛋白质进行改造,使其能够在特定条件下起到特定的功能。蛋白质的分子设计又可按照改造部位的多寡分为三类:第一类为“小改”,可通过定位突变或化学修饰来实现;第二类为“中改”,对来源于不同蛋白的结构域进行拼接组装;第三类为“大改”,即完全从头设计全新的蛋白质(de novo design )。有关全新蛋白质设计的内容请参见文献,本文不赘述。

常见的蛋白质工程改造包括提高蛋白的热、酸稳定性,增加活性,降低副作用,提高专一性以及通过蛋白质工程手段进行结构-功能关系研究等。由于对蛋白质结构-功能关系的了解不够深入,成功的实例还不很多,因此更需要在蛋白质分子设计的方法学上开展深入研究。

蛋白质的分子设计可分为两个层次,一种是在已知立体结构基础上所进行的直接将立体结构信息与蛋白质的功能相关联的高层次的设计工作,另一种是在未知立体结构的情形下借助于一级结构的序列信息及生物化学性质所进行的分子设计工作。此处只探讨第一类分子设计,因为在利用三级结构信息的同时也运用了一级结构序列及有关生化信息,第一类的分子设计工作实际上已包含了第二类工作,而后者实际上是在不得已的情形下所进行的努力。

蛋白质分子设计的过程简单说来就是首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。一般的分子设计工作可以按以下五个步骤进行:

(1)建立所研究蛋白质的结构模型,可以通过X 射线晶体学、二维核磁共振等测定结构,也可以根据类似物的结构或其他结构预测方法建立起结构模型。

(2)找出对所要求的性质有重要影响的位置。同一家族中的蛋白质的序列对比、分析往往是一种有效的途径。需要认真考虑此种性质受哪些因素的影响,然后逐一对各因素进行分析,找出重要位点,这是分子设计工作的关键。

(3)选择一系列的在(2)中所选出位点上改变残基所得到的突变体,一方面使蛋

白质可能具有所要求的性质,另一方面又尽量维持原有结构,使其不做大的变动。尽量在同源结构中此位点已有的氨基酸残基序列中进行选择,同时考虑残基的体积、疏水性等性质的变化所带来的影响。

(4)预测突变体的结构。

(5)定性或定量计算优化所得到的突变体结构是否具有所要求的性质。能否成功地进行分子设计,除了要求有好的计算机软件和高质量的力场以外,还要求工作者有一个坚实的结构化学和物理化学基础,同时对所研究的问题有一个深入细致的了解。

要 蛋白质工程是生物技术专业的一门专业课,是四大生物工程之一。蛋白质分子设计贯穿于蛋白质工程的整个过程,是蛋白质工程的重要组成部分和中心环节。蛋白质分子设计是理论和实验并重并交叉进行的循环。本文在简要介绍蛋

白质分子设计理念和分类的基础上,以Paracelsus 挑战为范例,对蛋白质分子设计原则、方法和过程进行了初步的论述。

关键词 蛋白质工程 蛋白质分子设计 Paracelsus挑战

中图分类号:G642.3 文献标识码:A 文章编号:1818-6539(2009)07-(0050)-(03)

蛋白质是一切生命的物质基础,是机体细胞的重要组成部分。经过漫长岁月的进化,自然界已经筛选出了数量众多、种类各异的蛋白质,但天然蛋白质只是在适宜的生理条件下才能很好的发挥功能,在其他条件下,例如工业生产中常见的高温高压条件,往往不能正常发挥功能。因而需要对蛋白质进行改造,使其能够在特定条件下发挥功能。定点突变和PCR 技术的发展使这种改造成为可能。20世纪80年代初,蛋白质工程和蛋白质分子设计应运而生。蛋白质工程是以结构生物学与生物信息学为基础,以创造性能更适用的蛋白质分子为目的,以基因重组技术为主要手段,对天然蛋白质分子进行设计和改造[1]。蛋白质分子设计则是指从头设计新的蛋白质分子或者在蛋白质已知结构的基础上通过适宜的改变来制备新的蛋白质分子。蛋白质的分子设计可分为两个层次:一种是在已知立体结构基础上所进行的直接将立体结构信息与蛋白质的功能相关联的高层次的设计工作;另一种是在未知立体结构的情形下借助于一级结构的序列信息及生物化学性质所进行的分子设计工作。蛋白质的分子设计又可按照改造部位的多寡分为三类:第一类为“小改”,即对已知结构的蛋白质进行少数几个残基的修饰、替换或删除等,可通过定位突变或化学修饰来实现;第二类为“中改”,对来源于不同蛋白的结构域进行裁剪拼接组装;第三类为“大改”,即完全从头设计全新的蛋白质(de novo design)[2]。

蛋白质分子设计的过程简单说来就是首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。所以蛋白质分子设计是在计算机模拟的基础上构建突变基因,进而获得突变蛋白质产品,然后进行功能验证。没有

达到目标就再次循环。因此蛋白质分子设计是理论和实验并重并交叉进行的循环。

常见的蛋白质工程改造包括提高蛋白的热、酸稳定性,增加活性,降低副作用,提高专一性以及通过蛋白质工程手段进行结构-功能关系研究等。由于对蛋白质结构-功能关系的了解不够深入,成功的实例还不是很多,因此更需要在蛋白质分子设计的方法学上开展深入研究。

1994年,Rose 在protein folding: predicting predicting这一篇展望中预测在下一个10年内可以解决通过蛋白质一级序列预测蛋白质三维结构的结论[3]。虽然这个结论并没有实现,可是他在这篇展望中提出的一个挑战却引起了关注并很快被完成[4]。这就是以16世纪瑞士名医Paracelsus (帕拉切尔苏斯)命名的Paracelsus 挑战。

帕拉切尔苏斯(1493~1541),原名菲利普斯·奥雷奥卢斯·特奥夫拉斯图斯·邦巴斯特·冯·霍恩海姆(Philippus Aureolus Bombastus von Hohenheim),16世纪瑞士有名的医学家,他自己取名帕拉切尔苏斯(意为赛过1世纪罗马名医切尔苏斯)。发现并使用多种新药,促进了药物化学的发展。他对现代医学,尤其是精神病治疗的兴起都做出了贡献,提出了剂量决定是否为毒药的著名理论。

同源蛋白质或者具有相似氨基酸组成和序列长度的蛋白质一般具有相似的空间结构。但是却有一些具有相似氨基酸组成和序列长度的蛋白质具有不同的折叠结构—如核酸酶和溶菌酶。所以通过选择改变少部分适宜残基的途径改变蛋白质的构象。Paracelsus 挑战的内容就是要求在不改变一个球蛋白50%序列的前提下把其从一种构象转换为另一种构象[3]。因帕拉塞尔苏斯曾经说过:所有的物质都是毒药,所有的物质都不是毒药,唯一的区别是它们的剂量(All substances are poisons:there is none which is not a poison. The right dose differentiates a poison and a remedy)。所以这个挑战命名为Paracelsus 挑战。

Paracelsus 挑战提出以后,有三个实验小组应对这一挑战分别设计了三个结构转换的实验,这三个蛋白分别命名为Paracelsin-43、Crotein-G 、

Janus[5,6,7,8]。这三个蛋白的命名都很有意思,而且它们的设计都涉及到两种蛋白质基本结构--α-helices 和β-sheets 的相互转换。

1996年,Jones 报道了第一个应对Paracelsus 挑战的蛋白--Paracelsin-43, 这个名字很简单,顾名思义,就是奔着Paracelsus 挑战来的。因为这个蛋白由43AA 组成,所以命名为Paracelsin-43。

Paracelsin-43是利用蛋白质反向折叠的方法通过从头结构设计获得的。进行这个从头设计的时候考虑了两个方面,一个是采用短片段,这是当时固相合成多肽技术水平的限制所决定;另一个是采用两个易于区别的二级结构-全α-helix 和全β-sheet 结构,这样利于随后的检测。

首先从蛋白质数据库(protein data bank, PDB)中选择合适的蛋白-要求是长度<45AA ,只有全α和全β结构,这个条件是非常严格的,当时它们就只找到了一对蛋白。第一个蛋白是BDS-1,它是一种抗高血压和抗病毒的蛋白,43AA ,全β-sheet 结构,是一个小的含有3个二硫键的反向平行β-sheet 的结构;第二个蛋白质是与葡萄球菌免疫蛋白结合的蛋白A 的B 结构域。蛋白A 的B 结构域共有58AA ,是一个4螺旋捆,但是当只有前43个氨基酸时,X-射线晶体衍射表明最后一个螺旋被删除,而第三个螺旋也不会形成,所以形成了只有两个螺旋的结构。

然后以BDS-1为模板,以蛋白A 的43AA 片段的结构为目标。仅通过算法设计了一段具有43个氨基酸残基的序列,这段序列与BDS-1有53.5%的相同,与目标蛋白质有16.3%的相同。算法表明原蛋白有26%β-sheet, 没有α-helix ;而设计蛋白中58%α-helix ,没有β-sheet 。序列设计后通过固相合成,HPLC 纯化,质谱检测。

pH6.5时,Paracelsin-43没有完全的二级结构,只有<2%的α-helix ,pH4.5时有11%的α-helix 。加乙二醇,降温,从50℃至﹣70℃,α-helix 从2%升到15%;用水/甲醇作溶剂更好,α-helix 50℃有32%,﹣42℃有54%,但都有35%β-sheet 结构。结构检测表明Paracelsin-43并没有完成

Paracelsus 挑战的设计目标。

本设计失败的主要原因是第二遗传密码的简并性造成的--当两个蛋白氨基酸序列具有超过30%同源性的时候,一般就会具有相似的三维结构。而具有相似三维结构的氨基酸序列长度不同则对同源性的要求也不同。长片段对同源性的要求低,短片段对同源性的要求高。当氨基酸长度>80AA ,要求同源性>26%,而氨基酸长度是43AA 时,则至少要求具有35%的同源性。本设计中要求具有53%同源性而具有不同的结构在氨基酸长度较短时是比较困难的。使用具有更长氨基酸片段的蛋白成功的可能性更大。长片段氨基酸就不再适合用固相合成的方法,用分子生物学的方法更适宜。

Crotein-G 是Yuan 与1998年报道的针对Paracelsus 挑战的蛋白质。因为分别直接采用了434Cro 蛋白的序列和protein-G 的序列,就像一个二者的杂合体,所以命名为Crotein-G 。其中434Cro 蛋白原有71AA 组成,但只有具有前65AA 的多肽的晶体结构被测定,表现为4个α-helix 的结构。而protein-G 则含有56AA ,表现为通过一个α-helix 连接的两个反向平行的β-sheet 。因为Crotein-G 是以protein-G 为目标,所以设计时也确定为56AA 。

设计原则是首先选择所有434Cro 蛋白与protein-G 具有不间断的同源性中具有最多AA 的比对,其中二者具有相同氨基酸最多可为7个。然后这7个氨基酸作为Crotein-G 的首先被确定的残基。还要在模板--Cro 蛋白剩余的49个残基中改变28个。第二类Crotein-G 的残基是通过氨基酸残基的极性来确定的,要求残基的极性与protein-G 相同而与434Cro 蛋白不同。需要改变的残基共有11个,分别是E3Y ,K6I ,K7L ,R9G ,K26A ,I30F ,E34A ,K39V ,F43W ,N52F 和D54V 。第三类残基要求适应protein-G 的疏水内核,有8个

氨基酸残基需要改变,分别是M14G ,L19E ,I33Y ,P41G ,I47D ,A50K ,L51T 和C53T 。现已改变了19(11+8)个氨基酸残基,还需改变9(28-19)个残基。最后检查剩余的30(49-19)个残基对稳定性和折叠的贡献,重点选取可能对protein-G 和434Cro 蛋白稳定能量差异最大的位置。通过考虑主链的扭角、侧链间的相互作用、侧链和主链间的相互作用以及二级结构的可能性确定了最后的9个残基。

通过合成6个69bp 的核苷酸片段,然后通过激酶激活,退火、连接得到设计的207bp 的核苷酸序列。进而通过基因克隆、原核表达、蛋白纯化等步骤获得目的蛋白Crotein-G 。

在制备Crotein-G 的基础上,他们进而合成了ZCrotein-G 。ZCrotein-G 是通过定点突变的方法在Crotein-G 上引入潜在的金属结合位点(H16,H18,H30和C33) 。这几个位点都与434Cro 蛋白不同,所以改变的氨基酸总数不变,仍然符合Paracelsus 挑战的要求。

圆二色光谱检测表明,在低浓度(2.6µm)并且含有20%TFE 时ZCrotein-G 的结构与434Cro 蛋白不同而与protein-G 的突变体Z β1相似;但是高浓度下(10-40µm)或者TFE 不存在时,蛋白质发生聚集沉淀而使有序结构减少。蛋白质聚集的直接原因是因为蛋白没有形成一个很好的内核。而内核的形成是蛋白质正确折叠的关键因素。

Crotein-G 的设计并没有采用从头设计的方法,而是在氨基酸极性、疏水内核的形成,残基对稳定性和折叠的贡献等方面综合考虑434Cro 和protein-G 的不同,直接采用二者之一的氨基酸序列。通过分子生物学的方法,通过基因克隆、原核表达、蛋白纯化等步骤获得目的蛋白。设计的主要缺陷是只能从二者的氨基酸中选取,造成目标蛋白没有形成一个很好的疏水内核。综合来说,Crotein-G 并没有形成具有稳定结构的蛋白质,离Paracelsus 挑战的要求仍然相去甚远。

真正符合Paracelsus 挑战的是第三个名为Janus 的蛋白的设计。Janus (杰纳斯)是罗马神话中的天门神,早晨打开天门,让阳光普照人间,晚上又把天门关上,使黑暗降临大地。他的头部前后各有一副面孔,同时看着两个不同方向,一副看着过去,一副看着未来,因此也称两面神,或被尊称为时间之神。而Janus 蛋白命名的含义包括两个方面,第一个指它的两面性,即α-helix 和β-sheet 两种不同结构之间的转换;另一个意思则是打开了一扇门,暗示开创了一个新的局面。

Janus 是以protein-G (56AA ,表现为通过一个α-helix 连接的两个反向平行的β-sheet )为模板,准备转换为4螺旋捆的Rop 蛋白。这是因为在当时对α-helix 形成机制的研究远远领先于对β-sheet 的形成机制的研究。

Janus 设计理念是综合考虑残基的短程和长程相互作用,protein-G 中倾向于形成α-helix 的残基不变而倾向于形成β-sheet 的残基则替换成倾向于形成α-helix 的残基。形成α-helix 捆的a,d 位的残基设计为疏水残基,而在Rop 蛋白中形成盐桥的Arg16和Asp46也引入到Janus 中。为了形成Rop 蛋白中相似的电荷分布,在1/1’引入中性和正电荷而在2/2’引入负电荷。最后在49位引入Tyr 来与Rop 蛋白相同并利于随后折叠的检测。通过核苷酸片段合成,原核表达并纯化蛋白。

圆二色光谱检测表明Janus 的二级结构和以β-sheet 为主的protein-G 差别明显而与以α-helix 为主的Rop 蛋白非常相似。核磁共振也表明Janus 和Rop 蛋白具有相似的结构。通过改变不超过50%的氨基酸残基使蛋白从以β-sheet 为主改变为以α-helix 为主,Janus 完全满足了Paracelsus 挑战的要求。

应对Paracelsus 挑战的要求,研究者们用不同的思路(从α-helix 到β-sheet 和从β-sheet 到α-helix )、不同的设计方法(从头设计的方法和基于已知蛋白结构的方法),不同的实验方法(固相合成和基因重组),不同的侧重点

(疏水内核,氨基酸极性,短程和长程相互作用,折叠的稳定性)设计并获得了不同程度满足Paracelsus 挑战要求的蛋白质。这些经验和教训都对蛋白质分子设计的发展起到了很大的促进作用[9]。

蛋白质分子设计是一个难度极大却又引人入胜的研究领域。通过蛋白质分子设计既可能得到自然界不存在的具有全新结构和功能的蛋白质,又是检验蛋白质折叠理论和研究蛋白质折叠规律的重要手段。但由于我们对蛋白质折叠规律即蛋白质设计的理论基础的认识还不够,蛋白质分子设计还处于探索阶段。目前还没有通过蛋白质分子设计得到既具有所希望的结构和功能又具有重要应用价值的全新蛋白质。但蛋白质分子设计在算法、组合化学方法及基于蛋白质的高分子材料等方面已取得显著的进展。随着对蛋白质折叠规律认识的加强和设计经验的积累,蛋白质分子设计将会有一个新的突破,从而更好的为人类服务。

蛋白质的分子设计就是为有目的的蛋白质工程改造提供设计方案。虽然经过漫长岁月的进化,自然界已经筛选出了数量众多、种类各异的蛋白质,但天然蛋白质只是在自然条件下才能起到最佳功能,在人造条件下往往就不行,例如工业生产中常见的高温高压条件。因而需要对蛋白质进行改造,使其能够在特定条件下起到特定的功能。蛋白质的分子设计又可按照改造部位的多寡分为三类:第一类为“小改”,可通过定位突变或化学修饰来实现;第二类为“中改”,对来源于不同蛋白的结构域进行拼接组装;第三类为“大改”,即完全从头设计全新的蛋白质(de novo design )。有关全新蛋白质设计的内容请参见文献,本文不赘述。

常见的蛋白质工程改造包括提高蛋白的热、酸稳定性,增加活性,降低副作用,提高专一性以及通过蛋白质工程手段进行结构-功能关系研究等。由于对蛋白质结构-功能关系的了解不够深入,成功的实例还不很多,因此更需要在蛋白质分子设计的方法学上开展深入研究。

蛋白质的分子设计可分为两个层次,一种是在已知立体结构基础上所进行的直接将立体结构信息与蛋白质的功能相关联的高层次的设计工作,另一种是在未知立体结构的情形下借助于一级结构的序列信息及生物化学性质所进行的分子设计工作。此处只探讨第一类分子设计,因为在利用三级结构信息的同时也运用了一级结构序列及有关生化信息,第一类的分子设计工作实际上已包含了第二类工作,而后者实际上是在不得已的情形下所进行的努力。

蛋白质分子设计的过程简单说来就是首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。一般的分子设计工作可以按以下五个步骤进行:

(1)建立所研究蛋白质的结构模型,可以通过X 射线晶体学、二维核磁共振等测定结构,也可以根据类似物的结构或其他结构预测方法建立起结构模型。

(2)找出对所要求的性质有重要影响的位置。同一家族中的蛋白质的序列对比、分析往往是一种有效的途径。需要认真考虑此种性质受哪些因素的影响,然后逐一对各因素进行分析,找出重要位点,这是分子设计工作的关键。

(3)选择一系列的在(2)中所选出位点上改变残基所得到的突变体,一方面使蛋

白质可能具有所要求的性质,另一方面又尽量维持原有结构,使其不做大的变动。尽量在同源结构中此位点已有的氨基酸残基序列中进行选择,同时考虑残基的体积、疏水性等性质的变化所带来的影响。

(4)预测突变体的结构。

(5)定性或定量计算优化所得到的突变体结构是否具有所要求的性质。能否成功地进行分子设计,除了要求有好的计算机软件和高质量的力场以外,还要求工作者有一个坚实的结构化学和物理化学基础,同时对所研究的问题有一个深入细致的了解。

要 蛋白质工程是生物技术专业的一门专业课,是四大生物工程之一。蛋白质分子设计贯穿于蛋白质工程的整个过程,是蛋白质工程的重要组成部分和中心环节。蛋白质分子设计是理论和实验并重并交叉进行的循环。本文在简要介绍蛋

白质分子设计理念和分类的基础上,以Paracelsus 挑战为范例,对蛋白质分子设计原则、方法和过程进行了初步的论述。

关键词 蛋白质工程 蛋白质分子设计 Paracelsus挑战

中图分类号:G642.3 文献标识码:A 文章编号:1818-6539(2009)07-(0050)-(03)

蛋白质是一切生命的物质基础,是机体细胞的重要组成部分。经过漫长岁月的进化,自然界已经筛选出了数量众多、种类各异的蛋白质,但天然蛋白质只是在适宜的生理条件下才能很好的发挥功能,在其他条件下,例如工业生产中常见的高温高压条件,往往不能正常发挥功能。因而需要对蛋白质进行改造,使其能够在特定条件下发挥功能。定点突变和PCR 技术的发展使这种改造成为可能。20世纪80年代初,蛋白质工程和蛋白质分子设计应运而生。蛋白质工程是以结构生物学与生物信息学为基础,以创造性能更适用的蛋白质分子为目的,以基因重组技术为主要手段,对天然蛋白质分子进行设计和改造[1]。蛋白质分子设计则是指从头设计新的蛋白质分子或者在蛋白质已知结构的基础上通过适宜的改变来制备新的蛋白质分子。蛋白质的分子设计可分为两个层次:一种是在已知立体结构基础上所进行的直接将立体结构信息与蛋白质的功能相关联的高层次的设计工作;另一种是在未知立体结构的情形下借助于一级结构的序列信息及生物化学性质所进行的分子设计工作。蛋白质的分子设计又可按照改造部位的多寡分为三类:第一类为“小改”,即对已知结构的蛋白质进行少数几个残基的修饰、替换或删除等,可通过定位突变或化学修饰来实现;第二类为“中改”,对来源于不同蛋白的结构域进行裁剪拼接组装;第三类为“大改”,即完全从头设计全新的蛋白质(de novo design)[2]。

蛋白质分子设计的过程简单说来就是首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。所以蛋白质分子设计是在计算机模拟的基础上构建突变基因,进而获得突变蛋白质产品,然后进行功能验证。没有

达到目标就再次循环。因此蛋白质分子设计是理论和实验并重并交叉进行的循环。

常见的蛋白质工程改造包括提高蛋白的热、酸稳定性,增加活性,降低副作用,提高专一性以及通过蛋白质工程手段进行结构-功能关系研究等。由于对蛋白质结构-功能关系的了解不够深入,成功的实例还不是很多,因此更需要在蛋白质分子设计的方法学上开展深入研究。

1994年,Rose 在protein folding: predicting predicting这一篇展望中预测在下一个10年内可以解决通过蛋白质一级序列预测蛋白质三维结构的结论[3]。虽然这个结论并没有实现,可是他在这篇展望中提出的一个挑战却引起了关注并很快被完成[4]。这就是以16世纪瑞士名医Paracelsus (帕拉切尔苏斯)命名的Paracelsus 挑战。

帕拉切尔苏斯(1493~1541),原名菲利普斯·奥雷奥卢斯·特奥夫拉斯图斯·邦巴斯特·冯·霍恩海姆(Philippus Aureolus Bombastus von Hohenheim),16世纪瑞士有名的医学家,他自己取名帕拉切尔苏斯(意为赛过1世纪罗马名医切尔苏斯)。发现并使用多种新药,促进了药物化学的发展。他对现代医学,尤其是精神病治疗的兴起都做出了贡献,提出了剂量决定是否为毒药的著名理论。

同源蛋白质或者具有相似氨基酸组成和序列长度的蛋白质一般具有相似的空间结构。但是却有一些具有相似氨基酸组成和序列长度的蛋白质具有不同的折叠结构—如核酸酶和溶菌酶。所以通过选择改变少部分适宜残基的途径改变蛋白质的构象。Paracelsus 挑战的内容就是要求在不改变一个球蛋白50%序列的前提下把其从一种构象转换为另一种构象[3]。因帕拉塞尔苏斯曾经说过:所有的物质都是毒药,所有的物质都不是毒药,唯一的区别是它们的剂量(All substances are poisons:there is none which is not a poison. The right dose differentiates a poison and a remedy)。所以这个挑战命名为Paracelsus 挑战。

Paracelsus 挑战提出以后,有三个实验小组应对这一挑战分别设计了三个结构转换的实验,这三个蛋白分别命名为Paracelsin-43、Crotein-G 、

Janus[5,6,7,8]。这三个蛋白的命名都很有意思,而且它们的设计都涉及到两种蛋白质基本结构--α-helices 和β-sheets 的相互转换。

1996年,Jones 报道了第一个应对Paracelsus 挑战的蛋白--Paracelsin-43, 这个名字很简单,顾名思义,就是奔着Paracelsus 挑战来的。因为这个蛋白由43AA 组成,所以命名为Paracelsin-43。

Paracelsin-43是利用蛋白质反向折叠的方法通过从头结构设计获得的。进行这个从头设计的时候考虑了两个方面,一个是采用短片段,这是当时固相合成多肽技术水平的限制所决定;另一个是采用两个易于区别的二级结构-全α-helix 和全β-sheet 结构,这样利于随后的检测。

首先从蛋白质数据库(protein data bank, PDB)中选择合适的蛋白-要求是长度<45AA ,只有全α和全β结构,这个条件是非常严格的,当时它们就只找到了一对蛋白。第一个蛋白是BDS-1,它是一种抗高血压和抗病毒的蛋白,43AA ,全β-sheet 结构,是一个小的含有3个二硫键的反向平行β-sheet 的结构;第二个蛋白质是与葡萄球菌免疫蛋白结合的蛋白A 的B 结构域。蛋白A 的B 结构域共有58AA ,是一个4螺旋捆,但是当只有前43个氨基酸时,X-射线晶体衍射表明最后一个螺旋被删除,而第三个螺旋也不会形成,所以形成了只有两个螺旋的结构。

然后以BDS-1为模板,以蛋白A 的43AA 片段的结构为目标。仅通过算法设计了一段具有43个氨基酸残基的序列,这段序列与BDS-1有53.5%的相同,与目标蛋白质有16.3%的相同。算法表明原蛋白有26%β-sheet, 没有α-helix ;而设计蛋白中58%α-helix ,没有β-sheet 。序列设计后通过固相合成,HPLC 纯化,质谱检测。

pH6.5时,Paracelsin-43没有完全的二级结构,只有<2%的α-helix ,pH4.5时有11%的α-helix 。加乙二醇,降温,从50℃至﹣70℃,α-helix 从2%升到15%;用水/甲醇作溶剂更好,α-helix 50℃有32%,﹣42℃有54%,但都有35%β-sheet 结构。结构检测表明Paracelsin-43并没有完成

Paracelsus 挑战的设计目标。

本设计失败的主要原因是第二遗传密码的简并性造成的--当两个蛋白氨基酸序列具有超过30%同源性的时候,一般就会具有相似的三维结构。而具有相似三维结构的氨基酸序列长度不同则对同源性的要求也不同。长片段对同源性的要求低,短片段对同源性的要求高。当氨基酸长度>80AA ,要求同源性>26%,而氨基酸长度是43AA 时,则至少要求具有35%的同源性。本设计中要求具有53%同源性而具有不同的结构在氨基酸长度较短时是比较困难的。使用具有更长氨基酸片段的蛋白成功的可能性更大。长片段氨基酸就不再适合用固相合成的方法,用分子生物学的方法更适宜。

Crotein-G 是Yuan 与1998年报道的针对Paracelsus 挑战的蛋白质。因为分别直接采用了434Cro 蛋白的序列和protein-G 的序列,就像一个二者的杂合体,所以命名为Crotein-G 。其中434Cro 蛋白原有71AA 组成,但只有具有前65AA 的多肽的晶体结构被测定,表现为4个α-helix 的结构。而protein-G 则含有56AA ,表现为通过一个α-helix 连接的两个反向平行的β-sheet 。因为Crotein-G 是以protein-G 为目标,所以设计时也确定为56AA 。

设计原则是首先选择所有434Cro 蛋白与protein-G 具有不间断的同源性中具有最多AA 的比对,其中二者具有相同氨基酸最多可为7个。然后这7个氨基酸作为Crotein-G 的首先被确定的残基。还要在模板--Cro 蛋白剩余的49个残基中改变28个。第二类Crotein-G 的残基是通过氨基酸残基的极性来确定的,要求残基的极性与protein-G 相同而与434Cro 蛋白不同。需要改变的残基共有11个,分别是E3Y ,K6I ,K7L ,R9G ,K26A ,I30F ,E34A ,K39V ,F43W ,N52F 和D54V 。第三类残基要求适应protein-G 的疏水内核,有8个

氨基酸残基需要改变,分别是M14G ,L19E ,I33Y ,P41G ,I47D ,A50K ,L51T 和C53T 。现已改变了19(11+8)个氨基酸残基,还需改变9(28-19)个残基。最后检查剩余的30(49-19)个残基对稳定性和折叠的贡献,重点选取可能对protein-G 和434Cro 蛋白稳定能量差异最大的位置。通过考虑主链的扭角、侧链间的相互作用、侧链和主链间的相互作用以及二级结构的可能性确定了最后的9个残基。

通过合成6个69bp 的核苷酸片段,然后通过激酶激活,退火、连接得到设计的207bp 的核苷酸序列。进而通过基因克隆、原核表达、蛋白纯化等步骤获得目的蛋白Crotein-G 。

在制备Crotein-G 的基础上,他们进而合成了ZCrotein-G 。ZCrotein-G 是通过定点突变的方法在Crotein-G 上引入潜在的金属结合位点(H16,H18,H30和C33) 。这几个位点都与434Cro 蛋白不同,所以改变的氨基酸总数不变,仍然符合Paracelsus 挑战的要求。

圆二色光谱检测表明,在低浓度(2.6µm)并且含有20%TFE 时ZCrotein-G 的结构与434Cro 蛋白不同而与protein-G 的突变体Z β1相似;但是高浓度下(10-40µm)或者TFE 不存在时,蛋白质发生聚集沉淀而使有序结构减少。蛋白质聚集的直接原因是因为蛋白没有形成一个很好的内核。而内核的形成是蛋白质正确折叠的关键因素。

Crotein-G 的设计并没有采用从头设计的方法,而是在氨基酸极性、疏水内核的形成,残基对稳定性和折叠的贡献等方面综合考虑434Cro 和protein-G 的不同,直接采用二者之一的氨基酸序列。通过分子生物学的方法,通过基因克隆、原核表达、蛋白纯化等步骤获得目的蛋白。设计的主要缺陷是只能从二者的氨基酸中选取,造成目标蛋白没有形成一个很好的疏水内核。综合来说,Crotein-G 并没有形成具有稳定结构的蛋白质,离Paracelsus 挑战的要求仍然相去甚远。

真正符合Paracelsus 挑战的是第三个名为Janus 的蛋白的设计。Janus (杰纳斯)是罗马神话中的天门神,早晨打开天门,让阳光普照人间,晚上又把天门关上,使黑暗降临大地。他的头部前后各有一副面孔,同时看着两个不同方向,一副看着过去,一副看着未来,因此也称两面神,或被尊称为时间之神。而Janus 蛋白命名的含义包括两个方面,第一个指它的两面性,即α-helix 和β-sheet 两种不同结构之间的转换;另一个意思则是打开了一扇门,暗示开创了一个新的局面。

Janus 是以protein-G (56AA ,表现为通过一个α-helix 连接的两个反向平行的β-sheet )为模板,准备转换为4螺旋捆的Rop 蛋白。这是因为在当时对α-helix 形成机制的研究远远领先于对β-sheet 的形成机制的研究。

Janus 设计理念是综合考虑残基的短程和长程相互作用,protein-G 中倾向于形成α-helix 的残基不变而倾向于形成β-sheet 的残基则替换成倾向于形成α-helix 的残基。形成α-helix 捆的a,d 位的残基设计为疏水残基,而在Rop 蛋白中形成盐桥的Arg16和Asp46也引入到Janus 中。为了形成Rop 蛋白中相似的电荷分布,在1/1’引入中性和正电荷而在2/2’引入负电荷。最后在49位引入Tyr 来与Rop 蛋白相同并利于随后折叠的检测。通过核苷酸片段合成,原核表达并纯化蛋白。

圆二色光谱检测表明Janus 的二级结构和以β-sheet 为主的protein-G 差别明显而与以α-helix 为主的Rop 蛋白非常相似。核磁共振也表明Janus 和Rop 蛋白具有相似的结构。通过改变不超过50%的氨基酸残基使蛋白从以β-sheet 为主改变为以α-helix 为主,Janus 完全满足了Paracelsus 挑战的要求。

应对Paracelsus 挑战的要求,研究者们用不同的思路(从α-helix 到β-sheet 和从β-sheet 到α-helix )、不同的设计方法(从头设计的方法和基于已知蛋白结构的方法),不同的实验方法(固相合成和基因重组),不同的侧重点

(疏水内核,氨基酸极性,短程和长程相互作用,折叠的稳定性)设计并获得了不同程度满足Paracelsus 挑战要求的蛋白质。这些经验和教训都对蛋白质分子设计的发展起到了很大的促进作用[9]。

蛋白质分子设计是一个难度极大却又引人入胜的研究领域。通过蛋白质分子设计既可能得到自然界不存在的具有全新结构和功能的蛋白质,又是检验蛋白质折叠理论和研究蛋白质折叠规律的重要手段。但由于我们对蛋白质折叠规律即蛋白质设计的理论基础的认识还不够,蛋白质分子设计还处于探索阶段。目前还没有通过蛋白质分子设计得到既具有所希望的结构和功能又具有重要应用价值的全新蛋白质。但蛋白质分子设计在算法、组合化学方法及基于蛋白质的高分子材料等方面已取得显著的进展。随着对蛋白质折叠规律认识的加强和设计经验的积累,蛋白质分子设计将会有一个新的突破,从而更好的为人类服务。


相关内容

  • 生物信息学的主要研究开发内容
  • 2004-10-13 00:00:00   来源:基因潮 点击数:   评论:0   我要评论 基因组包含了构成和维持一个生活有机体所必备的基本信息,由细胞内进行的多种分子生物学反应将这些信息转化为真正的生命现象.基因组的一部分编码蛋白质和RNA,其它部分调控这些大分子的表达.表达的蛋白质及RNA折 ...

  • 蛋白质与酶工程期中考试模拟试题
  • 蛋白质与酶工程期中考试模拟试题 生物工程三班 一. 名词解释(每题2分,共20分) 1. PDB : 2. DNA 改组: 3. 化学修饰: 4. 蛋白质工程(Protein Engineering): 5. 分子设计: 6. 定点突变技术: 7. 熔球态 (melton globule) : 8. ...

  • 高一生物[蛋白质的结构和功能]
  • 蛋白质的结构和功能教案 [教学目标] 1.基础目标:概述蛋白质的结构和功能,说明生物大分子以碳链为骨架. 2.能力目标:初步学会鉴定物质的科学实验方法,说明.分析.总结实验教 材的选取原则:通过对氨基酸脱水缩合过程的分析,培养逻辑 推理能力:经历知识的发生发展过程,积极思维,尝试进行科 学探究.收集 ...

  • 蛋白质的功能域.结构及其药物设计----6
  • 第六章 蛋白质的功能域.结构及其药物设计 随着人类基因组全序列测定的完成,预示着基因组研究从结构基因组(Structural Genomics)进入了功能基因组(Functional Genomics)研究时代.研究基因组功能当然首先要研究基因表达的模式.当前研究这一问题可以基于核酸技术,也可以基于 ...

  • 核算及蛋白质检测技术
  • 核酸的凝胶电泳: 1. 基本原理: 生物大分子在一定pH 条件下,通常会带电荷.将其放置到电场中,就会以一定的速度移向适当的电极.分子在电场作用下的迁移速度,与电场强度和电泳分子所携带的净电荷数成正比,与分子的摩擦系数成反比.摩擦系数是分子大小.极性及介质粘度的函数.根据分子大小.构型或形状的差异和 ...

  • 生物医用材料论文
  • 生物医用材料论文 学院:材料与化工学院 姓名:石玉姜 学号: 目录 1高分子医用材料简要介绍 1.1 定义 1.2高分子医用材料分类 1.2.1按可降解性分为 1.2.2按材料与活体组织的相互作用关系分类 1.2.3按成分组成不同分为 1.3高分子医用材料的特性 1.4医用高分子材料的条件 2医用高 ...

  • 半抗原的设计.修饰及人工抗原的制备
  • 第38卷 2010年8月 分析化学(FENX IHUAXUE) 评述与进展Ch i nese Journa l o f Ana l y ti ca l Chem istry 第8期1211~1218评述与进展 DO I :10. 3724/SP. J . 1096. 2010. 01211 半抗原的 ...

  • 常用生物信息学软件
  • 常用生物信息学软件简介 2007-7-1 一.基因芯片 1.基因芯片综合分析软件. ArrayVision 7.0 一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元. Arraypro 4.0 Media ...

  • 水分子通过细胞膜运输方式的探讨1
  • 水分子通过细胞膜运输方式的探讨 河北省永年县第二中学 (057151) 李富仓 摘要:通过分析教材,探讨水分子通过细胞膜时的运输方式是自由扩散还是协助扩散. 关键词:水分子 运输方式 在"第3节 物质跨膜运输的方式"的教学过程中,对水分子通过细胞膜时的运输方式是自由扩散还是协助扩 ...