ChapterChapter III III
Identification
ProteomicsProtein Identification in Proteinin
Preface
•蛋白质的鉴定是蛋白质组学研究的核心任务。‐为了发现和鉴定差异表达蛋白,需要进行蛋白质表达谱研究;
‐为了更好理解分子机制和信号通路,需要进行蛋白质翻译修饰和翻译后修饰谱的研究。翻译修饰和翻译后修饰谱的研究
•蛋白质组学研究中,由于蛋白质数量巨大,采取自动化的鉴定技术获得可靠的鉴定结果是十分必要的。‐将MS获得的蛋白质和肽段谱图与数据库中的蛋白质序列数据进行比对。这些MS图被称之为“指纹图”,代表每个蛋白质的独特属性,因此可用于蛋白质的鉴定。
•Source Species SourceSpecies(来源种类)
-显然不是识别蛋白质的重要特征,但可以将蛋白质数据库的范围限定在相关物种中的范围限定在相关物种中。
•ppI(等电点)
-变性蛋白质的pI是由N端氨基酸、C端氨基酸、翻译后修饰物以及其余氨基酸共同形成的。
•MW(分子质量)
-蛋白质的分子质量是蛋白质中所有氨基酸的质量以及翻译后修饰质量的综合。
•Partial Sequence or Sequence Tags (部分序列或序列标签)qqg
-
-
-
-任何氨基酸序列,即使仅仅几个氨基酸,也是非常特意性的信息。蛋白质分析鉴定也建立在这样一个基本事实上:大多数含有6个或6个以上氨基酸的肽序列在一个生物的蛋白质组中是唯是唯一的。的。如果可以得到定位于相同蛋白质的几个肽序列,可以增强匹配的准确性。分析蛋白质组学的本质是将蛋白质转换成肽分析蛋白质组学的本质是将蛋白质转换成肽、得到肽的得到肽的序列,然后根据数据库中的序列匹配来鉴定相关的蛋白质质。
•Amino Acid Composition (蛋白质氨基酸组成)p(蛋白质氨基酸组成)
-
-即蛋白质中含有的各种氨基酸的数目,通常用百分数来表示。很多研究小组利用强酸水解2-DE上的蛋白质,通过色谱方法分析产生的游离氨基酸来获取氨基酸组成的数据方法分析产生的游离氨基酸,来获取氨基酸组成的数据。然后通过AACompIdent软件分析来实现基于氨基酸组成的蛋白质鉴定。的蛋白质鉴定
生物质谱基础知识
(Fundamentals of Biological Mass Spectrometry)
同位素(Isotope)
•元素(Element)‐是一类原子的总称,它们都有相同的质子数但中子数可以不同子数,但中子数可以不同。
•核素(Nuclide)‐指一种原子,即有特定的质子数和中子数。•同位素(IsotopesIt)‐拥有同样的质子数但中子数不同的元素。
•单同位素元素(Mono isotopic elements)
–19F; 31P; 23Na;75As
•双同位素元素(Di‐isotopic elements)
–1H/2H; 12C/13C; 14N/15N; 35Cl/37Cl
•多同位素元素(Polyisotopicelements)
–大多数元素
质量定义(Definition of Mass)•原子质量单位(Unified atomic mass)
•1/12 of the mass of one 12C (Dalton/u/ amu)
•1 Dalton = 1.66055 X 10‐27kg
•1 Hydrogen = 1.00794 Da
•1 proton = 1.00728 Da
•1 neutron = 1.00867 Da
•1 electron = 1/1837 proton = 0.00055 Da
•同位素质量数(Isotopic mass)
•单个同位素的准确质量数
•平均质量数(Average mass)
•在某化合物中某元素的平均质量
•表征质量数(Nominal mass)
•元素整数质量数之和素整数质量数之
•Nominal mass of CO2= 12 u + 2 X 16 u = 44 u
质量分辨率(Mass
Resolution )
质量精确度(Mass Accuracy)•仪器测量值和理论计算值之间的差异–单位:
•相对值: part per millionll (ppm)()
•绝对值: dalton/amu, mmu
–如果精确度足够,测定一个生物分子的质量可以推出其分子式
蛋白质鉴定技术
(Protein Identification Technology)
•DNA测序
•蛋白质测序
•质谱测序
DNA测序(DNA Sequencing)
•根据已测定的部分氨基酸序列设计引物,扩增其mRNA,从而推断蛋白质的全序列技术。从而推断蛋白质的全序列技术‐对翻译后加工导致的氨基酸残基的修饰无能为力。
蛋白质测序(Protein Sequencing)
一、N端测序技术(Edman降解法)
‐蛋白质测序技术最具有意义的发展是瑞典化学家Edman发展的以他名字命名的蛋白质N端测序方法‐Edman降解.‐Edman降解堪称有机化学成功的经典,经过几十年研究,发现其偶联试剂‐异硫氰酸苯酯(PITC)(即Edman试剂)仍是最适用的。
‐EdmanEd降解是用化学方法从蛋白质的N端依次切下氨基酸残基,端依次切下氨基酸残基进行蛋白质序列测定的方法。是一个循环式的化学反应过程,包括3个主要化学步骤。
偶联(Coupling)偶pg) 环化裂解(化裂解Cleavage)g) 转化(Transformation)转化)
苯氨基硫甲酰
PTC‐肽
偶联
(Coupling)Cli)
转化
(Transformation) 环化裂解(Cleavage)
苯基乙内酰硫脲
PTH‐氨基酸噻唑啉酮苯胺(ATZ)衍生物
在Edman降解法的基础上,依据样品的处理方式和试剂输送
方式的不同出现了液相固相和气相蛋白质测定方法目前方式的不同出现了液相、固相和气相蛋白质测定方法。
大多采用固相和气相序列测定方法。
‐可以把蛋白质或多肽共价偶联到PVDF膜上,再进行序列分析避免冲洗使样品损失(固相)。析,避免冲洗使样品损失
近年来,应用自动化的Edman降解可产生短的N‐末端序列标
签,这是将质谱的序列标签概念用于Edman降解,业已成为一种强有力的蛋白质鉴定策略。
N‐端测序的重要性在于:
‐蛋白质和多肽的N端区域是非常重要的结构和功能部位。
亚细胞定位蛋白质的半衰期(N‐end亚细胞定位,蛋白质的半衰期(d rulel)、翻译后修饰等翻译后修饰等
‐通过N端测序有利于分析蛋白质的高级结构,揭示蛋白质的生物学功能。
‐由于蛋白质的N端序列特异性很高,通过N‐端测序可以对大多数蛋白质进行鉴定。
‐N端测序可以确定二硫键的位置、糖基化或磷酸化修饰的位点。端测序可以确定二硫键的位置糖基化或磷酸化修饰的位点不足:1.1 Edman测序不能解决N端封闭肽的测序问题。端封闭肽的测序问题
2. 需要的蛋白质或多肽的量较多,对样品纯度要
求高,反应时间长。
•N‐terminalil blockingblki can happenh ini vivoior duringdi purification.ifii An estimated 60‐70% of eukaryotic proteins are N‐terminally blocked in vivo, most usuallyy byy an acylyggroupp or cyclizationyof an N‐terminal glutamine residue to pyrrolidonecarboxylic acid (吡咯烷酮羧酸,PCA). Internal proteolysis from a gel slice and sequencing of the resulting peptides is the route of choice with blocked proteins.
Results of MCO3 N‐termino sequencing
Cycle#Cycle #
1
2
3
4
5Amino acids detected (pmoles)S (0.85) K (0.58) L (0.56) Q (0.46) P(0.48) W (?)L (0.40)N (0.18) E (0.09) Y (0.10) V (0.04)T (0.41) E (0.09) P (0.07) A (0.04)
Theoretical pI / Mw: 55.9090 / 72319.737231973 Fora
Theoretical pI / Mw: 5.86 / 71806.17 Forb
ab
MIVLRSHVLVLLGVPVVAYATRANAQSWLNTLLEQSNGTLDVSTFPGEQCLRECDNTQPRICHFSWTMEHYHVMGPACRDCAKGNHTDCYHPACITADGVERGVMSLNRKIPGPTISVCRHDLIVVDITNAMAGTSAAIHWHGLHQRATPYMDGVPFITQCPIGFGNTFRYAFLATEPGTQFYHSHSGHHKVNGHYGALIVREPKRVDPNGDLYHYDTPAHVILGSDWMHIDGEMFMPGLPSAGGIMPINLLINGKGTYHDPKKNETTQTPLEVYTVRRGARFRFRFINAASHVCPLQLQIEDHMMEVIASDSFHLQPRKVDTLVSTSGERYDFVLEANGVKDTYWVRLRSLGPCADLQLEQFAVLRYTTGPFINDAFPTGAPPTYEEPFRNVATANHPNATCGRPEFGDYCITDFQAYDTDEDVINGVPDHQLTFGFYNYPVSFESMFESNRYEHYMNIYGSVMMQGAINNISLAYPPFSLLTQPEKIRDDTFCDEDNRPDSCSDRQLCTCTHRVKINLGDIVELYILDLTPSVNDLNHPFHLHGYQMFVMEMSQDRRVPITLEIAQNIARQRLLSRNTVALPPRKDTVSIPSRGYARVRFRADNPGFWLMHCHYEWHTAVGMALVLQVGETSEMVKAPADFPKCDSYTPAVGHLLQGSL
Signal peptide prediction for AgMCO3
二、C端测序技术
‐自然界存在的蛋白质,尤其是哺乳动物及一些高等植物的蛋白质,其N端由于被修饰(如甲酰化、乙酰化等)处于封闭状态,从N 端测序得到序列信息有一定困难。
‐C端也是蛋白质和多肽的重要结构与功能部位,隐藏有许多蛋白质的活性位点,C端剪切也是蛋白质重要的翻译后修饰之一。‐许多蛋白质化学家期望研究类似Edman降解的方法,从降解的方法从C端对蛋白质氨基酸逐一降解而测定其序列。
由于C端羧基化学活泼性差等原因,这方面研究一直进展缓慢。
羧肽酶法(Carboxypeptidasemethod)‐是近年来广泛应用于蛋白质和多肽C端测定的方法。
‐羧肽酶可以专一性地从肽链的C端逐一降解,释放出游离的氨基酸残基。释放的氨基酸残基可以通过色谱法和质谱法检测。‐羧肽酶总共有四种。
羧肽酶A(CPA)():动物胰脏,可释放除动物胰脏可释放除脯氨酸、羟脯氨酸、精氨酸和
赖氨酸之外的所有C末端氨基酸,更易于水解具有
芳香族侧链和大脂肪侧链的羧基端氨基酸。
羧肽酶B(CPB): 动物胰脏,只水解以碱性氨基酸(如精氨酸和赖氨酸)为C
末端残基的肽键。
羧肽酶C(CPC): 柑橘叶, 可水解除羟脯氨酸外所有氨基酸。
羧肽酶Y(CPY): 酵母细胞,对羧基末端的各种氨基酸都具有广泛的水解能
力。
化学法(Chemical method)
‐(异)硫氰酸法,过佛酸酐法,肼解法,还原法等
‐(异异)硫氰酸法,氰又称SchlackKumpfp降降解,反应机理类似机类Edman降降解。基本原理:异硫氰酸与蛋白质或多肽的α‐羧基反应,形成蛋白质或多肽乙内酰硫脲,再用裂解试剂切下再用裂解试剂切下C末端的氨基酸残基,形成末端的氨基酸残基形成氨基酸乙内酰酸脲,然后用HPLC分析游离的氨基酸乙内酰酸脲。
根据该方法设计的蛋白质C端测序仪,样品量在10pmol时只能检测4‐5个氨基酸残基序列,样品量达到几十甚至上百pmol才能测得更多氨基酸残基序列。
Edman法蛋白质N端测序仪灵敏度可在10pmolp 下检测50个循环。
蛋白质测序(Protein Sequencing)串联质谱法(Tandem Mass Spectrometry)
基本原理:首先用胰蛋白酶或其它特异性酶或试剂(如溴化氢)对蛋白质进行降解,然后用串联质谱对降解后的多肽混合物进行分析。
在分析过程中通过串联质谱的第一级质谱选择在分析过程中,通过串联质谱的第级质谱选择C端肽段离子,端肽段离子进入碰撞室进一步诱导解离,然后进入第二级质谱检测分析得到C端的序列信息。
串联质谱法也常与羧肽酶法结合,测得各个不同酶切时间所形成的肽质量梯度,然后根据图谱中相邻两个肽峰的质量差,得到所切去氨基酸的信息从而读出C端氨基酸序列。所切去氨基酸的信息,从而读出端氨基酸序列
质谱测序(MS Sequencing)
MS 是目前鉴定蛋白质的主要技术
基本原理:是将样品分子离子化后,根据不同离子间的质荷比(m/z)的差异来分离并检测离子的相对分子质量。
‐第一次采用MS进行实验还要追溯到19世纪末(Scripps center for Mass spectrometry, 2005)。之后,MS技术得到了快速发展,目前有20多种商品化的MS仪用于蛋白质组学领域。尽管这些仪器在设计和功能上存在差异,但其中很大部分是相同的。所有的差异,但其中很大部分是相同的所有的MS仪都能实现两个分析功能:离子化和质量分析。
‐单级MS只需只需一个质量分析器,二级个质量分析器,二级MS需串联两个质量分析器。第需串联两个质量分析器。第一级质量分析器将m/z不同的肽段分离,然后选择肽段离子(也称前导离子)进行碎片化,最后通过第二级质量分析器测出各个最后通过第二级质量分析器测出各个碎片离子的m/z。
MS蛋白质鉴定技术
(MS Protein Identification Technology)
MS鉴定蛋白质策略
Topp‐down 策略
‐全蛋白在MS中进行纯化和碎裂。可以提供整个裂解蛋白质的高精度质量数因此能更容易解释蛋白质的碎裂质的高精度质量数,因此,能更容易解释蛋白质的碎裂结果。
‐该方法通常仅限于功能较强大的傅里叶变换(FT)MS仪。
Top-down mass spectrometry (MS) for the discovery of unexpected modifications.
Zhang H , and GeY Circ CardiovascGenet. 2011;4:711
Copyright American Heart Association, Inc. All rights reserved.
MS鉴定蛋白质策略
Bottom‐up 策略
‐全蛋白被纯化后,通过蛋白酶水解成肽段,然后再通过进行分析和碎裂。进行分析和碎裂
‐基于该策略的实验方法或技术会略有差异,但大体框架相同。MS
首先是样品制备,将细胞裂解,分理出感兴趣的细胞组分,并除去脂类、DNA等杂质等杂质。然后将蛋白质变性,并采取一种或然后将蛋白质变性,并采取种或多种分离技术降低样品的复杂程度。
分离的过程通常在酶解前或酶解后进行。进行
采用2‐DE时通常分离之后再酶解,所产生的肽段可能来源于一个或少数几个蛋白,再通过单级或二级MS分析。
在鸟枪法(shot gun)中,通常先对复杂蛋白质样品进行酶解,然后进行一维或多维色谱分离,最后通过MS进行分析鉴定由于能与MS联用,易于实现数据采集与蛋白质鉴定自动化,定。由于能与联用易于实现数据采集与蛋白质鉴定自动化因此比2‐DE更受欢迎。
Bottom-up (A) vst
top-down (B) d(B)
method for protein
PTM PTM
characterization.
Zhang H , and GeY
Circ Cardiovasc
Genet. 2011;4:711
Copyright American Heart Association, Inc. All rights reserved.
Flowchart of Tandem Mass Spectrometry
2~
6kV
ESI主要提供样品的质量信息,准确度高达0.01%,大大优于其它方法得到的蛋白质质量。
为了得到待测物的结构信息,需采用串联MS及碰撞诱导解离(collision‐induced dissociation, CID)技术。首先将母离子(parent ion)用第一级第MS分离出来,在碰撞室中与惰性气离来在撞室中与惰性气体分子相撞裂解(CID),产生子离子(daughter ion),再用后一级级MS得到结构信息。
ESI的特点是产生高电荷离子而不是碎片离子,使m/z降低到多数质量分析仪可以检测的范围因而大大扩展了质量的检多数质量分析仪可以检测的范围,因而大大扩展了质量的检测范围。
ESI的另一特点是可以方便地与多种液相分离技术联用。
影响ESI信号的主要因素‐
1)样品溶液的pH值。低pH值有利于分子的质子化。
2)溶剂的性质。)溶剂的性质适用于ESI的溶剂应能使样品在溶液中电
离形成离子,溶剂黏度和表面张力低有利于雾化,热容量低有利于去溶剂化。
3)去溶剂时干燥气体的温度与流速。去溶剂时燥气体的度与流速
MALDI 基质(Matrix)
基质在MALDI中担负着一关键角色,它可把吸收的激光能量均匀地传递到待测分子中,并保护待测分子不受破坏而形成碎片离子。
成为较好基质的有机化合物应具备的4个条件:个条件
1)能强烈吸收入射的激光;
2)具有较低的气化温度(最好以升华的方式气化);)具有较低的气化温度(最好以升华的方式气化)
3)能与待测物共享相同的溶剂;
4)在固相体系中能分离和包围待测分子而不形成共
价键。
对于蛋白质、多肽、核酸或多糖样品,较为通用的基质有芥子酸(SA)、2,5‐羟基苯甲酸(DHB)、3‐羟基吡啶甲酸(3HPA)、α‐氰基‐4‐羟肉硅酸(α CHCA)等。
MALDI 激光(Laser)
在MALDI中充当气化和离子化源,通常采用的激光束波长为337nm。
MALDI最大特点是激光解吸离子化的离子电荷通常为1个或2个。不像ESI中为多电荷,对分子质量较大的样品不会形成复杂的多电荷图,因而对图谱的解析比较清楚。
由于MALDI离子源产生的离子多为单电荷离子,质谱图中的谱峰与样品各组分的质量数是一一对应对应。
使用脉冲式激光,每一脉冲激光产生一批离子得到一张质谱图,一般使用的质谱图是多次脉冲激光扫描质谱峰结果的累加。
Mode of Adding Sample (加样方式)样品制备是MALDI分析的最重要一步。
通常是将基质的饱和溶液与待分析物溶液混合,然后将混合物(通常0.5‐1 μL)加载到样品板上,待溶剂挥发干后,将形成的样品和基质的混晶即可引入质谱仪。
由于MALDI的进样式固相方式,固相方式不像ESI的液相进样易受溶液性质影响,因此可耐受一定浓度的缓冲液、盐和去垢剂的存在。
ChapterChapter III III
Identification
ProteomicsProtein Identification in Proteinin
Preface
•蛋白质的鉴定是蛋白质组学研究的核心任务。‐为了发现和鉴定差异表达蛋白,需要进行蛋白质表达谱研究;
‐为了更好理解分子机制和信号通路,需要进行蛋白质翻译修饰和翻译后修饰谱的研究。翻译修饰和翻译后修饰谱的研究
•蛋白质组学研究中,由于蛋白质数量巨大,采取自动化的鉴定技术获得可靠的鉴定结果是十分必要的。‐将MS获得的蛋白质和肽段谱图与数据库中的蛋白质序列数据进行比对。这些MS图被称之为“指纹图”,代表每个蛋白质的独特属性,因此可用于蛋白质的鉴定。
•Source Species SourceSpecies(来源种类)
-显然不是识别蛋白质的重要特征,但可以将蛋白质数据库的范围限定在相关物种中的范围限定在相关物种中。
•ppI(等电点)
-变性蛋白质的pI是由N端氨基酸、C端氨基酸、翻译后修饰物以及其余氨基酸共同形成的。
•MW(分子质量)
-蛋白质的分子质量是蛋白质中所有氨基酸的质量以及翻译后修饰质量的综合。
•Partial Sequence or Sequence Tags (部分序列或序列标签)qqg
-
-
-
-任何氨基酸序列,即使仅仅几个氨基酸,也是非常特意性的信息。蛋白质分析鉴定也建立在这样一个基本事实上:大多数含有6个或6个以上氨基酸的肽序列在一个生物的蛋白质组中是唯是唯一的。的。如果可以得到定位于相同蛋白质的几个肽序列,可以增强匹配的准确性。分析蛋白质组学的本质是将蛋白质转换成肽分析蛋白质组学的本质是将蛋白质转换成肽、得到肽的得到肽的序列,然后根据数据库中的序列匹配来鉴定相关的蛋白质质。
•Amino Acid Composition (蛋白质氨基酸组成)p(蛋白质氨基酸组成)
-
-即蛋白质中含有的各种氨基酸的数目,通常用百分数来表示。很多研究小组利用强酸水解2-DE上的蛋白质,通过色谱方法分析产生的游离氨基酸来获取氨基酸组成的数据方法分析产生的游离氨基酸,来获取氨基酸组成的数据。然后通过AACompIdent软件分析来实现基于氨基酸组成的蛋白质鉴定。的蛋白质鉴定
生物质谱基础知识
(Fundamentals of Biological Mass Spectrometry)
同位素(Isotope)
•元素(Element)‐是一类原子的总称,它们都有相同的质子数但中子数可以不同子数,但中子数可以不同。
•核素(Nuclide)‐指一种原子,即有特定的质子数和中子数。•同位素(IsotopesIt)‐拥有同样的质子数但中子数不同的元素。
•单同位素元素(Mono isotopic elements)
–19F; 31P; 23Na;75As
•双同位素元素(Di‐isotopic elements)
–1H/2H; 12C/13C; 14N/15N; 35Cl/37Cl
•多同位素元素(Polyisotopicelements)
–大多数元素
质量定义(Definition of Mass)•原子质量单位(Unified atomic mass)
•1/12 of the mass of one 12C (Dalton/u/ amu)
•1 Dalton = 1.66055 X 10‐27kg
•1 Hydrogen = 1.00794 Da
•1 proton = 1.00728 Da
•1 neutron = 1.00867 Da
•1 electron = 1/1837 proton = 0.00055 Da
•同位素质量数(Isotopic mass)
•单个同位素的准确质量数
•平均质量数(Average mass)
•在某化合物中某元素的平均质量
•表征质量数(Nominal mass)
•元素整数质量数之和素整数质量数之
•Nominal mass of CO2= 12 u + 2 X 16 u = 44 u
质量分辨率(Mass
Resolution )
质量精确度(Mass Accuracy)•仪器测量值和理论计算值之间的差异–单位:
•相对值: part per millionll (ppm)()
•绝对值: dalton/amu, mmu
–如果精确度足够,测定一个生物分子的质量可以推出其分子式
蛋白质鉴定技术
(Protein Identification Technology)
•DNA测序
•蛋白质测序
•质谱测序
DNA测序(DNA Sequencing)
•根据已测定的部分氨基酸序列设计引物,扩增其mRNA,从而推断蛋白质的全序列技术。从而推断蛋白质的全序列技术‐对翻译后加工导致的氨基酸残基的修饰无能为力。
蛋白质测序(Protein Sequencing)
一、N端测序技术(Edman降解法)
‐蛋白质测序技术最具有意义的发展是瑞典化学家Edman发展的以他名字命名的蛋白质N端测序方法‐Edman降解.‐Edman降解堪称有机化学成功的经典,经过几十年研究,发现其偶联试剂‐异硫氰酸苯酯(PITC)(即Edman试剂)仍是最适用的。
‐EdmanEd降解是用化学方法从蛋白质的N端依次切下氨基酸残基,端依次切下氨基酸残基进行蛋白质序列测定的方法。是一个循环式的化学反应过程,包括3个主要化学步骤。
偶联(Coupling)偶pg) 环化裂解(化裂解Cleavage)g) 转化(Transformation)转化)
苯氨基硫甲酰
PTC‐肽
偶联
(Coupling)Cli)
转化
(Transformation) 环化裂解(Cleavage)
苯基乙内酰硫脲
PTH‐氨基酸噻唑啉酮苯胺(ATZ)衍生物
在Edman降解法的基础上,依据样品的处理方式和试剂输送
方式的不同出现了液相固相和气相蛋白质测定方法目前方式的不同出现了液相、固相和气相蛋白质测定方法。
大多采用固相和气相序列测定方法。
‐可以把蛋白质或多肽共价偶联到PVDF膜上,再进行序列分析避免冲洗使样品损失(固相)。析,避免冲洗使样品损失
近年来,应用自动化的Edman降解可产生短的N‐末端序列标
签,这是将质谱的序列标签概念用于Edman降解,业已成为一种强有力的蛋白质鉴定策略。
N‐端测序的重要性在于:
‐蛋白质和多肽的N端区域是非常重要的结构和功能部位。
亚细胞定位蛋白质的半衰期(N‐end亚细胞定位,蛋白质的半衰期(d rulel)、翻译后修饰等翻译后修饰等
‐通过N端测序有利于分析蛋白质的高级结构,揭示蛋白质的生物学功能。
‐由于蛋白质的N端序列特异性很高,通过N‐端测序可以对大多数蛋白质进行鉴定。
‐N端测序可以确定二硫键的位置、糖基化或磷酸化修饰的位点。端测序可以确定二硫键的位置糖基化或磷酸化修饰的位点不足:1.1 Edman测序不能解决N端封闭肽的测序问题。端封闭肽的测序问题
2. 需要的蛋白质或多肽的量较多,对样品纯度要
求高,反应时间长。
•N‐terminalil blockingblki can happenh ini vivoior duringdi purification.ifii An estimated 60‐70% of eukaryotic proteins are N‐terminally blocked in vivo, most usuallyy byy an acylyggroupp or cyclizationyof an N‐terminal glutamine residue to pyrrolidonecarboxylic acid (吡咯烷酮羧酸,PCA). Internal proteolysis from a gel slice and sequencing of the resulting peptides is the route of choice with blocked proteins.
Results of MCO3 N‐termino sequencing
Cycle#Cycle #
1
2
3
4
5Amino acids detected (pmoles)S (0.85) K (0.58) L (0.56) Q (0.46) P(0.48) W (?)L (0.40)N (0.18) E (0.09) Y (0.10) V (0.04)T (0.41) E (0.09) P (0.07) A (0.04)
Theoretical pI / Mw: 55.9090 / 72319.737231973 Fora
Theoretical pI / Mw: 5.86 / 71806.17 Forb
ab
MIVLRSHVLVLLGVPVVAYATRANAQSWLNTLLEQSNGTLDVSTFPGEQCLRECDNTQPRICHFSWTMEHYHVMGPACRDCAKGNHTDCYHPACITADGVERGVMSLNRKIPGPTISVCRHDLIVVDITNAMAGTSAAIHWHGLHQRATPYMDGVPFITQCPIGFGNTFRYAFLATEPGTQFYHSHSGHHKVNGHYGALIVREPKRVDPNGDLYHYDTPAHVILGSDWMHIDGEMFMPGLPSAGGIMPINLLINGKGTYHDPKKNETTQTPLEVYTVRRGARFRFRFINAASHVCPLQLQIEDHMMEVIASDSFHLQPRKVDTLVSTSGERYDFVLEANGVKDTYWVRLRSLGPCADLQLEQFAVLRYTTGPFINDAFPTGAPPTYEEPFRNVATANHPNATCGRPEFGDYCITDFQAYDTDEDVINGVPDHQLTFGFYNYPVSFESMFESNRYEHYMNIYGSVMMQGAINNISLAYPPFSLLTQPEKIRDDTFCDEDNRPDSCSDRQLCTCTHRVKINLGDIVELYILDLTPSVNDLNHPFHLHGYQMFVMEMSQDRRVPITLEIAQNIARQRLLSRNTVALPPRKDTVSIPSRGYARVRFRADNPGFWLMHCHYEWHTAVGMALVLQVGETSEMVKAPADFPKCDSYTPAVGHLLQGSL
Signal peptide prediction for AgMCO3
二、C端测序技术
‐自然界存在的蛋白质,尤其是哺乳动物及一些高等植物的蛋白质,其N端由于被修饰(如甲酰化、乙酰化等)处于封闭状态,从N 端测序得到序列信息有一定困难。
‐C端也是蛋白质和多肽的重要结构与功能部位,隐藏有许多蛋白质的活性位点,C端剪切也是蛋白质重要的翻译后修饰之一。‐许多蛋白质化学家期望研究类似Edman降解的方法,从降解的方法从C端对蛋白质氨基酸逐一降解而测定其序列。
由于C端羧基化学活泼性差等原因,这方面研究一直进展缓慢。
羧肽酶法(Carboxypeptidasemethod)‐是近年来广泛应用于蛋白质和多肽C端测定的方法。
‐羧肽酶可以专一性地从肽链的C端逐一降解,释放出游离的氨基酸残基。释放的氨基酸残基可以通过色谱法和质谱法检测。‐羧肽酶总共有四种。
羧肽酶A(CPA)():动物胰脏,可释放除动物胰脏可释放除脯氨酸、羟脯氨酸、精氨酸和
赖氨酸之外的所有C末端氨基酸,更易于水解具有
芳香族侧链和大脂肪侧链的羧基端氨基酸。
羧肽酶B(CPB): 动物胰脏,只水解以碱性氨基酸(如精氨酸和赖氨酸)为C
末端残基的肽键。
羧肽酶C(CPC): 柑橘叶, 可水解除羟脯氨酸外所有氨基酸。
羧肽酶Y(CPY): 酵母细胞,对羧基末端的各种氨基酸都具有广泛的水解能
力。
化学法(Chemical method)
‐(异)硫氰酸法,过佛酸酐法,肼解法,还原法等
‐(异异)硫氰酸法,氰又称SchlackKumpfp降降解,反应机理类似机类Edman降降解。基本原理:异硫氰酸与蛋白质或多肽的α‐羧基反应,形成蛋白质或多肽乙内酰硫脲,再用裂解试剂切下再用裂解试剂切下C末端的氨基酸残基,形成末端的氨基酸残基形成氨基酸乙内酰酸脲,然后用HPLC分析游离的氨基酸乙内酰酸脲。
根据该方法设计的蛋白质C端测序仪,样品量在10pmol时只能检测4‐5个氨基酸残基序列,样品量达到几十甚至上百pmol才能测得更多氨基酸残基序列。
Edman法蛋白质N端测序仪灵敏度可在10pmolp 下检测50个循环。
蛋白质测序(Protein Sequencing)串联质谱法(Tandem Mass Spectrometry)
基本原理:首先用胰蛋白酶或其它特异性酶或试剂(如溴化氢)对蛋白质进行降解,然后用串联质谱对降解后的多肽混合物进行分析。
在分析过程中通过串联质谱的第一级质谱选择在分析过程中,通过串联质谱的第级质谱选择C端肽段离子,端肽段离子进入碰撞室进一步诱导解离,然后进入第二级质谱检测分析得到C端的序列信息。
串联质谱法也常与羧肽酶法结合,测得各个不同酶切时间所形成的肽质量梯度,然后根据图谱中相邻两个肽峰的质量差,得到所切去氨基酸的信息从而读出C端氨基酸序列。所切去氨基酸的信息,从而读出端氨基酸序列
质谱测序(MS Sequencing)
MS 是目前鉴定蛋白质的主要技术
基本原理:是将样品分子离子化后,根据不同离子间的质荷比(m/z)的差异来分离并检测离子的相对分子质量。
‐第一次采用MS进行实验还要追溯到19世纪末(Scripps center for Mass spectrometry, 2005)。之后,MS技术得到了快速发展,目前有20多种商品化的MS仪用于蛋白质组学领域。尽管这些仪器在设计和功能上存在差异,但其中很大部分是相同的。所有的差异,但其中很大部分是相同的所有的MS仪都能实现两个分析功能:离子化和质量分析。
‐单级MS只需只需一个质量分析器,二级个质量分析器,二级MS需串联两个质量分析器。第需串联两个质量分析器。第一级质量分析器将m/z不同的肽段分离,然后选择肽段离子(也称前导离子)进行碎片化,最后通过第二级质量分析器测出各个最后通过第二级质量分析器测出各个碎片离子的m/z。
MS蛋白质鉴定技术
(MS Protein Identification Technology)
MS鉴定蛋白质策略
Topp‐down 策略
‐全蛋白在MS中进行纯化和碎裂。可以提供整个裂解蛋白质的高精度质量数因此能更容易解释蛋白质的碎裂质的高精度质量数,因此,能更容易解释蛋白质的碎裂结果。
‐该方法通常仅限于功能较强大的傅里叶变换(FT)MS仪。
Top-down mass spectrometry (MS) for the discovery of unexpected modifications.
Zhang H , and GeY Circ CardiovascGenet. 2011;4:711
Copyright American Heart Association, Inc. All rights reserved.
MS鉴定蛋白质策略
Bottom‐up 策略
‐全蛋白被纯化后,通过蛋白酶水解成肽段,然后再通过进行分析和碎裂。进行分析和碎裂
‐基于该策略的实验方法或技术会略有差异,但大体框架相同。MS
首先是样品制备,将细胞裂解,分理出感兴趣的细胞组分,并除去脂类、DNA等杂质等杂质。然后将蛋白质变性,并采取一种或然后将蛋白质变性,并采取种或多种分离技术降低样品的复杂程度。
分离的过程通常在酶解前或酶解后进行。进行
采用2‐DE时通常分离之后再酶解,所产生的肽段可能来源于一个或少数几个蛋白,再通过单级或二级MS分析。
在鸟枪法(shot gun)中,通常先对复杂蛋白质样品进行酶解,然后进行一维或多维色谱分离,最后通过MS进行分析鉴定由于能与MS联用,易于实现数据采集与蛋白质鉴定自动化,定。由于能与联用易于实现数据采集与蛋白质鉴定自动化因此比2‐DE更受欢迎。
Bottom-up (A) vst
top-down (B) d(B)
method for protein
PTM PTM
characterization.
Zhang H , and GeY
Circ Cardiovasc
Genet. 2011;4:711
Copyright American Heart Association, Inc. All rights reserved.
Flowchart of Tandem Mass Spectrometry
2~
6kV
ESI主要提供样品的质量信息,准确度高达0.01%,大大优于其它方法得到的蛋白质质量。
为了得到待测物的结构信息,需采用串联MS及碰撞诱导解离(collision‐induced dissociation, CID)技术。首先将母离子(parent ion)用第一级第MS分离出来,在碰撞室中与惰性气离来在撞室中与惰性气体分子相撞裂解(CID),产生子离子(daughter ion),再用后一级级MS得到结构信息。
ESI的特点是产生高电荷离子而不是碎片离子,使m/z降低到多数质量分析仪可以检测的范围因而大大扩展了质量的检多数质量分析仪可以检测的范围,因而大大扩展了质量的检测范围。
ESI的另一特点是可以方便地与多种液相分离技术联用。
影响ESI信号的主要因素‐
1)样品溶液的pH值。低pH值有利于分子的质子化。
2)溶剂的性质。)溶剂的性质适用于ESI的溶剂应能使样品在溶液中电
离形成离子,溶剂黏度和表面张力低有利于雾化,热容量低有利于去溶剂化。
3)去溶剂时干燥气体的温度与流速。去溶剂时燥气体的度与流速
MALDI 基质(Matrix)
基质在MALDI中担负着一关键角色,它可把吸收的激光能量均匀地传递到待测分子中,并保护待测分子不受破坏而形成碎片离子。
成为较好基质的有机化合物应具备的4个条件:个条件
1)能强烈吸收入射的激光;
2)具有较低的气化温度(最好以升华的方式气化);)具有较低的气化温度(最好以升华的方式气化)
3)能与待测物共享相同的溶剂;
4)在固相体系中能分离和包围待测分子而不形成共
价键。
对于蛋白质、多肽、核酸或多糖样品,较为通用的基质有芥子酸(SA)、2,5‐羟基苯甲酸(DHB)、3‐羟基吡啶甲酸(3HPA)、α‐氰基‐4‐羟肉硅酸(α CHCA)等。
MALDI 激光(Laser)
在MALDI中充当气化和离子化源,通常采用的激光束波长为337nm。
MALDI最大特点是激光解吸离子化的离子电荷通常为1个或2个。不像ESI中为多电荷,对分子质量较大的样品不会形成复杂的多电荷图,因而对图谱的解析比较清楚。
由于MALDI离子源产生的离子多为单电荷离子,质谱图中的谱峰与样品各组分的质量数是一一对应对应。
使用脉冲式激光,每一脉冲激光产生一批离子得到一张质谱图,一般使用的质谱图是多次脉冲激光扫描质谱峰结果的累加。
Mode of Adding Sample (加样方式)样品制备是MALDI分析的最重要一步。
通常是将基质的饱和溶液与待分析物溶液混合,然后将混合物(通常0.5‐1 μL)加载到样品板上,待溶剂挥发干后,将形成的样品和基质的混晶即可引入质谱仪。
由于MALDI的进样式固相方式,固相方式不像ESI的液相进样易受溶液性质影响,因此可耐受一定浓度的缓冲液、盐和去垢剂的存在。