人类基因组及后基因组研究进展

人类基因组及后基因组研究进展

摘要:人类对自身基因组的研究,随着人类基因组工作草图的绘制完成和对基因功能研究的深入已加快进入了实质性、关键性的开发利用阶段。本文概述了人类基因组及后基因组的研究进展。

关键词:人类基因组;人类后基因组;基因;后基因组学

1953年4月,科学家发现了基因———遗传物质的基本结构,并提出了“DNA双螺旋模型”.后来,科学家认识到人类基因组中的所有基因在染色体上都有一定的位置、结构和功能.要揭示人类的奥秘,就要分离、克隆、研究人类所有的基因.

1984年12月,美国犹他大学的Wenter受美国能源部的委托,主持讨论了DNA重组技术及测定人类整个基因组DNA序列的意义. 1985年6月,美国能源部提出“人类基因组计划”(Humangenome project, HGP)的初步草案.最早提出测定人类基因组序列的是美国科学家罗伯特·辛西默(Robert Sinshimer). 1986年3月,美国的诺贝尔奖获得者雷纳多·杜尔贝柯石(Renato Dulbecco)在《科学》杂志上发表的短文中率先提出“测定人类的整个基因组序列”的主张[ 1 ],后经世界性的讨论取得共识. 1987年,美国开始筹建“人类基因组计划”实验室. 1988年,科学家开始讨论如何才能更快、更多、更好地研究与人类的生老病死有关的所有基因———全部的人类基因组.

1 人类基因组计划及进展

1.1.人类基因组研究的内容

从1987年提出“人类基因组计划”到1990年正式实施,研究的具体内容表现在4张图上:遗传图、物理图、序列图和转录图,其主要内容是绘制人类基因组序列框架图. 1993年马里兰州Hunt,Valley会议上,经美国人类基因组研究中心(CHGR)修订后的HGP内容[ 2 ]包括:人类基因组作图及序列分析;基因的鉴定;基因组研究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组的作图和测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理学、法学和社会影响与结果的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面,这些内容构成了20世纪到21世纪最大的系统工程[ 3 ].

1.2 人类基因组计划的基本策略

HGP研究的基本策略包括:

1)测定整个基因组的策略.经典方法是先作图再测序.

2) cDNA策略.人类基因组中发生转录表达的序列(即基因)仅占总序列的约5%,对这一部分序列进行测定将直接导致基因的发现.该策略是从cDNA文库中选取基因并克隆,然后进行序列测定,之后将结果通过计算机与已知的数据库进行比较,最终在染色体上进行定位.它的主要目标在于获取大量正在表达的遗传信息,以此为基础构建全基因组范围的转录图谱,获得基因组中对医学和生物制药产业关系最密切的信息.

3)基因鉴定的策略.通常采用定位克隆或候选定位克隆的策略,即利用与疾病连锁的标记在基因组文库中找到表达序列,再利用这一表达序列去识别全部cDNA,找到该基因[ 4 ], 4 人类基因组计划的技术背景

1.3 人类基因组计划的技术背景

1.3.1 作图的生物技术

用质粒、噬菌体等载体通过DNA重组技术建立基因组文库或cDNA文库,用来构建克隆重叠群和提供材料进行分子标记的筛选. 20世纪80年代以来,依赖于分子杂交、放射自显影、脉冲场凝胶交变电泳技术和改进PCR技术等现代生物学技术的融合应用而发现的数10种分

子标志如RFLP标记(随机片段长度多态性)、SNP标记(单核苷酸多态性)、STRS标志(短串联重复)、STS (标志位点)、EST标志(表达序列标志)、微卫星DNA标志等,使遗传作图和物理作图的速度和精确度大大提高[ 5 ].

1.3.2 DNA测序的生物技术

DNA序列分析方法现已发展为荧光标记和自动机器操作,如ABI公司的377型自动测序仪和Pharmacia LKB公司的全自动DNA顺序分析仪(每小时可读500 ~ 600 bp)等;已在StanfordDNA测序和技术开发中心使用的高效毛细管测序仪每天可分析1 Mb的序列,科学家现正在设计1天能测定100 Mb的自动仪器.另外还有质谱法、扫描隧道显微术、X-射线成像术、杂交测序法、流式细胞仪测序、大规模平行实测法、DNA芯片法[ 5 ]等新方法正在逐步完善并开发出商业化的产品用于DNA的序列测定[6 ].需要指出的是,随着微电子技术和显微制造技术的突飞猛进,今后测序技术的发展方向是仪器的微型化,这样可以极大地减少成本和提高效率[ 7 ].

1.3.3 基因鉴定的生物技术

基因鉴定的关键在于初步定位之后从覆盖区域中寻找表达序列.在这方面,直接cDNA筛选法和外显子捕获技术[8]已经过不断改进而成为较常用的方法.另外,采用微点阵技术将计算机系统与测序仪连用和采用相应的数据库和信息处理软件在连锁分析的基础上对检测数据进行大规模的扫描综合分析[9,10],已逐渐发展成为一种快速、准确、有效的基因鉴定手段.

1.3.4 人类基因组计划及进展

1989年,美国成立“国家人类基因组研究中心”,诺贝尔奖获得者、DNA分子双螺旋结构模型的提出者Jamse Wateson担任第一任主任. 1990年10月,美国首先正式启动“人类基因组计划”(HGP),完成人类全部DNA分子核苷酸序列的测定.1993年,美国对这一计划做了修订,其中最重要的任务就是人类基因组的基因图构建与序列分析,需最优先考虑、必须保质保量完成的是DNA序列图.随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应,都开始了不同规模、各有特色的人类基因组研究[ 11 ].

1999年12月1日,人类首次成功地完成人体染色体基因完整序列的测定. 2000年6月26日六国科学家公布人类基因组工作框架图,成为人类基因组计划进展的一个重要里程碑.2001年2月12日,人类基因组图谱及初步分析结果首次公布.2003年4月15日,美、英、德、日、法、中6个国家共同宣布人类基因组序列图完成,人类基因组计划的所有目标全部实现,提前2年实现了目标.[ 12 ]

1.3.5 我国人类基因组计划的启动与实施

中国人口占世界总人口的22%以上,有56个民族和很多遗传隔离群、近交系、大家系,因此,中国人的基因组计划应是国际的相关计划的组成部分。面对机遇和挑战,我国在国家科技部、863计划、国家自然科学基金委员会的支持下,先后于1993年和1996年启动了“中国不同民族基因组中若干位点基因结构比较研究”和“重大疾病相关基因的定位、克隆、结构与功能研究”,并在北京和上海成立了一批国家重点实验室,如复旦大学的基因工程和分子遗传学实验室、中国科学院分子生物学实验室、中国医学科学院分子肿瘤学实验室等,国家自然科学基金委员会也连年资助了若干相关的研究课题,取得的研究成果受到国际上的关注:(珠蛋白基因突变研究成果;我国人工酵母染色体(YAC)构建;血友病B的基因治疗以及食管癌的研究等。同时,我国还积极参与国际大协作,1999年9月,我国加入HGP计划,成为参与这一计划的唯一发展中国家,负责1%人类基因组-即3号染色体上的3000万个bp的测序工作,仅半年就基本完成了测序工作。

2.人类后基因组研究进展

获得基因组的结构信息只是人类对自身基因组认识与研究的第一步,而进一步弄清基因相应的功能及实际应用,才是关键目的所在,才具有真正意义。随着人类基因组计划(HGP)的逐步开展和成果的获得,人类已加快进入了基因的功能研究阶段,尤其是近年来,随着HGP计划的临近完成,人类基因组的研究重心已从结构基因组(StructuralGenome)逐步过度到功能基因组(FunctionalGenome)。一般来说,以人类基因组结构为主要研究内容的称为“基因组学”(Genomics),以结构研究之后的基因组功能为主要研究内容的称为“后基因组学”(Post-Genomics),因此就有了“人类后基因组计划”。可见,人类后基因组研究是在基因组学的研究基础上开展起来的实质性的核心研究。

从1996年起,随着人类基因组测序计划的完成[13,14]和后基因组时代的到来,国际上基因组、转录组、蛋白质组、代谢组乃至表型组工作的相继开展[15],各种类型功能基因组数据的爆炸性增长,信息整合和数据挖掘的重要性显得尤为突出.有人将细胞的基因组、转录组和蛋白质组综合起来称为操纵子组(operomics)[16]来研究功能,正体现了这种认识.这就是通常所说的“后基因组学”(postgenomics).

后基因组研究涉及的内容及技术方法有以下几个方面:

2.1 生物信息学(Bioinformatics)

生物信息学早期是生物学中的一个分支,随着人类基因组计划和后基因组计划的实施给了该学科很大的生命力,是分子生物学与计算机科学的交叉科学。它对人们获得的巨量基因组信息进行收集、储存、整理,并对该信息进行分析处理、模拟等以此获得很多有意义的结论以进行基因的鉴定和功能研究等。所以,后基因组的大规模基因功能表达谱的获得依赖于生物信息学的理论、技术与数据库。

2.1.1 生物信息学包括的内容

1)基因组相关信息的收集、储存、管理与提供:人类基因组计划的全面实施、大量遗传密码的破译及基因数据的出现促进了数据库、分析工具及网络连接等的快速发展。

2)生物信息数据库:建立数据库是存储基因组相关信息的重要步骤,当前在互联网上可找到与基因组信息相关的大量重要数据库、服务器,其中GenBank(美国)、GSDB(美国)、EMBL(欧洲)等数据库频繁地被用户检索。

3)以因特网(Internet)为基础的基因组信息学

传输网络:用户与数据库间迅速、有效地传递信息是基因组信息的收集、管理与使用的另一要素。目前与基因组信息相关的数据库都有了自己的Inter-net地址和主页(Homepape),同时在网上还出现了很多相关的在线(online)服务器。我国在数据库构建、管理以及与国际常用数据库的有效连接上做了一定的工作,相信经过努力在这一领域将得到迅速发展。

2.1.2 基因组信息的分析、处理方法研究

1)建立和发展大容量、多样化数据库和信息处理软件,创建一切适于基因组信息分析的新方法、新技术,如90年代初发展起来的生物芯片技术以及以此技术为基础的各种分析法等。

2)建立快速、严格的多序列比较方法。多序列比较是解决同源性分析等重要问题的关键手段,但迄今为止只有近似方法,所以发展精确的多序列比较方法是当务之急。

2.1.3 人类基因的识别和鉴定

使用基因组信息学的方法是发现和鉴定新基因的重要手段。目前,基因识别和鉴定可从以下方面进行:①根据已知基因序列资料;②根据可表达序列标签(EST);③基因组扫描;④对染色体特异性cos-mid进行直接的cDNA选择;⑤DNA芯片技术;⑥外显子捕获及相关原理等。

2.1.4 基因的编码序列、非编码序列及调控序列研究

人类基因组中约95%为非编码区。通过基因组信息学的方法从基因组DNA测序数据中确定编码区、并寻找非编码区域的编码特征、信息调节与表达规律是对基因组结构分析的热点课题。

2.1.5 完整基因组的比较基因组学研究

在后基因组时代,科学家将获得越来越多的完整基因组,通过不同物种间基因组的比较研究,找出引起差异的基因、DNA序列甚至染色体组织上的不同,以期认识进化、种族血缘、寿命、疾病和衰老等生命现象本质。我国已完成了南、北方两个汉族人群和西南、东北地区12个少数民族遗传隔离群基因组的收集、保存、若干位点的比较研究。有科学家估计,不同人种间基因组的差别不大于0.1%,人猿间的差别不大于1%。此外,还应开展与酵母、细菌、河豚鱼、水稻、小鼠等模式生物进行的比较基因组学研究。

2.2 基因功能研究

人类后基因组计划的关键点是基因的功能研究,这也是对功能基因加以开发利用研究的基础。主要包括以下内容:

1)基因表达谱的绘制

基因表达mRNA的水平反映了在一定环境、细胞类型、生长阶段和一定细胞状态下基因的功能信息。因此绘制所有基因的表达谱非常重要。包括每种组织细胞中的基因表达谱、细胞不同发育阶段的基因表达谱、正常和病理状态下的基因表达谱、治疗条件下的基因表达谱等。为此建立了新的技术方法,如微点阵技术(microarray)、改进的定量PCR技术、原位杂交技术等。

2)基因功能的研究方法与技术

经典遗传学方法是用化学物质或辐射进行诱变处理,使整个基因组产生随机突变来推测该基因的功能。随着DNA序列分析的发展,通过破坏或操纵基因的手段,使靶基因在模式生物基因组中被敲除、封阻或增加,来检测模式生物的生物学功能改变,是了解特定基因功能的重要途径之一。20世纪80年代发展起来的反义技术和基因打靶技术都是基因功能研究的有力手段,也是基因治疗和药物设计研究的有用工具。此外,还应发展能暂时性破坏基因表达的通用试剂。

3)蛋白质组学的研究

由于生物功能的主要体现者是蛋白质,因此不仅要从基因角度来研究,还应从蛋白质的层次上来研究相关基因的结构和功能。蛋白质组学研究中的新方法有:采用双向凝胶电泳和测序质谱技术;建立蛋白质结构数据库,以研究其结构和功能的关系,并判断相关基因的结构与功能的关系;采用显微镜定位、定量技术和FISH、Confocal等技术对蛋白质的结构、功能及相互作用进行阐释,以了解基因的结构与功能的关系。

2.3 我国后基因组研究现状和策略

基因功能研究涉及分子生物学、细胞生物学、蛋白质化学、免疫学、药理学、生物信息学等多学科的分工合作,并需依赖先进的生物技术手段支撑和政府的支持投入以及风险基金的筹措等,所以它具有相当难度但同时也具有巨大的研究开发潜力。目前,我国的基因功能研究处于滞后状态,这也将对其下游的人类基因组的应用与开发研究带来影响。因此必须加强分工合作,发现和研究我国自己的重要功能基因,依我国的国情,制定研究开发的策略。如我国有学者提出:一个基因决不止一个功能,而是多功能的,现已知的某些功能也可能不是最重要的,有意识地研究开发一些老的传统基因的新功能有重要意义。

1990年启动的人类基因组计划及其后相继开展的人类后基因组计划是一项人类科学史上最伟大的认识自身的跨世纪的科学工程。30年来,该人类基因组工程在全球性的合作研究中已取得了巨大的成就:2000年6月26日人类基因组序列和结构的工作草图已提前绘制完成;同时,基因功能研究和应用与开发等实质性的研究也已取得了令人振奋的成果。这将对整个生命科学研究及人们的生活产生深刻的影响,相信在不久的将来,其成果在医药领域的开发与应用必将大大造福于人类健康。

参考文献:

[1] Dulbecco R. Aturning poin tincancer research:sequencing the human genume[J].Science,1986,231: 1055—1056.

[2] Collins F S, Galas D. A new five-year plan for the U. S. Hunan Genome Project[J] .Science,1993,262: 43—46.

[3] 李晋楠.人类基因组计划研究进展综述[J].浙江师大学报(自然科学版), 1999,22(3): 69—72.

[4] Venter J, Smith H O, Hood L. A new strategy forgenom sequencing[J].Nature,1996,381: 363—366.

[5] Schena M, Shalon D, Davis R W, et al.Quantitative monitoring of gene expression patterns with a complement ary DNA micro array [ J].Science,1995,270: 467—470.

[6] 丁 立,刘国仰,杨焕明.人类基因组计划中的外显子捕获技术[J].遗传,1998,20(3): 35—37.

[7] 陈 竺,黄 薇,傅 刚,等.人类基因组计划现状与展望[J].自然杂志,22(3): 125—132.

[8] 刘万清,贺 林.自动化大规模基因组扫描与连锁分析[J].生命科学,1998,10(5): 233—235.

[9] 范玉新,李 霞.基因功能分析与鉴定的新进展[J].国外医学:分子生物学分册,1998,20(3):100—104.

[10] Ingsbury, David T. Bioin form aticsindrug discovery[J].Drug Development Research,1997,41(3—4): 120—128.

[11 ] Timeline A. History of the Human Genome Project[J].Science,2001,291: 1195—1203.

[12 ] 骆建新,郑崛村,马用信,等.人类基因组计划与后基因组时代[J].中国生物工程杂志,2003,23(11): 87—94.

[13] Venter J C, Adams M D, Myers E W, et al. Thesequence of the human genome[J].Science,2001,291(5507): 1304—1351.

[14] Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome[J].Nature,2001,409(6822): 860—921.

[15] Bork P, Dandekar T, Diaz Lazcoz Y, et al.Predicting function: from genes to genomes and back [J].J Mol Biol,1998,283(4): 707—725.

[16] Hanash S M. Operomics: molecular analysis of tissues from DNA to RNA to ptotein[J].Clin Chem Lab Med,2000,38(9): 805—813.

人类基因组及后基因组研究进展

摘要:人类对自身基因组的研究,随着人类基因组工作草图的绘制完成和对基因功能研究的深入已加快进入了实质性、关键性的开发利用阶段。本文概述了人类基因组及后基因组的研究进展。

关键词:人类基因组;人类后基因组;基因;后基因组学

1953年4月,科学家发现了基因———遗传物质的基本结构,并提出了“DNA双螺旋模型”.后来,科学家认识到人类基因组中的所有基因在染色体上都有一定的位置、结构和功能.要揭示人类的奥秘,就要分离、克隆、研究人类所有的基因.

1984年12月,美国犹他大学的Wenter受美国能源部的委托,主持讨论了DNA重组技术及测定人类整个基因组DNA序列的意义. 1985年6月,美国能源部提出“人类基因组计划”(Humangenome project, HGP)的初步草案.最早提出测定人类基因组序列的是美国科学家罗伯特·辛西默(Robert Sinshimer). 1986年3月,美国的诺贝尔奖获得者雷纳多·杜尔贝柯石(Renato Dulbecco)在《科学》杂志上发表的短文中率先提出“测定人类的整个基因组序列”的主张[ 1 ],后经世界性的讨论取得共识. 1987年,美国开始筹建“人类基因组计划”实验室. 1988年,科学家开始讨论如何才能更快、更多、更好地研究与人类的生老病死有关的所有基因———全部的人类基因组.

1 人类基因组计划及进展

1.1.人类基因组研究的内容

从1987年提出“人类基因组计划”到1990年正式实施,研究的具体内容表现在4张图上:遗传图、物理图、序列图和转录图,其主要内容是绘制人类基因组序列框架图. 1993年马里兰州Hunt,Valley会议上,经美国人类基因组研究中心(CHGR)修订后的HGP内容[ 2 ]包括:人类基因组作图及序列分析;基因的鉴定;基因组研究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组的作图和测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理学、法学和社会影响与结果的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面,这些内容构成了20世纪到21世纪最大的系统工程[ 3 ].

1.2 人类基因组计划的基本策略

HGP研究的基本策略包括:

1)测定整个基因组的策略.经典方法是先作图再测序.

2) cDNA策略.人类基因组中发生转录表达的序列(即基因)仅占总序列的约5%,对这一部分序列进行测定将直接导致基因的发现.该策略是从cDNA文库中选取基因并克隆,然后进行序列测定,之后将结果通过计算机与已知的数据库进行比较,最终在染色体上进行定位.它的主要目标在于获取大量正在表达的遗传信息,以此为基础构建全基因组范围的转录图谱,获得基因组中对医学和生物制药产业关系最密切的信息.

3)基因鉴定的策略.通常采用定位克隆或候选定位克隆的策略,即利用与疾病连锁的标记在基因组文库中找到表达序列,再利用这一表达序列去识别全部cDNA,找到该基因[ 4 ], 4 人类基因组计划的技术背景

1.3 人类基因组计划的技术背景

1.3.1 作图的生物技术

用质粒、噬菌体等载体通过DNA重组技术建立基因组文库或cDNA文库,用来构建克隆重叠群和提供材料进行分子标记的筛选. 20世纪80年代以来,依赖于分子杂交、放射自显影、脉冲场凝胶交变电泳技术和改进PCR技术等现代生物学技术的融合应用而发现的数10种分

子标志如RFLP标记(随机片段长度多态性)、SNP标记(单核苷酸多态性)、STRS标志(短串联重复)、STS (标志位点)、EST标志(表达序列标志)、微卫星DNA标志等,使遗传作图和物理作图的速度和精确度大大提高[ 5 ].

1.3.2 DNA测序的生物技术

DNA序列分析方法现已发展为荧光标记和自动机器操作,如ABI公司的377型自动测序仪和Pharmacia LKB公司的全自动DNA顺序分析仪(每小时可读500 ~ 600 bp)等;已在StanfordDNA测序和技术开发中心使用的高效毛细管测序仪每天可分析1 Mb的序列,科学家现正在设计1天能测定100 Mb的自动仪器.另外还有质谱法、扫描隧道显微术、X-射线成像术、杂交测序法、流式细胞仪测序、大规模平行实测法、DNA芯片法[ 5 ]等新方法正在逐步完善并开发出商业化的产品用于DNA的序列测定[6 ].需要指出的是,随着微电子技术和显微制造技术的突飞猛进,今后测序技术的发展方向是仪器的微型化,这样可以极大地减少成本和提高效率[ 7 ].

1.3.3 基因鉴定的生物技术

基因鉴定的关键在于初步定位之后从覆盖区域中寻找表达序列.在这方面,直接cDNA筛选法和外显子捕获技术[8]已经过不断改进而成为较常用的方法.另外,采用微点阵技术将计算机系统与测序仪连用和采用相应的数据库和信息处理软件在连锁分析的基础上对检测数据进行大规模的扫描综合分析[9,10],已逐渐发展成为一种快速、准确、有效的基因鉴定手段.

1.3.4 人类基因组计划及进展

1989年,美国成立“国家人类基因组研究中心”,诺贝尔奖获得者、DNA分子双螺旋结构模型的提出者Jamse Wateson担任第一任主任. 1990年10月,美国首先正式启动“人类基因组计划”(HGP),完成人类全部DNA分子核苷酸序列的测定.1993年,美国对这一计划做了修订,其中最重要的任务就是人类基因组的基因图构建与序列分析,需最优先考虑、必须保质保量完成的是DNA序列图.随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应,都开始了不同规模、各有特色的人类基因组研究[ 11 ].

1999年12月1日,人类首次成功地完成人体染色体基因完整序列的测定. 2000年6月26日六国科学家公布人类基因组工作框架图,成为人类基因组计划进展的一个重要里程碑.2001年2月12日,人类基因组图谱及初步分析结果首次公布.2003年4月15日,美、英、德、日、法、中6个国家共同宣布人类基因组序列图完成,人类基因组计划的所有目标全部实现,提前2年实现了目标.[ 12 ]

1.3.5 我国人类基因组计划的启动与实施

中国人口占世界总人口的22%以上,有56个民族和很多遗传隔离群、近交系、大家系,因此,中国人的基因组计划应是国际的相关计划的组成部分。面对机遇和挑战,我国在国家科技部、863计划、国家自然科学基金委员会的支持下,先后于1993年和1996年启动了“中国不同民族基因组中若干位点基因结构比较研究”和“重大疾病相关基因的定位、克隆、结构与功能研究”,并在北京和上海成立了一批国家重点实验室,如复旦大学的基因工程和分子遗传学实验室、中国科学院分子生物学实验室、中国医学科学院分子肿瘤学实验室等,国家自然科学基金委员会也连年资助了若干相关的研究课题,取得的研究成果受到国际上的关注:(珠蛋白基因突变研究成果;我国人工酵母染色体(YAC)构建;血友病B的基因治疗以及食管癌的研究等。同时,我国还积极参与国际大协作,1999年9月,我国加入HGP计划,成为参与这一计划的唯一发展中国家,负责1%人类基因组-即3号染色体上的3000万个bp的测序工作,仅半年就基本完成了测序工作。

2.人类后基因组研究进展

获得基因组的结构信息只是人类对自身基因组认识与研究的第一步,而进一步弄清基因相应的功能及实际应用,才是关键目的所在,才具有真正意义。随着人类基因组计划(HGP)的逐步开展和成果的获得,人类已加快进入了基因的功能研究阶段,尤其是近年来,随着HGP计划的临近完成,人类基因组的研究重心已从结构基因组(StructuralGenome)逐步过度到功能基因组(FunctionalGenome)。一般来说,以人类基因组结构为主要研究内容的称为“基因组学”(Genomics),以结构研究之后的基因组功能为主要研究内容的称为“后基因组学”(Post-Genomics),因此就有了“人类后基因组计划”。可见,人类后基因组研究是在基因组学的研究基础上开展起来的实质性的核心研究。

从1996年起,随着人类基因组测序计划的完成[13,14]和后基因组时代的到来,国际上基因组、转录组、蛋白质组、代谢组乃至表型组工作的相继开展[15],各种类型功能基因组数据的爆炸性增长,信息整合和数据挖掘的重要性显得尤为突出.有人将细胞的基因组、转录组和蛋白质组综合起来称为操纵子组(operomics)[16]来研究功能,正体现了这种认识.这就是通常所说的“后基因组学”(postgenomics).

后基因组研究涉及的内容及技术方法有以下几个方面:

2.1 生物信息学(Bioinformatics)

生物信息学早期是生物学中的一个分支,随着人类基因组计划和后基因组计划的实施给了该学科很大的生命力,是分子生物学与计算机科学的交叉科学。它对人们获得的巨量基因组信息进行收集、储存、整理,并对该信息进行分析处理、模拟等以此获得很多有意义的结论以进行基因的鉴定和功能研究等。所以,后基因组的大规模基因功能表达谱的获得依赖于生物信息学的理论、技术与数据库。

2.1.1 生物信息学包括的内容

1)基因组相关信息的收集、储存、管理与提供:人类基因组计划的全面实施、大量遗传密码的破译及基因数据的出现促进了数据库、分析工具及网络连接等的快速发展。

2)生物信息数据库:建立数据库是存储基因组相关信息的重要步骤,当前在互联网上可找到与基因组信息相关的大量重要数据库、服务器,其中GenBank(美国)、GSDB(美国)、EMBL(欧洲)等数据库频繁地被用户检索。

3)以因特网(Internet)为基础的基因组信息学

传输网络:用户与数据库间迅速、有效地传递信息是基因组信息的收集、管理与使用的另一要素。目前与基因组信息相关的数据库都有了自己的Inter-net地址和主页(Homepape),同时在网上还出现了很多相关的在线(online)服务器。我国在数据库构建、管理以及与国际常用数据库的有效连接上做了一定的工作,相信经过努力在这一领域将得到迅速发展。

2.1.2 基因组信息的分析、处理方法研究

1)建立和发展大容量、多样化数据库和信息处理软件,创建一切适于基因组信息分析的新方法、新技术,如90年代初发展起来的生物芯片技术以及以此技术为基础的各种分析法等。

2)建立快速、严格的多序列比较方法。多序列比较是解决同源性分析等重要问题的关键手段,但迄今为止只有近似方法,所以发展精确的多序列比较方法是当务之急。

2.1.3 人类基因的识别和鉴定

使用基因组信息学的方法是发现和鉴定新基因的重要手段。目前,基因识别和鉴定可从以下方面进行:①根据已知基因序列资料;②根据可表达序列标签(EST);③基因组扫描;④对染色体特异性cos-mid进行直接的cDNA选择;⑤DNA芯片技术;⑥外显子捕获及相关原理等。

2.1.4 基因的编码序列、非编码序列及调控序列研究

人类基因组中约95%为非编码区。通过基因组信息学的方法从基因组DNA测序数据中确定编码区、并寻找非编码区域的编码特征、信息调节与表达规律是对基因组结构分析的热点课题。

2.1.5 完整基因组的比较基因组学研究

在后基因组时代,科学家将获得越来越多的完整基因组,通过不同物种间基因组的比较研究,找出引起差异的基因、DNA序列甚至染色体组织上的不同,以期认识进化、种族血缘、寿命、疾病和衰老等生命现象本质。我国已完成了南、北方两个汉族人群和西南、东北地区12个少数民族遗传隔离群基因组的收集、保存、若干位点的比较研究。有科学家估计,不同人种间基因组的差别不大于0.1%,人猿间的差别不大于1%。此外,还应开展与酵母、细菌、河豚鱼、水稻、小鼠等模式生物进行的比较基因组学研究。

2.2 基因功能研究

人类后基因组计划的关键点是基因的功能研究,这也是对功能基因加以开发利用研究的基础。主要包括以下内容:

1)基因表达谱的绘制

基因表达mRNA的水平反映了在一定环境、细胞类型、生长阶段和一定细胞状态下基因的功能信息。因此绘制所有基因的表达谱非常重要。包括每种组织细胞中的基因表达谱、细胞不同发育阶段的基因表达谱、正常和病理状态下的基因表达谱、治疗条件下的基因表达谱等。为此建立了新的技术方法,如微点阵技术(microarray)、改进的定量PCR技术、原位杂交技术等。

2)基因功能的研究方法与技术

经典遗传学方法是用化学物质或辐射进行诱变处理,使整个基因组产生随机突变来推测该基因的功能。随着DNA序列分析的发展,通过破坏或操纵基因的手段,使靶基因在模式生物基因组中被敲除、封阻或增加,来检测模式生物的生物学功能改变,是了解特定基因功能的重要途径之一。20世纪80年代发展起来的反义技术和基因打靶技术都是基因功能研究的有力手段,也是基因治疗和药物设计研究的有用工具。此外,还应发展能暂时性破坏基因表达的通用试剂。

3)蛋白质组学的研究

由于生物功能的主要体现者是蛋白质,因此不仅要从基因角度来研究,还应从蛋白质的层次上来研究相关基因的结构和功能。蛋白质组学研究中的新方法有:采用双向凝胶电泳和测序质谱技术;建立蛋白质结构数据库,以研究其结构和功能的关系,并判断相关基因的结构与功能的关系;采用显微镜定位、定量技术和FISH、Confocal等技术对蛋白质的结构、功能及相互作用进行阐释,以了解基因的结构与功能的关系。

2.3 我国后基因组研究现状和策略

基因功能研究涉及分子生物学、细胞生物学、蛋白质化学、免疫学、药理学、生物信息学等多学科的分工合作,并需依赖先进的生物技术手段支撑和政府的支持投入以及风险基金的筹措等,所以它具有相当难度但同时也具有巨大的研究开发潜力。目前,我国的基因功能研究处于滞后状态,这也将对其下游的人类基因组的应用与开发研究带来影响。因此必须加强分工合作,发现和研究我国自己的重要功能基因,依我国的国情,制定研究开发的策略。如我国有学者提出:一个基因决不止一个功能,而是多功能的,现已知的某些功能也可能不是最重要的,有意识地研究开发一些老的传统基因的新功能有重要意义。

1990年启动的人类基因组计划及其后相继开展的人类后基因组计划是一项人类科学史上最伟大的认识自身的跨世纪的科学工程。30年来,该人类基因组工程在全球性的合作研究中已取得了巨大的成就:2000年6月26日人类基因组序列和结构的工作草图已提前绘制完成;同时,基因功能研究和应用与开发等实质性的研究也已取得了令人振奋的成果。这将对整个生命科学研究及人们的生活产生深刻的影响,相信在不久的将来,其成果在医药领域的开发与应用必将大大造福于人类健康。

参考文献:

[1] Dulbecco R. Aturning poin tincancer research:sequencing the human genume[J].Science,1986,231: 1055—1056.

[2] Collins F S, Galas D. A new five-year plan for the U. S. Hunan Genome Project[J] .Science,1993,262: 43—46.

[3] 李晋楠.人类基因组计划研究进展综述[J].浙江师大学报(自然科学版), 1999,22(3): 69—72.

[4] Venter J, Smith H O, Hood L. A new strategy forgenom sequencing[J].Nature,1996,381: 363—366.

[5] Schena M, Shalon D, Davis R W, et al.Quantitative monitoring of gene expression patterns with a complement ary DNA micro array [ J].Science,1995,270: 467—470.

[6] 丁 立,刘国仰,杨焕明.人类基因组计划中的外显子捕获技术[J].遗传,1998,20(3): 35—37.

[7] 陈 竺,黄 薇,傅 刚,等.人类基因组计划现状与展望[J].自然杂志,22(3): 125—132.

[8] 刘万清,贺 林.自动化大规模基因组扫描与连锁分析[J].生命科学,1998,10(5): 233—235.

[9] 范玉新,李 霞.基因功能分析与鉴定的新进展[J].国外医学:分子生物学分册,1998,20(3):100—104.

[10] Ingsbury, David T. Bioin form aticsindrug discovery[J].Drug Development Research,1997,41(3—4): 120—128.

[11 ] Timeline A. History of the Human Genome Project[J].Science,2001,291: 1195—1203.

[12 ] 骆建新,郑崛村,马用信,等.人类基因组计划与后基因组时代[J].中国生物工程杂志,2003,23(11): 87—94.

[13] Venter J C, Adams M D, Myers E W, et al. Thesequence of the human genome[J].Science,2001,291(5507): 1304—1351.

[14] Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome[J].Nature,2001,409(6822): 860—921.

[15] Bork P, Dandekar T, Diaz Lazcoz Y, et al.Predicting function: from genes to genomes and back [J].J Mol Biol,1998,283(4): 707—725.

[16] Hanash S M. Operomics: molecular analysis of tissues from DNA to RNA to ptotein[J].Clin Chem Lab Med,2000,38(9): 805—813.


相关内容

  • 人类基因组计划的进展和意义
  • 摘 要:1990年人类基因组计划正式启动,这一耗资数十亿美元的15年计划旨在阐明人类基因组中30亿个碱基对的序列,发现所有人类基因并弄清它在染色体上的位置,破译人类全部遗传信息,使人类进一步的认识自我.整个人类基因组测序工作的基本完成,为人类生命科学开辟了一个新纪元,它对生命本质.人类进化.生物遗传 ...

  • 人类基因组计划研究的进展及其意义
  • 人类基因组计划研究的进展及其意义 摘要:文章综述了人类基因组计划研究和进展的情况 关键词: 正文: 定义 人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的.美国.英国.法国.德国.日本和我国科学家共同参与了这一预算达30亿 ...

  • 9人类基因组研究
  • 9.1 人类基因组计划简介 人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的.美国.英国.法国.德国.日本和我国科学家共同参与了这一价值达30亿美元的人类基因组计划.这一计划旨在为30多亿个碱基对构成的人类基因组精确测序, ...

  • 人类基因组计划研究进展.doc
  • 人类基因组计划 摘要:综述了人类基因组计划的主要研究内容.研究历程和成果.人类基因组计划的研究对人类社会的意义以及我国人类基因组研究的概况等. 关键词:人类基因组计划 研究进展 成果 后基因组学 人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出, ...

  • 黑猩猩:人类的镜子
  • 尽管黑猩猩基因组图谱与人类的相差只有4%,但人类并不能由此回答自己何以为人 如果说,人类基因组图谱是包含人体生命一切奥秘的天书的话,那么,我们周围千千万万种其他生物的基因图谱都可以被看作是用来解读这本天书的参考书目.而在这些"参考书"中,我们的近亲灵长类动物的基因图谱显然又是最具 ...

  • 人民政协报
  • 生命研究:进入大科学时代 人民政协网 www.rmzxb.com.cn 日期:2009-03-04 ●生命科学的研究重点,正从基因组学的基础数据积累转为系统生物医学和整合生物技术的转化研究. ●人类基因组计划虽然已告一段落,但基因组科学并未结束.随着基因组科学自身的不断发展,它正带动生命科学和医学进 ...

  • 人类基因组计划带来的伦理问题
  • 人类基因组计划带来的伦理问题 摘要:当今世界,最能煽动人们情绪的科学研究莫过于人类基因组计划(Human GenomeProject,简称HGP) 了,它是人类科学史上的一个里程碑.然而人类基因组的研究及其应用,将不可避免地给人类带来一系列的伦理.道德问题,如基因与"人种优劣"问 ...

  • 科学家用基因工程与实验动物追溯人类进化
  • 发布时间:2015-07-23 06:45 来源:中国科学报 科学家将HARE5 增强子插入小鼠胚胎.(图片来源:J. LOMAX BOYD 等) 2006年,美国加州大学圣克鲁兹分校计算学家宣布,他们瞥见了让人类之所以为人的DNA.他们比较了脊椎动物的基因序列,并设计出一个包含约50个DNA区域的 ...

  • 基因工程技术对人类社会的影响
  • 基因工程技术对人类社会的影响 摘要:基因是决定生物性状的基本因子,随着人们对基因认识的不断深入,基因工程技术发展到了一个新的历史阶段.基因工程在现代科技进步和社会发展中发挥着日益重要的作用,同时基因工程技术在不断解决人类社会所面临日益尖锐的问题和矛盾的同时,也带来了许多令人担忧的社会问题.如何引导基 ...