生命综合一资料

一、简答题(任意选择其中1题回答, 7分)

1. 假如你通过测序得到了小鼠的一个未知基因序列,如何才能确定该基因在小鼠基因组

中的位置?如何获得其编码的蛋白质的序列?如何预测其编码产物的亚细胞定位?如果该基因编码1个膜蛋白,你又如何预测其序列上的跨膜区?

1. 首先对查询序列作如下处理:

(1)给定单词(word )长度w (一般蛋白质为3,核酸为11)和打分矩阵,将长度为n 的查询序列从第一位到最后一位拿到n-w+1个单词

(2)创建一个单词列表,其中的单词为经与上述单词比对打分后分数高于T 的长度为w 的单词。

(3)单词表中的单词称为种子(seed),将单词表中的每一个单词在所有的数据库序列中找到其出现的每一个位置。

然后打开BLAST ,选择nucleotide blast,输入处理了的序列,选择合适的数据库,选择相应的参数,包括目标序列数量,Word size,match/mismatch scores,等点击BLAST 键,查看结果(基因的定位、功能等),在protein ID 中找到其编码的蛋白质,点击FASTA ,查看该蛋白质的氨基酸序列。

其中在操作时有一些注意事项1、利用其他字母掩盖低复杂序列区域,防止假阳性的产生。2、用动态规划的方法沿左右两个方向延伸种子直到打分不低于某一个临界分值(允许暂时低于该值)。3、BLAST 算法得到的结果的统计显著性分析:计算E-value 。结果:E 值:越低越好;序列比对得分Score: 越高越好;

高得分片段的相似度Identity :越高越好。

2. 你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维

结构是否已知。根据你从本课程中学到的知识,该如何寻找答案?

SWISS-model :同源建模方法预测蛋白质结构。一般由四步完成。

1。从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB ,SWISS-PROT 等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板;

2。待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;

3。建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;

4。利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。

具体操作:打开BLAST ,选择Uniprot BLAST ,输入氨基酸序列,选择蛋白质数据库,点击BLAST 键,查看结果(蛋白质信息),查看蛋白质是否具有三维机构数据,若有则找到PDB 中的标识符,利用它找到蛋白三维结构,若无则利用该蛋白的氨基酸进行蛋白三维结构预测。

二、论述题(任意选择其中2题回答,每题9分,共18分)

1. 以细胞分化或疾病发生发展为模型,从遗传信息流动的角度谈谈基因组是如何解码的,

其中有哪些地方值得我们研

中心法则及其补充内容告诉了我们遗传信息的流动方向。过程包含了如下6点:DNA 的复制,遗传信息流动方向由DNA →DNA ;DNA 的转录,遗传信息流动方向由DNA →RNA ;翻译,遗传信息流动方向由RNA →蛋白质;RNA 的复制,遗传信息流动方向由RNA →RNA ;RNA 的逆转录,遗传信息流动方向由RNA →DNA ;蛋白质的复制,遗传信息流动方向由蛋白质→蛋白质. 其中任何一个环节出现了问题,都可能引起疾病的发生,比如着色性干皮病(DNA 水平),表皮细胞中的DNA 在紫外光下会受到破坏,, 着色性干皮症患者细胞内通常有一种酵素无法运行,导致皮肤丧失修复能力。或者疯牛病(蛋白质水平),其由于致病Prion 蛋白空间折叠出现了问题从而引起疯牛病,还有很多由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、等等。这其

中的很多小环节出现了问题都可能造成巨大的影响,但同样给了我们治疗疾病的新思路,即从遗传信息流动的途径的环节入手,即使改变一个小小的基因,蛋白都可以引起个人表型的改变,从而治愈疾病。

2. 试述核受体配体依赖性转录激活机制。

核受体家族由A/B,C ,D ,E 四大具有不同功能的结构域组成。A/B域的N 端接受配体非依赖的顺式激活,C 端调节该核受体与其他家族成员的结合从而影响核受体与DNA 的结合,还与核受体对目标DNA 的选择有关;保守的C 域决定DNA 结合活性,是核受体的特征性区域,同时影响核受体对其伴侣核受体的选择;D 域为一可弯曲的铰链区,带有核定位的信息,并连接C 与E 两区域;E 域能够与配体结合,二聚体化并被激活,发挥转录因子的作用调控下游靶基因转录。细胞核内,核受体通过三种基本的作用模式调节基因转录:1,核受体与其伴侣转录因子的二聚体受到其配体亲脂性小分子激活后结合至靶DNA 的靶序列从而调节转录;2,该二聚体受到配体激活后招募其他转录因子,通过其他转录因子与靶DNA 的靶序列结合调节转录;3,该二聚体受到细胞表面受体或CDK 蛋白激酶的激活而与靶DNA 的靶序列结合调节转录。此外,最新研究发现核受体能够与胞浆蛋白发生相互作用,提示其可能具有转录因子之外的功能。核受体与相应的配体结合后同细胞内的辅助激活因子CBP/P300、PCAF、P/CIP和SRC家族等结合形成的复合物能使组蛋白乙酰化促进基因的转录,1. 其与激动剂结合,使受体改变自身配体结合结构域构象用于募集co-activators, 从而使受体与基础转录器更加有效并激活转录。2.显著增加受体的反式激活作用而不刺激基础转录活性;过表达时,可特意的反转不同受体间的相互抑制;必须含有自发的可转移激活域。

3. . 在营养缺乏情况下胚胎成纤维细胞停止分裂,甚至发生自噬以及死亡。据文献报道,

蛋白A 可能诱导了细胞周期的阻滞,请设计实验探索该蛋白在调控细胞周期或细胞凋亡方面的作用。

细胞周期研究策略和方法:

有丝分裂摇落法:得到M 期细胞

化学同步法:DNA 合成阻断,同步于S 期;中期阻断法,同步于M 期。

免疫组化、western blot:检测参与细胞周期调控的蛋白质

Brdu 掺入实验:鉴别S-期细胞

显微注射:(在高倍倒置显微镜下,利用显微操作器(Micromanipulator ),控制显微注射针在显微镜视野内移动的机械装置,用来进行细胞或早期胚胎操作的一种方法)

细胞融合:细胞核和细胞质对细胞周期进程的影响

细胞凋亡的研究方法和策略:

形态学检测:染色(HE 染色、吖啶橙荧光染色、细胞骨架染色)、光镜观察、扫描电镜观察、投射电镜观察。

DNA 琼脂糖凝胶电泳(琼脂糖凝胶电泳是用琼脂糖作支持介质的一种电泳方法。其分析原理与其他支持物电泳最主要区别是:它兼有“分子筛”和“电泳”的双重作用。)

tunel technique(DNA 原位末端标记-tunel 法染色)

彗星电泳(包括测定DNA 双链断裂的中性单细胞凝胶电泳技术和测定DNA 单链断裂的碱性单细胞凝胶电泳技术)

流式细胞检测(是一种在功能水平上对单细胞或其他生物粒子进行定量分析和分选的检测手段,它可以高速分析上万个细胞,并能同时从一个细胞中测得多个参数,与传统的荧光镜检查相比,具有速度快、精度高、准确性好等优点,成为当代最先进的细胞定量分析技术)

目的:探究蛋白A 是否影响细胞周期或细胞凋亡

方法:1、利用设计并构建蛋白A 相关Sirna 干扰胚胎成纤维细胞蛋白A 的表达,抑制其表达水平,培养过后采用流式细胞技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡减少,说明蛋白A 对细胞阻滞与细胞凋亡起促进作用。

2. 利用设计病毒使胚胎成纤维细胞蛋白A 基因过表达,提高其蛋白表达水平,培养过后采用流式细胞学技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡增加,说明蛋白A 对细胞阻滞与细胞凋亡起促进作用。

6. 新基因产生的7种途径。

1. ①基因复制(Gene duplication, 或称基因倍增),到目前为止,最重要和最普遍认为的产生新

基因拷贝的方式就是基因倍增,其速率是 0.01 /基因/百万年。其可以分为3类,1. 整个基因重复,2. 部分基因重复,3单个基因重复。其中非整个基因重复是通过不对称交换,姐妹染色体之间的不等交换,DNA 放大实现的。

2. ②结构域混排domain shuffling 。来自于不同基因的两个或者多个结构域能够被异常得拼接

在一起从而产生新的嵌合结构并表达新的功能。其主要是通过非常规重组和后移区域插入实现的。

3. ③基因水平转移gene horizontal transfer,,当一个基因在两个不同的个体间转移时候,就发生

了基因的水平转移,经常发生在原核生物之间。其载体包括噬菌体,质粒,整合子,转座子,基因组岛

4. ④逆转座Retroposition 。在基因组内存在着通过DNA 转录为RNA 后,再经逆转录成为cDNA

并插入到基因组的新位点上的因子,被称为逆转座子(retrotransposons )。逆转座作用的关键酶为逆转录酶和整合酶。

5. ⑤基因融合/分裂gene fusion/gene fission。两个相邻的基因能融合成一个基因,一个基因也

可以分裂成两个基因,其在原核生物里面更常见(0.5%),基因融合在真核生物里更常见。

6. ⑥从头起源de novo origination。一个编码区域从一个目前已知的非编码区起源,在整个基因

起源是罕见的。比如果蝇精子特异的动力蛋白中间链基因sadic 。

7. 可动元件(mobile element ),一个可移动的元件,也被认为是转座元件(TE ),其片段可以

被宿主基因直接获取。

8. 混合机制:新基因可以通过上述机制产生,既可以是单个机制在起作用,也可以是多种机制

的共同作用。

基因注释和功能元件

表型(phenotypes ):生物体可观察的所有特性(特显、性状、特征)的总和,受到基因型和环境的影响。(疾病也是一种表型)

• 人类基因组的结构和特点 结构:

子边界拼接共有序列

• 编码蛋白基因的预测确认:与之前注释的cDNA 匹配,同生物中EST 匹配,GenBank 中有核苷酸或概念上转录蛋白序列的相似,蛋白结构预测与PFAM 结构域匹配,有可识别的启动子序列,在突变位点知道其表型

基因组注释(Genome annotation) 是利用生物信息学方法和工具, 对基因组所有基因的生物学功能进行高通量注释, 是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全

基因组序列中所有基因的确切位置。从基因组序列预测新基因, 现阶段主要是3 种方法的结合: (1) 分析mRNA 和EST 数据以直接得到结果; (2) 通过相似性比对从已知基因和蛋白质序列得到间接证据[1] ; (3) 基于各种统计模型和算法从头预测。对预测出的基因进行高通量功能注释可以借助于以下方法, 利用已知功能基因的注释信息为新基因注释: (1) 序列数据库相似性搜索; (2) 序列模体(Motif) 搜索; (3) 直系同源序列聚类分析(Cluster of orthologousgroup ,COG) [2] 。随着微生物全基因组序列测定速率的加快, 开发有Web 接口的高效、综合基因组注释系统十分必要。

基因组功能元件包括编码蛋白基因,非编码蛋白基因,调控区域,染色体结构维持和调节染色体复制动力DNA 元件,到目前为止,ENCODE 计划主要集中研究了44个靶标,共3000万个DNA 碱基对,ENCODE 计划推翻了传统观点,即我们的基因组蓝图作为一群独立的基因,漂浮在“垃圾基因”的大海上,事实上,人类基因组蓝图30亿个化学字母组成了一个极为复杂的网络,在这个网络中,基因,调控序列和其他DNA 序列以一种人们尚未了解的重叠方式相互作用,共同控制着人类的生理活动。传统理论认为,与生理功能相关的重要DNa 序列往往位于基因组中的“进化限制”区域,他们在物种进化过程中更容易保存下来,但是最新的研究表明,大约人类一半的基因组中的功能元件在进化过程中,不会受到很大的限制,科学家认为,哺乳动物缺乏“进化限制”这一点很可能意味着许多物种基因组都囊括了包括大量包括RNA 转录副本在内的功能元件,在进化过程中,这些功能元件成了基因仓库。

定义:功能元件即能编码确定产物如蛋白质或非编码RNA ,或者表现出可以复制的生化信号如蛋白质结合或特异的染色质结构的独立基因片段。

基因型环境温度海拔湿度光照饮食等等等于表型基因上突变重排缺失异位在中心法则的任何一个环节出了问题都会引起表型的不同 非编码蛋白基因的发现:二级结构;同源性;实验 功能性元件: ENCyclopedia of DNA Elements(ENCODE ) Decoding the genome:正向遗传学(表型-基因型),反向遗传学(基因型-表型,转/敲基因基因密度:碱基占Ensembl 数据库基因或UCSC browser数据库人类mRNA 最好的BLAT 平面动物、ENCODE 计划) 图的百分比。

一、简答题(任意选择其中1题回答, 7分)

1. 假如你通过测序得到了小鼠的一个未知基因序列,如何才能确定该基因在小鼠基因组

中的位置?如何获得其编码的蛋白质的序列?如何预测其编码产物的亚细胞定位?如果该基因编码1个膜蛋白,你又如何预测其序列上的跨膜区?

1. 首先对查询序列作如下处理:

(1)给定单词(word )长度w (一般蛋白质为3,核酸为11)和打分矩阵,将长度为n 的查询序列从第一位到最后一位拿到n-w+1个单词

(2)创建一个单词列表,其中的单词为经与上述单词比对打分后分数高于T 的长度为w 的单词。

(3)单词表中的单词称为种子(seed),将单词表中的每一个单词在所有的数据库序列中找到其出现的每一个位置。

然后打开BLAST ,选择nucleotide blast,输入处理了的序列,选择合适的数据库,选择相应的参数,包括目标序列数量,Word size,match/mismatch scores,等点击BLAST 键,查看结果(基因的定位、功能等),在protein ID 中找到其编码的蛋白质,点击FASTA ,查看该蛋白质的氨基酸序列。

其中在操作时有一些注意事项1、利用其他字母掩盖低复杂序列区域,防止假阳性的产生。2、用动态规划的方法沿左右两个方向延伸种子直到打分不低于某一个临界分值(允许暂时低于该值)。3、BLAST 算法得到的结果的统计显著性分析:计算E-value 。结果:E 值:越低越好;序列比对得分Score: 越高越好;

高得分片段的相似度Identity :越高越好。

2. 你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维

结构是否已知。根据你从本课程中学到的知识,该如何寻找答案?

SWISS-model :同源建模方法预测蛋白质结构。一般由四步完成。

1。从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB ,SWISS-PROT 等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板;

2。待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;

3。建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;

4。利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。

具体操作:打开BLAST ,选择Uniprot BLAST ,输入氨基酸序列,选择蛋白质数据库,点击BLAST 键,查看结果(蛋白质信息),查看蛋白质是否具有三维机构数据,若有则找到PDB 中的标识符,利用它找到蛋白三维结构,若无则利用该蛋白的氨基酸进行蛋白三维结构预测。

二、论述题(任意选择其中2题回答,每题9分,共18分)

1. 以细胞分化或疾病发生发展为模型,从遗传信息流动的角度谈谈基因组是如何解码的,

其中有哪些地方值得我们研

中心法则及其补充内容告诉了我们遗传信息的流动方向。过程包含了如下6点:DNA 的复制,遗传信息流动方向由DNA →DNA ;DNA 的转录,遗传信息流动方向由DNA →RNA ;翻译,遗传信息流动方向由RNA →蛋白质;RNA 的复制,遗传信息流动方向由RNA →RNA ;RNA 的逆转录,遗传信息流动方向由RNA →DNA ;蛋白质的复制,遗传信息流动方向由蛋白质→蛋白质. 其中任何一个环节出现了问题,都可能引起疾病的发生,比如着色性干皮病(DNA 水平),表皮细胞中的DNA 在紫外光下会受到破坏,, 着色性干皮症患者细胞内通常有一种酵素无法运行,导致皮肤丧失修复能力。或者疯牛病(蛋白质水平),其由于致病Prion 蛋白空间折叠出现了问题从而引起疯牛病,还有很多由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、等等。这其

中的很多小环节出现了问题都可能造成巨大的影响,但同样给了我们治疗疾病的新思路,即从遗传信息流动的途径的环节入手,即使改变一个小小的基因,蛋白都可以引起个人表型的改变,从而治愈疾病。

2. 试述核受体配体依赖性转录激活机制。

核受体家族由A/B,C ,D ,E 四大具有不同功能的结构域组成。A/B域的N 端接受配体非依赖的顺式激活,C 端调节该核受体与其他家族成员的结合从而影响核受体与DNA 的结合,还与核受体对目标DNA 的选择有关;保守的C 域决定DNA 结合活性,是核受体的特征性区域,同时影响核受体对其伴侣核受体的选择;D 域为一可弯曲的铰链区,带有核定位的信息,并连接C 与E 两区域;E 域能够与配体结合,二聚体化并被激活,发挥转录因子的作用调控下游靶基因转录。细胞核内,核受体通过三种基本的作用模式调节基因转录:1,核受体与其伴侣转录因子的二聚体受到其配体亲脂性小分子激活后结合至靶DNA 的靶序列从而调节转录;2,该二聚体受到配体激活后招募其他转录因子,通过其他转录因子与靶DNA 的靶序列结合调节转录;3,该二聚体受到细胞表面受体或CDK 蛋白激酶的激活而与靶DNA 的靶序列结合调节转录。此外,最新研究发现核受体能够与胞浆蛋白发生相互作用,提示其可能具有转录因子之外的功能。核受体与相应的配体结合后同细胞内的辅助激活因子CBP/P300、PCAF、P/CIP和SRC家族等结合形成的复合物能使组蛋白乙酰化促进基因的转录,1. 其与激动剂结合,使受体改变自身配体结合结构域构象用于募集co-activators, 从而使受体与基础转录器更加有效并激活转录。2.显著增加受体的反式激活作用而不刺激基础转录活性;过表达时,可特意的反转不同受体间的相互抑制;必须含有自发的可转移激活域。

3. . 在营养缺乏情况下胚胎成纤维细胞停止分裂,甚至发生自噬以及死亡。据文献报道,

蛋白A 可能诱导了细胞周期的阻滞,请设计实验探索该蛋白在调控细胞周期或细胞凋亡方面的作用。

细胞周期研究策略和方法:

有丝分裂摇落法:得到M 期细胞

化学同步法:DNA 合成阻断,同步于S 期;中期阻断法,同步于M 期。

免疫组化、western blot:检测参与细胞周期调控的蛋白质

Brdu 掺入实验:鉴别S-期细胞

显微注射:(在高倍倒置显微镜下,利用显微操作器(Micromanipulator ),控制显微注射针在显微镜视野内移动的机械装置,用来进行细胞或早期胚胎操作的一种方法)

细胞融合:细胞核和细胞质对细胞周期进程的影响

细胞凋亡的研究方法和策略:

形态学检测:染色(HE 染色、吖啶橙荧光染色、细胞骨架染色)、光镜观察、扫描电镜观察、投射电镜观察。

DNA 琼脂糖凝胶电泳(琼脂糖凝胶电泳是用琼脂糖作支持介质的一种电泳方法。其分析原理与其他支持物电泳最主要区别是:它兼有“分子筛”和“电泳”的双重作用。)

tunel technique(DNA 原位末端标记-tunel 法染色)

彗星电泳(包括测定DNA 双链断裂的中性单细胞凝胶电泳技术和测定DNA 单链断裂的碱性单细胞凝胶电泳技术)

流式细胞检测(是一种在功能水平上对单细胞或其他生物粒子进行定量分析和分选的检测手段,它可以高速分析上万个细胞,并能同时从一个细胞中测得多个参数,与传统的荧光镜检查相比,具有速度快、精度高、准确性好等优点,成为当代最先进的细胞定量分析技术)

目的:探究蛋白A 是否影响细胞周期或细胞凋亡

方法:1、利用设计并构建蛋白A 相关Sirna 干扰胚胎成纤维细胞蛋白A 的表达,抑制其表达水平,培养过后采用流式细胞技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡减少,说明蛋白A 对细胞阻滞与细胞凋亡起促进作用。

2. 利用设计病毒使胚胎成纤维细胞蛋白A 基因过表达,提高其蛋白表达水平,培养过后采用流式细胞学技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡增加,说明蛋白A 对细胞阻滞与细胞凋亡起促进作用。

6. 新基因产生的7种途径。

1. ①基因复制(Gene duplication, 或称基因倍增),到目前为止,最重要和最普遍认为的产生新

基因拷贝的方式就是基因倍增,其速率是 0.01 /基因/百万年。其可以分为3类,1. 整个基因重复,2. 部分基因重复,3单个基因重复。其中非整个基因重复是通过不对称交换,姐妹染色体之间的不等交换,DNA 放大实现的。

2. ②结构域混排domain shuffling 。来自于不同基因的两个或者多个结构域能够被异常得拼接

在一起从而产生新的嵌合结构并表达新的功能。其主要是通过非常规重组和后移区域插入实现的。

3. ③基因水平转移gene horizontal transfer,,当一个基因在两个不同的个体间转移时候,就发生

了基因的水平转移,经常发生在原核生物之间。其载体包括噬菌体,质粒,整合子,转座子,基因组岛

4. ④逆转座Retroposition 。在基因组内存在着通过DNA 转录为RNA 后,再经逆转录成为cDNA

并插入到基因组的新位点上的因子,被称为逆转座子(retrotransposons )。逆转座作用的关键酶为逆转录酶和整合酶。

5. ⑤基因融合/分裂gene fusion/gene fission。两个相邻的基因能融合成一个基因,一个基因也

可以分裂成两个基因,其在原核生物里面更常见(0.5%),基因融合在真核生物里更常见。

6. ⑥从头起源de novo origination。一个编码区域从一个目前已知的非编码区起源,在整个基因

起源是罕见的。比如果蝇精子特异的动力蛋白中间链基因sadic 。

7. 可动元件(mobile element ),一个可移动的元件,也被认为是转座元件(TE ),其片段可以

被宿主基因直接获取。

8. 混合机制:新基因可以通过上述机制产生,既可以是单个机制在起作用,也可以是多种机制

的共同作用。

基因注释和功能元件

表型(phenotypes ):生物体可观察的所有特性(特显、性状、特征)的总和,受到基因型和环境的影响。(疾病也是一种表型)

• 人类基因组的结构和特点 结构:

子边界拼接共有序列

• 编码蛋白基因的预测确认:与之前注释的cDNA 匹配,同生物中EST 匹配,GenBank 中有核苷酸或概念上转录蛋白序列的相似,蛋白结构预测与PFAM 结构域匹配,有可识别的启动子序列,在突变位点知道其表型

基因组注释(Genome annotation) 是利用生物信息学方法和工具, 对基因组所有基因的生物学功能进行高通量注释, 是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全

基因组序列中所有基因的确切位置。从基因组序列预测新基因, 现阶段主要是3 种方法的结合: (1) 分析mRNA 和EST 数据以直接得到结果; (2) 通过相似性比对从已知基因和蛋白质序列得到间接证据[1] ; (3) 基于各种统计模型和算法从头预测。对预测出的基因进行高通量功能注释可以借助于以下方法, 利用已知功能基因的注释信息为新基因注释: (1) 序列数据库相似性搜索; (2) 序列模体(Motif) 搜索; (3) 直系同源序列聚类分析(Cluster of orthologousgroup ,COG) [2] 。随着微生物全基因组序列测定速率的加快, 开发有Web 接口的高效、综合基因组注释系统十分必要。

基因组功能元件包括编码蛋白基因,非编码蛋白基因,调控区域,染色体结构维持和调节染色体复制动力DNA 元件,到目前为止,ENCODE 计划主要集中研究了44个靶标,共3000万个DNA 碱基对,ENCODE 计划推翻了传统观点,即我们的基因组蓝图作为一群独立的基因,漂浮在“垃圾基因”的大海上,事实上,人类基因组蓝图30亿个化学字母组成了一个极为复杂的网络,在这个网络中,基因,调控序列和其他DNA 序列以一种人们尚未了解的重叠方式相互作用,共同控制着人类的生理活动。传统理论认为,与生理功能相关的重要DNa 序列往往位于基因组中的“进化限制”区域,他们在物种进化过程中更容易保存下来,但是最新的研究表明,大约人类一半的基因组中的功能元件在进化过程中,不会受到很大的限制,科学家认为,哺乳动物缺乏“进化限制”这一点很可能意味着许多物种基因组都囊括了包括大量包括RNA 转录副本在内的功能元件,在进化过程中,这些功能元件成了基因仓库。

定义:功能元件即能编码确定产物如蛋白质或非编码RNA ,或者表现出可以复制的生化信号如蛋白质结合或特异的染色质结构的独立基因片段。

基因型环境温度海拔湿度光照饮食等等等于表型基因上突变重排缺失异位在中心法则的任何一个环节出了问题都会引起表型的不同 非编码蛋白基因的发现:二级结构;同源性;实验 功能性元件: ENCyclopedia of DNA Elements(ENCODE ) Decoding the genome:正向遗传学(表型-基因型),反向遗传学(基因型-表型,转/敲基因基因密度:碱基占Ensembl 数据库基因或UCSC browser数据库人类mRNA 最好的BLAT 平面动物、ENCODE 计划) 图的百分比。


相关内容

  • 生命诚可贵_语文综合性学习方案设计初中语文教案_[教学教案]
  • ■教案:生命诚可贵--语文综合性学习方案设计初中语文教案 项目创意:按照<高中新课程标准>的要求,通过语文教学引导学生"形成健康美好的情感和奋发向上的人生态度",培养学生的人文素养. 项目名称:生命诚可贵 时间范围:2004年9月到10月 参加人员:一个教学班的学生, ...

  • 花与我们的生活
  • <花与我们的生活>综合实践活动教学方案设计 设计者:hrx 一.主题的提出 "水是生命之源,绿是生命之本",千姿百态.丰富多彩的花一年四季都点缀着我们的生活,美化着我们的环境,让我们一起走进花的世界,领略花的风采,探究花的文化. 二.活动目标 1.培养学生亲近自然,对 ...

  • 珍爱生命,学会自我防护案例
  • 珍爱生命,学会自我防护 一.活动背景: 改革开放和经济发展,为我们创造了一个更为开放的环境.经济全球化和文化多元化的发展,为广大学生学习知识.开阔视野.增长智慧提供了宽广的平台.但随之而来的消极因素也在一定程度上影响了青少年学生的健康成长.享乐主义.拜金主义.极端个人主义等不良思想,导致部分学生道德 ...

  • 小学四年综合综合实践教案
  • 综合实践教案 学校 年级 教师 四年级综合实践教案 主题一:走进春天 第一课时:确定主题 第二课时:制定方案 第三课时:分组行动 第四课时:交流展示 第五课时:后续活动 一.活动背景: 东风来了,春天的脚步近了.渐渐地,青的草,绿的叶,可爱的燕子,各种新鲜的水果.蔬菜„„形成了多姿多彩的春天.学生享 ...

  • 生命之源--水教学反思
  • 反思一:生命之源--水教学反思 <生命之源--水>一课属于"综合.探索"学习领域.本课让学生通过实践活动充分发挥美术实践能力,通过收集水的相关资料和设计制作"珍惜水资源"的队报,培养学生关心社会问题和热爱祖国的情怀. 我通过介绍节水标志,理解标识含 ...

  • 综合实践活动_水与我们的生活_设计方案
  • 水与我们的生活 --综合实践活动教学设计 罗山县龙山乡常岗小学 赵 艳 一.活动设计的背景 水是地球的生命之源,没有了水,地球上的人类和动植物都无法生存.而我们,也就不会拥有如此繁荣的大家园.虽然地球被称为水球,可在看似源源不断的水流中,真正能被人类利用的淡水却少得可怜.我们的学生对于水的认识是既熟 ...

  • [清明节话清明]综合实践课教学设计
  • 清明节话清明 --五年级综合实践活动教学案例 一.活动主题的提出: "清明"首先是一个地理名词,从地理学上来说,它属于二十四节气之第五节气,在4月4日或5日,表示天气晴朗温暖,草木返青.它也是一个文化名词,因为负载着祭祖.扫墓.踏青的习俗,它被古往今来的文人墨客赋予了厚重的文化内 ...

  • 医学伦理学考试重点资料
  • 伦理:在中国古代,一般指称事物,较人伦道德更广泛,有统类条理的意思."伦理"一词在我国最早见于<礼记·乐记篇>,"乐者,通伦理者也."东汉郑玄认为"伦,犹类也;理,犹分也."在人与人的关系上,"伦理"比道德更 ...

  • 稳态概念的构建
  • 新课标<稳态与环境>模块研究结题论文 稳态概念的构建 新课标高中生物必修分为三个模块:<分子与细胞>模块生命的物质性观点.系统论观点比较突出:<遗传与进化>模块多样性与共同性相统一.变与不变相统一的观点比较突出:<稳态与环境>模块生物与环境相统一的观点 ...

  • 罗成兴讲的申论答题方法核心笔记总结
  • 罗成兴讲的申论答题方法核心笔记总结 Ⅰ申论命题原理--按要求整理文字材料(摘抄.概括出要点,引申出论点) (一) 答题内容:从给定材料中提炼要点(要素):问题--原因(推断或评价)--危害或意义(评估和权衡)--对策(方案或措施) (二)分条作答:a. 按材料.段落顺序罗列:b. 按不同要素:c. ...