本 科 毕 业 论 文
miRNA-156基因家族进化及功能分析
2015年5月20日
独 创 声 明
本人郑重声明:所呈交的毕业论文(设计) ,是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。尽我所知,除文中已经注明引用的内容外,本论文(设计)不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。
此声明的法律后果由本人承担。
作者签名:
二〇一 年 月 日
毕业论文(设计)使用授权声明
本人完全了解鲁东大学关于收集、保存、使用毕业论文(设计)的规定。
本人愿意按照学校要求提交论文(设计)的印刷本和电子版,同意学校保存论文(设计)的印刷本和电子版,或采用影印、数字化或其它复制手段保存论文(设计);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布论文(设计)的部分或全部内容,允许他人依法合理使用。
(保密论文在解密后遵守此规定)
作者签名:
二〇一 年 月 日
毕业论文结题报告
毕业论文成绩评定表
学院(公章): 生命科学学院 学号:[1**********]
注:总成绩=指导教师评定成绩(50%)+评阅人评定成绩(20%)+答辩成绩(30%),将总成绩由百分制转换为五级制,填入本表相应位置。
目 录
1引言 . ...................................................... 2 2材料与方法 .............................................. 3
2.1 MIR-156序列获得 ............................................... 3
2.2 MIR-156序列对比与系统进化分析 ............................. 3
2.3 MIR-156靶基因的预测 .......................................... 3 3结果与分析 ........................................... 4
3.1 MIR-156家族的分布 ............................................. 4
3.2 MIR-156家族的进化 ............................................ 4
3.3 MIRNA-156靶基因的预测及其功能分析 ......................... 8 4 讨论 ............................................... 11 参考文献 .......................................................................................................................... 12 附录 . .................................................................................................................................... 11 致 谢 ............................................................................................................................... 13
miRNA-156基因家族进化及功能分析
王国辉
(生命科学学院,生物技术,生技本1101,[1**********])
摘要:miRNA (MicroRNAs )是真核生物中广泛的一类对基因表达调控具有重要影响的非编码小分子RNA ,其大小长约20~25个核苷酸。通过与靶基因互补配对的原则在转录后水平上调控基因表达,表现出高度保守的特点。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。本文通过研究miRNA-156基因家族的进化机对了解和揭示植物miRNA 基因的进化机制具有重要的参考和科研价值。通过植物信息学的分析,miRNA-156在植物中具有很高的保守性,可推测是在远古较早的植物中保留下来的基因序列;靶基因的预测及其功能分析miRNA-156基因家族在植物的生长中起到了重要的调控作用;通过对上游的启动子研究得知,miRNA-156基因的上游序列中含有与植物胁迫生长、光的传导、温度的感知及调节、激素的分泌及传导相关的顺式作用元件。本文通过对miRNA-156基因的研究,对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。
关键词:MicroRNAs; miRN-156;进化; 功能分析; 靶基因; 启动子
Evolution and Function Analysis of miRNA-156 Gene Family
Wang Guohui
(School of life Science and Biotechnology, LuDongUniversity, Biological technology, class of 2011 [1**********]
Abstract: miRNA (MicroRNAs) are eukaryotes widely used class of small non-coding RNA molecules having a significant impact on the regulation of gene expression, the size of about 20 to 25 nucleotides. By pairing the principle of the target gene regulation of gene expression in the post-transcriptional level, showing a highly conserved features. Based on a collection of genes miRBase search found 44 species CPC search to 288 gene sequences miRNA-156, showed miNA-156 genes among different species widespread presence of highly conserved features. miRNA-156 members with only a small portion is contained within the sub-region, the rest are all located in intergenic regions. miRNA gene family on the mode of action of a target gene, mature miRNAs sequence length is made longer primary transcript through a series of shearing nuclease produced, it is then placed into the RNA-induced silencing complex (RNA- induced silencing complex, RISC), the identification of target gene mRNA through complementary base pairing mode, and guide silencing complex target mRNA degradation or translation repression of target mRNA based on differences in the degree of complementary base pairing. If fully complementary pairing of target genes can cut a lot of cleavage, and thus a large number of miRNA gene
expression, thereby reducing the richness of the target gene. This article has important reference and scientific value of understanding and reveal the evolutionary mechanisms of plant miRNA genes by studying miRNA-156 gene family evolution machine. By analyzing plant informatics, miRNA-156 has a highly conserved in plants, gene sequences can presumably preserved in ancient plants earlier; target gene prediction and functional analysis of miRNA-156 gene family in the growth of plants plays an important role; by promoter upstream of that study, the upstream sequences of miRNA-156 gene contains plant stress growth and transmission of light, temperature sensing and regulation, hormone secretion and conduction associated cis-acting elements. Through the research of miRNA-156 gene family evolution of miRNA genes in plants, function and application of a variety of physiological functions of the foundation. Key words: MicroRNAs; miRN-156; Evolution; Functional analysis; Target gene; Promoter
1. 引言
MicroRNAs(miRNAs)是一类生物体内普遍存在的、长度为20-28nt 左右的内源性单链非编码小分子RNA, 通过与靶mRNA 的互补在转录后水平介导mRNA 降解或抑制其翻译来调控基因表达[1],几乎在所有的生物学过程中都发挥着重要作用[2-3]。miRNA 基因在于基因组中以单拷贝、多拷贝和基因簇等多种形式存存在。成簇基因之间有的具有同源性, 有的无同源性, 成簇的MicroRNA 可能最终转录成为一种转录产物,其原因可能是它们来自于相同的原始转录本。其中串联基因簇(tandem cluster)中的MicroRNA 一般呈现为协同表达[4-5], 暗示着miRNA 基因存在复杂的调控机制。从第一次发现RNA 这类小分子开始,miRNA 变成了人们广泛研究和关注的对象。人们对这类物质进行了大量的、深入的研究和实验。尤其是在动物miRNA 方面更是如雨后春笋般的涌现了很多科研成果,一时间关于miRNA 的科研论文和研究成果大量发表。但是在植物miRNA 方面起步比较晚,没有受到人们的广泛关注。直至等到2002年才有关于植物miRNA 的报道,是从拟南芥中克隆分离出来的。随后植物miRNA 的研究又受到人们的广泛关注。之后的研究和实验也迅速发展起来。涌现出大量的有重要价值的科研成果。由于人们的大量研究,到目前为止,在数据库miRBase 中一共收录了近三万条的关于miRNA 的信息,其中有近一万条信息是关于植物miRNA 的,总共来自于100多种常见和模式植物。 MicroRNAs(miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20-25个核苷酸。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶基因mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。从目前的研究成果分析来看,可得知植物miRNA 家族序列与植物各个阶段的生理发育有很紧密的联系,比如植物叶的形成和生长、光信号的传到、根的生长和延长等,
甚至和植物的环境胁迫生长也有一定的关系。
在miRBase 数据库中,共可得到miRNA-156数据共有288条,分布在44个物种中。一般我们认识,只要miRNA 分布超过十个物种,就可以认为是保守的。由此可知,miRNA-156家族基因是高度保守的。保守的miRNA 家族在不同的植物中发挥的调控控制作用是相同或者是相似的,。由这个保守特性我们可以较为方便的分析和探究不同植物或者物种中的miRNA 家族。
在植物中,MiRNA 对靶基因RNA 的调控过程作用原理,最主要的就是与靶基因的碱基互补配对,通过碱基互补配对程度来对靶基因进行剪切降解或者抑制。如果可以与靶基因完全互补配对的话,就会大量对靶基因进行剪切,表达出大量的miRNA, 从而会减少靶基因的丰富程度[6]。除此之外,miRNA 也可能存在其他的调控作用方式,在本文中就不加以赘述。
在整个研究过程中,首先是要获得miRNA-156基因家族序列,然后对所获得的全部成熟基因进行序列对比,并且在对比的基础上进行系统进化分析,从而利用前体序列构建系统进化树。最后是对成熟序列的靶基因进行预测,从而推断出靶基因在染色体上的位置及其生物功能。
通过研究发现,miRNA-156基因家族是植物界目前为止发现的较为庞大的miRNA 基因家族,但未见到有对此基因家族进行系统分析和研究的报道。为了了解此基因家族的进化和功能分化情况,特做了此研究。本文通过系统的对miRNA-156家族的功能和分子进化情况的研究,以期对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。
2. 材料与方法
2.1 miR-156序列获得
对miRNA-156基因家族进行研究,就要取得其基因家族的序列[7]。全部序列的取得可从miRNA 数据库 miRBase(http://www.mirbase.org/ cgi-bin/browse.pl)中下载所有物种miRNA-156基因家族成员的所有前体序列和成熟序列。
2.2 miR-156序列对比与系统进化分析
采用Clustal W2在线软件对所有物种的miR-156基因的成熟序列及前体序列进行多重序列比对,分析进化特征,在此基础上运用MEGA5.1软件采用基于参数的邻近法对前体序列构建系统进化树[8]。
2.3 miR-156靶基因的预测
以miR-156为研究对象,采用三款植物靶基因预测软件psPNATTarget
(http://www.plantgrn.noble.org/psRNATarget/),WMD3(http://www.wmd3.weigelworld.org/cgi-bin/webapp.cgi?page=TargetSearch;project=stdwmd),TAPIR(http://www.bioinformatics.psb.ugent.be/webtools/tapir)分别在Oryza sativa cDNAlibrary(http://plants.ensembl.org/info/data/ftp/index.html),Zea mays DFCI Gene Index(ZMGI), version 19(http:biocomp.dfci.harvard.edu/index.html),Glycine max phytozome v8.0(http://biocomp.dfci.harvard.edu/index.html)数据库中预测这些物种所有的miR-156成员的靶基因,在预测时所有参数使用默认值。
3. 结果与分析
3.1 miR-156家族的分布
取得miRNA-156家族的全部基因序列,可在miRBase 中进行搜索。经过搜索可获得288条mirRNA-156基因序列。这些基因序列分布在69种植物中,在植物miRNA 中属于高度保守的一类[9]。在所有植物miRNA-156分布中,在花生(Arachis hypogaea)中发现了3个,在拟南芥(Arabidopsis lyrata )中发现了18个,在桐花树(Avicennia marina )中发现了8个,在无油樟(Amborella trichopoda )中发现了5个,在二穗短柄草(B. distachyon)中发现了10个,在木榄(Bruguiera gymnorhiza)中发现了1个,在香瓜(Cucumis melo )中发现了10个,在黄豆(Glycine max )中发现了28个,在苹果(Malus domestica )中发现了31个,在水稻(O. sativa )中发现了12个,在山角叶杨(P. trichocarpa)中发现了12个,在高粱(Sorghum bicolor)中发现了9个,在马铃薯(Solanum tuberosum )中发现了11个,在葡萄(Vitis vinifera )中发现了11个,在玉米(Zea mays )中发现了12个。由此可得出,miRNA-156基因家族虽然广泛分布在各个植物中,但在各个植物中的分布差异还是很明显的,说明miRNA 基因家族在进化过程中,基因的扩张是经过了明显的重排和筛选的,由此导致的结果就是在各类植物的分布具有明显差异性。更加说明了miRNA-156家族在各个植物物种间的调控的复杂性,更加具有重要的科研价值。
通过分析可获得,在分布上看,miRNA-156基因不只单单分布在双子叶植物和单子叶植物中,在裸子植物和被子植物,甚至蕨类植物中都有广泛的分布,可得知其高度保守的特性。在文本文档中将获得的288条成熟碱基序列由上至下一条一条罗列出来,(附图)。最后文本文档保存时属性改成.txt 格式。将以.txt 保存的植物miRNA 基因组数据提交Clustal W2在线软件,经过BLAAT 比对可获得通过分析可获得植物miRNA-156成熟序列比对结果[10]。通过对成熟序列分布对比表(见表3.1)分析,基因miRNA-156在物种基因成熟序列分布中具有高度保守性,特别是位于第1个碱基至第9个碱基上具有高度的重复性。
表3.1 各物种miRNA-156基因数量
物种名称
包含miRNA-156数
量
Malus domestica苹果 Glycine max 黄豆 Cucumis melo香瓜 Zea mays玉米 Cucumis melo香瓜
31 28 10 11 10
Solanum tuberosum
马铃薯 Vitis vinifera葡萄 Sorghum bicolor高粱 O. sativa水稻 A. thaliana 拟南芥
物种名称
包含miRNA-156数
量 11 11 9 12 10
3.2 miR-156基因家族的进化
对miRNA-156基因家族进行进化分析时,将以.txt 保存的文本文档以.fasta 保存提交给MEGA6软件,将得到的结果以.meg 格式输出保存。再将以.meg 保存的文档提交给软件MEGA6,可得到miRNA-156基因家族的进化树。通过对miRNA-156基因家族的系统进化分析,可得到所有44种植物的miRNA-156系统进化树(见图1)。通过对系统进化树的分析可得到,进化树在整体上是比较集中的,分支的话总共有2支,大部分集中到最顶部的分支上[11]。由此进化树可以看出miRNA-156基因家族具有很强的保守型,在进化过程中基本保持了相同的进化速度。还有,相同物种的成员之间分布比较分散,存在于整个进化树中,产生这种现象的原因可能有进化过程中3'端和5'端的进化特性有一定的相关关系,可见植物前体序列的复杂性。
表3.2 miRNA-156基因家族各成熟序列对比
miRNA 名称 成熟序列
miRNA 名称 成熟序列
Name of miRNA Mature Sequence
ahy-MIR156a --UGACAGAAG-AGAGAGAGCAC--- 20 ahy-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 ahy-MIR156c -UUGACAGAAG-AGAGAGAGCAC--- 21 aly-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 aly-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ama-MIR156
-CUGACAGAAG-AGAGUGAGCAC--- 21
Name of miRNA Mature Sequence
gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18
aqc-MIR156b --UGACAGAAG-AUAGAGAGCAC--- 20 ata-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 ath-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ath-MIR156i --UGACAGAAG-AGAGAGAGCAG--- 20 ath-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 atr-MIR156a -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 atr-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bcy-MIR156
UUUGACAGAAG-AUAGAGAGCAC--- 22
bdi-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 bdi-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 bgy-MIR156
UUUGACAGAAG-AUAGAGAGCAC--- 22
bna-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 bna-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156g -UUGACAGAAG-AUAGAGAGCAC--- 21 bra-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20
gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156f -UUGACAGAAG-AGAGAGAGCACA-- 22 gma-MIR156g ----ACAGAAG-AUAGAGAGCACAG- 20 gma-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156k -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156l -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156m -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156n -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156o -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156p -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156q --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156r -CUGACAGAAG-AUAGAGAGCAU--- 21 gma-MIR156s --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156t -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156u --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156v --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156w --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156x --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156y --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156aa --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156ab -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ac -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ad --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156ae --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156k --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156l --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156m --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156n --UGACAGAAG-AGAGUGAGCAC--- 20
bra-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156b --UGACAGAAG-AGAGUGAGCAUA-- 21 cca-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156e -UUGACAGAAG-AUAGAGGGCAC--- 21 cme-MIR156f --UGACAGAAG-AUAGAGAGCAC--- 20 cme-MIR156g --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156h --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156j GUUGACAGAAG-AGAGUGAGCAC--- 22 cpa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 cpa-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 ctr-MIR156
--UGACAGAAG-AGAGUGAGCAC--- 20
gma-MIR156z ----AUUGGAGUGAAGGGAGCU---- 18 han-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 har-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 har-MIR156c --UGACAGAAG-AGAGGGAGCA---- 19 hbr-MIR156
-UUGACAGAAG-AUAGAGAGC----- 19
hvu-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 hvu-MIR156b --UGACAGAAG-AGAGUGAGCACA-- 21 lus-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156d --UGACAGAAG-AAAGAGAGCAC--- 20 lus-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21
mdm-MIR156p -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156q -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156r -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156s -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156t -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156u -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156v -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156w -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156x --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156y --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156z --UGACAGAAG-AUAGAGAGCAC--- 20 mes-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 nta-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156f --UGACAGAAG-AGAAUGAGCAC--- 20 nta-MIR156g --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156h --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156i --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156j --UGACAGAAG-AUAGAGAGCAC--- 20 osa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20
ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21
osa-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 osa-MIR156l --CGACAGAAG-AGAGUGAGCAUA-- 21 ppt-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 pta-MIR156a -----CAGAAG-AUAGAGAGCACAUC 20 pta-MIR156b -----CAGAAG-AUAGAGAGCACAAC 20 ptc-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156g --UUGCAGAAG-AUAGAGAGCAC--- 20 ptc-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156k -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156l -UUGACAGAAG-AUGGAGAGCAC--- 21
t c c -m i R 156b t c c -m i R 156g s t u -m i R 56h -5t a e -m i R 11s t u -m 56i R 156g -5i R 15s s p -m
3.3 miRNA-156靶基因的预测及其功能分析
为了研究和揭示miRNA-156基因家族的植物生理学作用,此次研究采用了paRNATarget 在线植物miRNA 靶基因预测软件,使用的植物为黄豆、苹果、玉米。将这三种植物的全部miRNA-156基因作为研究对象,可得到其对应的全部靶基因,将具有相同作用位点的靶基因进行合并,最后分别获得10、8、11条靶基因(见表2),可获得其位点信息和作用机能。
表3.3 三种植物miRNA-156的靶基因
物种 Species 黄豆 Glycine
成熟序列名称 Mature ID gma-miR156a
靶基因ID Target ID EV277456
a n t a -a h q c -m y -m i m i R R 1v v i R 515h i
m d d p a r -m -m i R 1566a 6j m -m r -m i R 15a z m m a d -m i R 1i R 11566a m i -R 1565a l y -m i m 5i R 6h a 615-6R 156a 5a e a c p a l y -m i R d -5p 156f -5p
a t a -m i R 156a -5p t a -m i R 156e -5p
m m e d m s -m -m i i R R 1155l u s
6a 6i -m l u s c i R -m 15i R 16i h b 5r 6-g m m
a -m i R 1c
i R 156c m e
5-m i
R 156i
b n a 6b -m i R
156
c a t r -m
i R 15
6a m d m -m
i R 156v
m d m -m i R
156u
fa r-m iR 156b ama-m iR156m dm -m iR 156q
56r
g m a -m iR 156p
i R 1
g m a -m 156b
i R
p t a -m i R 156a b
56a 1p t a -m R -m i R 156
g m a -m i 156g b g y m i R 1p 5-65-R 6j b c y -m i 15a i R 6a 56b g m -m R 1156a a i z m r -m i R 15
m t a -m i R g m r -m
f a
6s s l -m s l y i R 156s o -f -m m i R
i R 11556d 6-5p s b
i -m i R s b i -m 156h s b i R i 1-5r c m i o -R 16c m i R 56a 156c
i 156m i R g v v i -561m i R b v v i -56i R 1a -m 56s t u i R 1a -m 156s t u i R 56f -m 1i R 6e s l y m 5t r -i R 156j m m i R 1t r -m s -m e m
6a 5b 1
i R 156a m
o -m i R 156b c r t c -6i R p c -m i R 15a
56j -5p p t t -m 1
p p t -m i R R 156
i
p p a -m s 56i 5p o 1-R
-m i i R 156f a s o a -m o s 6c
i R 15m -n t a a i R 156m -a t n
i R 156a
m e s -m
156i
m d m -m iR
m d m -m iR 156g
lus-miR156a h v u -m iR 156b h v u -m iR
h a r -m i 156a h a n -m R 156a h a n i R 156b g m -m i R 1g m a -m i R 56a g h a -m i R 156s
15g r -m
d p h r -m i R 156a r i R 6c t r -m i R 156b c p a -m 15a -m i R 6b 1i R 51566b
描述
Description
squamosa promoter-binding protein
6a i 156i R 156a m i R 15b -5p f 5p a --m i R 56566a c p m e e -m i R i 1156e -p c m R 115a -56R m -R i m -c a m a -m i i R 15a -5p c c b r a r -b 156g r a -m c c R b i a f -5p b d i -m 66i R 5511-m p b d -i t i R m iR 156f -5h -a m b n a a th -m iR 156b -5p
功能
Function 启动子结合蛋白
max
gma-miR156ab
gma-miR156e
gma-miR156h
gma-miR156k
gma-miR156n
gma-miR156p
gma-miR156s
gma-miR156u
TC441640
ELMO domain-containing protein ELMO 结构域蛋
A-like 白
TC534312 Phaseolus vulgaris hypothetical protein 启动子结合蛋白 TC135243 TC145314 TC452345
Medicago truncatula Squamosa promoter-binding-like protein
Phaseolus vulgaris hypothetical protein
Musa acuminata subsp. malaccensis squamosa promoter-binding-like
protein 16
squamosa promoter-binding-like protein 16-like (LOC100792071), transcript variant X2, mRNA Musa acuminata subsp. malaccensis squamosa promoter-binding-like
protein 16
Glycine max squamosa
promoter-binding-like protein 13B-like (LOC100806507), transcript variant
X2, mRNA
Betula luminifera SBP-box transcription factor (SPL1) mRNA,
complete cds
Pyrus x bretschneideri squamosa promoter-binding-like protein 6 Pyrus x bretschneideri squamosa promoter-binding-like protein 13 Populus trichocarpa hypothetical
protein
Malus x domestica putative squamosa promoter-binding-like protein 19 Gossypium hirsutum SQUAMOSA promoter binding-like transcription
factor
Gossypium hirsutum clone NBRI_GE9418 microsatellite
sequence
Theobroma cacao LIGULELESS1
protein, putative
Ricinus communis LIGULELESS1
protein, putative, mRNA
转录因子 启动子结合蛋白 转录因子
TC456278 启动子结合蛋白
CO234532 启动子结合蛋白
CO525354 转录因子
gma-miR156w
TC252524 启动子结合蛋白
苹果 Malus domestic a
mdm-miR156aa
mdm-miR156ad
mdm-miR156c
mdm-miR156h
mdm-miR156m
mdm-miR156p
mdm-miR156s
mdm-miR156u
CO051680 TC69221 TC60068 TC76043 CO051680
转录因子 复制因子 启动结合蛋白 根生长控制蛋白 光传导控制蛋白
TC62510 启动结合蛋白
TC60068 CO336544
温度控制结合酶 茎纵向生长反应酶
mdm-miR156w
mdm-miR156y
TC432124 TC453123
Malus domestica squamosa promoter-binding-like protein 13A Zea mays subsp. parviglumis neighbor of TGA1 (not1) gene, partial cds
Malus domestica squamosa promoter-binding-like protein 18 Malus x domestica putative squamosa promoter-binding-like protein 19 Ricinus communis LIGULELESS1
protein, putative, mRNA
Phaseolus vulgaris hypothetical protein Caragana korshinskii squamosa promoter-binding 16-like protein Betula luminifera SBP-box transcription factor (SPL1) mRNA Populus trichocarpa hypothetical protein (POPTR_0015s07140g)
mRNA
Ricinus communis LIGULELESS1
protein, putative, mRNA
Cucumis melo genomic scaffold Ricinus communis LIGULELESS1
protein
启动结合蛋白 叶片生长控制蛋白
叶片发育相关基因
种皮发育调控基因
微卫星序列
zma-miR156a-5p TC434343 玉米
Zea mays
zma-miR156b-5p TC425105
zma-miR156c TC214514
zma-miR156d-5p
zma-miR156e-5p
zma-miR156f-5p
zma-miR156g-5p
CO234454 TC453434 CO453455 TC431235
转录因子 结构域蛋白 启动子结合蛋白 转录因子
zma-miR156h-5p TC453235
zma-miR156i-5p TC453873
5
zma-miR156j-5p TC432534
结构域蛋白
启动子结合蛋白 转录因子
4. 讨论
MicroRNAs (miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20~25个核苷酸[12]。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA 诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。伴随着研究miRNA 技术的不断发展更新, 而miRNA-156家族成员不断地被发现, 今天已成为植物RNA 家族中一类至关重要的成员。本文研究采用
的是生物信息学的分析方法,对miRNA-156家族的结构及其功能进行深入的研究。
从研究的结果可以分析得到,miRNA-156家族分布于44个物种中,是属于高度保守的一类miRNA 序列[13]。从所在植物分布上看,它们大部分分布于裸子植物和被子植物中,甚至在裸子植物中也有分布,由此可见,miRNA-156家族序列在植物中是具有高度保守性的。
miRNA 表达作用是通过调控靶基因的方式产生作用的,从而控制植物的生理代谢活动[14]。研究miRNA 家族基因的作用最主要的就是获得其相应的靶基因。随着生物信息学研究手段的不断创新和发展,越来越多的方法被应用到miRNA 基因的研究上,研究精度和研究水平不断攀升。现在使用的绝大多数的预测软件都是依据miRNA 基因与靶基因的结合特点从而研发的,但是由于各种软件的算法和参数设定各不相同,从而导致的预测结果也是不尽人意[15]。要想避免使用单一某一款软件造成的结果偏差,我们在研究预测时尽可能多的使用多款软件进行研究,取多款软件预测结果的交集作为使用的靶基因,从而提高研究的精确性。
本研究在预测miRNA-156基因家族的作用时,对其上游基因1500bp 序列进行了研究。miRNA 基因与蛋白质的基因作用原理是一样的,都是通过RNA 聚合酶Ⅱ转录作用的,因此其反应调控的机制与蛋白质的基因编码是相同的。通过在线软件PlantCARE 对实验中选中的三个物种miRNA-156基因家族的上游1500bp 序列进行提交,进行启动子元件预测分析。可得结果如表2所示。通过结果分析可得,三个物种的上游启动子区域均含有典型的具有转录起始功能的TATA-box 、CAAT-box 启动子基本元件,可说明这些成员都是有可能具有表达活性功能的[16]。此外,在这三种植物的启动子区域,包含的顺式作用元件是存在明显差别的,大多为逆境胁迫、光信号转导、生物胁迫响应等相关的顺式作用元件。从中我们可以猜测,miRNA-156基因家族可能与植物的抗逆性有一定的关系。
目前对植物miRNA-156家族的研究日益深入,但是还是有很多的作用机制尚不明确,特别是其在植物逆境生长时发挥的作用。需要我们更加深入的探究。本文可为以后后续的研究提供一定的基础。
参考文献
1. Reinhart B J,Weinstein E G,Rhoades M W,et al.Miero RNAs in plants[J]. Genes Dev, 2002,16 :616一1626
2. Zhang BH,PanXP,CannonCH,etal.Conservation and divergence of plant mieroRNA genes [J] Plant J,2006,46(2):243一259.
3. Dennis C. The brave new world of RNA. Nature 2002; 418(6894):122-4. 4. 鲍春,张有近. miRNA 的克隆及其对种子的幼苗的影响「J 〕. 植物研究,2011,31(4): 408一413.
5. zhouXF,RuanJH,WangGD.etal.CharaeterizationandidentifieationofmieroRNAeor
ePromotersinfourmodelspeeies 「J].plosCompurBiol,2007,3(3):412一423. 6. 魏强,梁永宏,李广林. 植物miRNA 的进化[J ]. 遗传,2013,25( 3) :316-341 7. 王文采. 当代四被子植物分类系统简介(一). 植物学通报[J ],1990,7(2):119-129. 8. 王文采,当代四被子植物分类系统简介(二). 植物学通报[J ],1990,7(3):1-18 9. Cronquist A.An Integrated System of Classification of Flowering Plants. New York:Columbia University Press,1981
10. Takhtajan.A L.Outline of the Classification of Flowering Plants (Magnoliophyta).The Botanical Review,1980,46(3):225-239
11. Weier.T E,Barbour M G,Stlcking C R et al.Botany,An Introduction To Plant Biology[J ].California:John Wiley & Sons,Inc.,1982
12. 贺士元主编,植物学(下册),北京师范大学出版社,1987年 :216-221
13. 孙红正,葛颂. 重复基因的进化--回顾与进展[J ], 植物学报,2010.45(2)102-118 14. Le RC, Feinbaum RL, AmbrosV. The C-eleganshetero-ehroniegene lin4 eneodess mRNA senseeom-plementtytolin一14[J ].Cell,1993,75(5):843一854 15. 杨凤玺, 余迪求. 高表达拟南芥miRNA156提高烟草抗早性[J]. 云南植,2009,31(5):421一426.
16. 丁艳菲, 王光钺, 傅亚萍, 朱诚.miR398在植物逆境胁迫应答中的作用[J]DOI:10.3724/SP.J.
致 谢
本设计的完成是在我们的导师王艳芳老师的细心指导下进行的。在每次研究遇问题时,老师不辞辛苦的讲解才使得的研究顺利的进行。从论文的选题到资料的搜集直至最后论文的修改的整个过程中,花费了王老师很多的宝贵时间和精力,在此向导师表示衷心地感谢! 导师严谨的治学态度,开拓进取的精神和高度的责任心都将使学生受益终生!
还要感谢和我同一设计小组的几位同学,是你们在我平时论文中和我一起探讨问题,并指出我论文上的误区,使我能及时的发现问题把论文顺利的进行下去,没有你们的帮助我不可能这样顺利地结稿,在此表示深深的谢意。
本 科 毕 业 论 文
miRNA-156基因家族进化及功能分析
2015年5月20日
独 创 声 明
本人郑重声明:所呈交的毕业论文(设计) ,是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。尽我所知,除文中已经注明引用的内容外,本论文(设计)不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。
此声明的法律后果由本人承担。
作者签名:
二〇一 年 月 日
毕业论文(设计)使用授权声明
本人完全了解鲁东大学关于收集、保存、使用毕业论文(设计)的规定。
本人愿意按照学校要求提交论文(设计)的印刷本和电子版,同意学校保存论文(设计)的印刷本和电子版,或采用影印、数字化或其它复制手段保存论文(设计);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布论文(设计)的部分或全部内容,允许他人依法合理使用。
(保密论文在解密后遵守此规定)
作者签名:
二〇一 年 月 日
毕业论文结题报告
毕业论文成绩评定表
学院(公章): 生命科学学院 学号:[1**********]
注:总成绩=指导教师评定成绩(50%)+评阅人评定成绩(20%)+答辩成绩(30%),将总成绩由百分制转换为五级制,填入本表相应位置。
目 录
1引言 . ...................................................... 2 2材料与方法 .............................................. 3
2.1 MIR-156序列获得 ............................................... 3
2.2 MIR-156序列对比与系统进化分析 ............................. 3
2.3 MIR-156靶基因的预测 .......................................... 3 3结果与分析 ........................................... 4
3.1 MIR-156家族的分布 ............................................. 4
3.2 MIR-156家族的进化 ............................................ 4
3.3 MIRNA-156靶基因的预测及其功能分析 ......................... 8 4 讨论 ............................................... 11 参考文献 .......................................................................................................................... 12 附录 . .................................................................................................................................... 11 致 谢 ............................................................................................................................... 13
miRNA-156基因家族进化及功能分析
王国辉
(生命科学学院,生物技术,生技本1101,[1**********])
摘要:miRNA (MicroRNAs )是真核生物中广泛的一类对基因表达调控具有重要影响的非编码小分子RNA ,其大小长约20~25个核苷酸。通过与靶基因互补配对的原则在转录后水平上调控基因表达,表现出高度保守的特点。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。本文通过研究miRNA-156基因家族的进化机对了解和揭示植物miRNA 基因的进化机制具有重要的参考和科研价值。通过植物信息学的分析,miRNA-156在植物中具有很高的保守性,可推测是在远古较早的植物中保留下来的基因序列;靶基因的预测及其功能分析miRNA-156基因家族在植物的生长中起到了重要的调控作用;通过对上游的启动子研究得知,miRNA-156基因的上游序列中含有与植物胁迫生长、光的传导、温度的感知及调节、激素的分泌及传导相关的顺式作用元件。本文通过对miRNA-156基因的研究,对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。
关键词:MicroRNAs; miRN-156;进化; 功能分析; 靶基因; 启动子
Evolution and Function Analysis of miRNA-156 Gene Family
Wang Guohui
(School of life Science and Biotechnology, LuDongUniversity, Biological technology, class of 2011 [1**********]
Abstract: miRNA (MicroRNAs) are eukaryotes widely used class of small non-coding RNA molecules having a significant impact on the regulation of gene expression, the size of about 20 to 25 nucleotides. By pairing the principle of the target gene regulation of gene expression in the post-transcriptional level, showing a highly conserved features. Based on a collection of genes miRBase search found 44 species CPC search to 288 gene sequences miRNA-156, showed miNA-156 genes among different species widespread presence of highly conserved features. miRNA-156 members with only a small portion is contained within the sub-region, the rest are all located in intergenic regions. miRNA gene family on the mode of action of a target gene, mature miRNAs sequence length is made longer primary transcript through a series of shearing nuclease produced, it is then placed into the RNA-induced silencing complex (RNA- induced silencing complex, RISC), the identification of target gene mRNA through complementary base pairing mode, and guide silencing complex target mRNA degradation or translation repression of target mRNA based on differences in the degree of complementary base pairing. If fully complementary pairing of target genes can cut a lot of cleavage, and thus a large number of miRNA gene
expression, thereby reducing the richness of the target gene. This article has important reference and scientific value of understanding and reveal the evolutionary mechanisms of plant miRNA genes by studying miRNA-156 gene family evolution machine. By analyzing plant informatics, miRNA-156 has a highly conserved in plants, gene sequences can presumably preserved in ancient plants earlier; target gene prediction and functional analysis of miRNA-156 gene family in the growth of plants plays an important role; by promoter upstream of that study, the upstream sequences of miRNA-156 gene contains plant stress growth and transmission of light, temperature sensing and regulation, hormone secretion and conduction associated cis-acting elements. Through the research of miRNA-156 gene family evolution of miRNA genes in plants, function and application of a variety of physiological functions of the foundation. Key words: MicroRNAs; miRN-156; Evolution; Functional analysis; Target gene; Promoter
1. 引言
MicroRNAs(miRNAs)是一类生物体内普遍存在的、长度为20-28nt 左右的内源性单链非编码小分子RNA, 通过与靶mRNA 的互补在转录后水平介导mRNA 降解或抑制其翻译来调控基因表达[1],几乎在所有的生物学过程中都发挥着重要作用[2-3]。miRNA 基因在于基因组中以单拷贝、多拷贝和基因簇等多种形式存存在。成簇基因之间有的具有同源性, 有的无同源性, 成簇的MicroRNA 可能最终转录成为一种转录产物,其原因可能是它们来自于相同的原始转录本。其中串联基因簇(tandem cluster)中的MicroRNA 一般呈现为协同表达[4-5], 暗示着miRNA 基因存在复杂的调控机制。从第一次发现RNA 这类小分子开始,miRNA 变成了人们广泛研究和关注的对象。人们对这类物质进行了大量的、深入的研究和实验。尤其是在动物miRNA 方面更是如雨后春笋般的涌现了很多科研成果,一时间关于miRNA 的科研论文和研究成果大量发表。但是在植物miRNA 方面起步比较晚,没有受到人们的广泛关注。直至等到2002年才有关于植物miRNA 的报道,是从拟南芥中克隆分离出来的。随后植物miRNA 的研究又受到人们的广泛关注。之后的研究和实验也迅速发展起来。涌现出大量的有重要价值的科研成果。由于人们的大量研究,到目前为止,在数据库miRBase 中一共收录了近三万条的关于miRNA 的信息,其中有近一万条信息是关于植物miRNA 的,总共来自于100多种常见和模式植物。 MicroRNAs(miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20-25个核苷酸。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶基因mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。从目前的研究成果分析来看,可得知植物miRNA 家族序列与植物各个阶段的生理发育有很紧密的联系,比如植物叶的形成和生长、光信号的传到、根的生长和延长等,
甚至和植物的环境胁迫生长也有一定的关系。
在miRBase 数据库中,共可得到miRNA-156数据共有288条,分布在44个物种中。一般我们认识,只要miRNA 分布超过十个物种,就可以认为是保守的。由此可知,miRNA-156家族基因是高度保守的。保守的miRNA 家族在不同的植物中发挥的调控控制作用是相同或者是相似的,。由这个保守特性我们可以较为方便的分析和探究不同植物或者物种中的miRNA 家族。
在植物中,MiRNA 对靶基因RNA 的调控过程作用原理,最主要的就是与靶基因的碱基互补配对,通过碱基互补配对程度来对靶基因进行剪切降解或者抑制。如果可以与靶基因完全互补配对的话,就会大量对靶基因进行剪切,表达出大量的miRNA, 从而会减少靶基因的丰富程度[6]。除此之外,miRNA 也可能存在其他的调控作用方式,在本文中就不加以赘述。
在整个研究过程中,首先是要获得miRNA-156基因家族序列,然后对所获得的全部成熟基因进行序列对比,并且在对比的基础上进行系统进化分析,从而利用前体序列构建系统进化树。最后是对成熟序列的靶基因进行预测,从而推断出靶基因在染色体上的位置及其生物功能。
通过研究发现,miRNA-156基因家族是植物界目前为止发现的较为庞大的miRNA 基因家族,但未见到有对此基因家族进行系统分析和研究的报道。为了了解此基因家族的进化和功能分化情况,特做了此研究。本文通过系统的对miRNA-156家族的功能和分子进化情况的研究,以期对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。
2. 材料与方法
2.1 miR-156序列获得
对miRNA-156基因家族进行研究,就要取得其基因家族的序列[7]。全部序列的取得可从miRNA 数据库 miRBase(http://www.mirbase.org/ cgi-bin/browse.pl)中下载所有物种miRNA-156基因家族成员的所有前体序列和成熟序列。
2.2 miR-156序列对比与系统进化分析
采用Clustal W2在线软件对所有物种的miR-156基因的成熟序列及前体序列进行多重序列比对,分析进化特征,在此基础上运用MEGA5.1软件采用基于参数的邻近法对前体序列构建系统进化树[8]。
2.3 miR-156靶基因的预测
以miR-156为研究对象,采用三款植物靶基因预测软件psPNATTarget
(http://www.plantgrn.noble.org/psRNATarget/),WMD3(http://www.wmd3.weigelworld.org/cgi-bin/webapp.cgi?page=TargetSearch;project=stdwmd),TAPIR(http://www.bioinformatics.psb.ugent.be/webtools/tapir)分别在Oryza sativa cDNAlibrary(http://plants.ensembl.org/info/data/ftp/index.html),Zea mays DFCI Gene Index(ZMGI), version 19(http:biocomp.dfci.harvard.edu/index.html),Glycine max phytozome v8.0(http://biocomp.dfci.harvard.edu/index.html)数据库中预测这些物种所有的miR-156成员的靶基因,在预测时所有参数使用默认值。
3. 结果与分析
3.1 miR-156家族的分布
取得miRNA-156家族的全部基因序列,可在miRBase 中进行搜索。经过搜索可获得288条mirRNA-156基因序列。这些基因序列分布在69种植物中,在植物miRNA 中属于高度保守的一类[9]。在所有植物miRNA-156分布中,在花生(Arachis hypogaea)中发现了3个,在拟南芥(Arabidopsis lyrata )中发现了18个,在桐花树(Avicennia marina )中发现了8个,在无油樟(Amborella trichopoda )中发现了5个,在二穗短柄草(B. distachyon)中发现了10个,在木榄(Bruguiera gymnorhiza)中发现了1个,在香瓜(Cucumis melo )中发现了10个,在黄豆(Glycine max )中发现了28个,在苹果(Malus domestica )中发现了31个,在水稻(O. sativa )中发现了12个,在山角叶杨(P. trichocarpa)中发现了12个,在高粱(Sorghum bicolor)中发现了9个,在马铃薯(Solanum tuberosum )中发现了11个,在葡萄(Vitis vinifera )中发现了11个,在玉米(Zea mays )中发现了12个。由此可得出,miRNA-156基因家族虽然广泛分布在各个植物中,但在各个植物中的分布差异还是很明显的,说明miRNA 基因家族在进化过程中,基因的扩张是经过了明显的重排和筛选的,由此导致的结果就是在各类植物的分布具有明显差异性。更加说明了miRNA-156家族在各个植物物种间的调控的复杂性,更加具有重要的科研价值。
通过分析可获得,在分布上看,miRNA-156基因不只单单分布在双子叶植物和单子叶植物中,在裸子植物和被子植物,甚至蕨类植物中都有广泛的分布,可得知其高度保守的特性。在文本文档中将获得的288条成熟碱基序列由上至下一条一条罗列出来,(附图)。最后文本文档保存时属性改成.txt 格式。将以.txt 保存的植物miRNA 基因组数据提交Clustal W2在线软件,经过BLAAT 比对可获得通过分析可获得植物miRNA-156成熟序列比对结果[10]。通过对成熟序列分布对比表(见表3.1)分析,基因miRNA-156在物种基因成熟序列分布中具有高度保守性,特别是位于第1个碱基至第9个碱基上具有高度的重复性。
表3.1 各物种miRNA-156基因数量
物种名称
包含miRNA-156数
量
Malus domestica苹果 Glycine max 黄豆 Cucumis melo香瓜 Zea mays玉米 Cucumis melo香瓜
31 28 10 11 10
Solanum tuberosum
马铃薯 Vitis vinifera葡萄 Sorghum bicolor高粱 O. sativa水稻 A. thaliana 拟南芥
物种名称
包含miRNA-156数
量 11 11 9 12 10
3.2 miR-156基因家族的进化
对miRNA-156基因家族进行进化分析时,将以.txt 保存的文本文档以.fasta 保存提交给MEGA6软件,将得到的结果以.meg 格式输出保存。再将以.meg 保存的文档提交给软件MEGA6,可得到miRNA-156基因家族的进化树。通过对miRNA-156基因家族的系统进化分析,可得到所有44种植物的miRNA-156系统进化树(见图1)。通过对系统进化树的分析可得到,进化树在整体上是比较集中的,分支的话总共有2支,大部分集中到最顶部的分支上[11]。由此进化树可以看出miRNA-156基因家族具有很强的保守型,在进化过程中基本保持了相同的进化速度。还有,相同物种的成员之间分布比较分散,存在于整个进化树中,产生这种现象的原因可能有进化过程中3'端和5'端的进化特性有一定的相关关系,可见植物前体序列的复杂性。
表3.2 miRNA-156基因家族各成熟序列对比
miRNA 名称 成熟序列
miRNA 名称 成熟序列
Name of miRNA Mature Sequence
ahy-MIR156a --UGACAGAAG-AGAGAGAGCAC--- 20 ahy-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 ahy-MIR156c -UUGACAGAAG-AGAGAGAGCAC--- 21 aly-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 aly-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ama-MIR156
-CUGACAGAAG-AGAGUGAGCAC--- 21
Name of miRNA Mature Sequence
gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18
aqc-MIR156b --UGACAGAAG-AUAGAGAGCAC--- 20 ata-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 ath-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ath-MIR156i --UGACAGAAG-AGAGAGAGCAG--- 20 ath-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 atr-MIR156a -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 atr-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bcy-MIR156
UUUGACAGAAG-AUAGAGAGCAC--- 22
bdi-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 bdi-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 bgy-MIR156
UUUGACAGAAG-AUAGAGAGCAC--- 22
bna-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 bna-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156g -UUGACAGAAG-AUAGAGAGCAC--- 21 bra-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20
gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156f -UUGACAGAAG-AGAGAGAGCACA-- 22 gma-MIR156g ----ACAGAAG-AUAGAGAGCACAG- 20 gma-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156k -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156l -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156m -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156n -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156o -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156p -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156q --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156r -CUGACAGAAG-AUAGAGAGCAU--- 21 gma-MIR156s --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156t -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156u --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156v --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156w --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156x --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156y --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156aa --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156ab -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ac -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ad --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156ae --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156k --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156l --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156m --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156n --UGACAGAAG-AGAGUGAGCAC--- 20
bra-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156b --UGACAGAAG-AGAGUGAGCAUA-- 21 cca-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156e -UUGACAGAAG-AUAGAGGGCAC--- 21 cme-MIR156f --UGACAGAAG-AUAGAGAGCAC--- 20 cme-MIR156g --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156h --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156j GUUGACAGAAG-AGAGUGAGCAC--- 22 cpa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 cpa-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 ctr-MIR156
--UGACAGAAG-AGAGUGAGCAC--- 20
gma-MIR156z ----AUUGGAGUGAAGGGAGCU---- 18 han-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 har-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 har-MIR156c --UGACAGAAG-AGAGGGAGCA---- 19 hbr-MIR156
-UUGACAGAAG-AUAGAGAGC----- 19
hvu-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 hvu-MIR156b --UGACAGAAG-AGAGUGAGCACA-- 21 lus-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156d --UGACAGAAG-AAAGAGAGCAC--- 20 lus-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21
mdm-MIR156p -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156q -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156r -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156s -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156t -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156u -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156v -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156w -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156x --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156y --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156z --UGACAGAAG-AUAGAGAGCAC--- 20 mes-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 nta-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156f --UGACAGAAG-AGAAUGAGCAC--- 20 nta-MIR156g --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156h --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156i --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156j --UGACAGAAG-AUAGAGAGCAC--- 20 osa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20
ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21
osa-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 osa-MIR156l --CGACAGAAG-AGAGUGAGCAUA-- 21 ppt-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 pta-MIR156a -----CAGAAG-AUAGAGAGCACAUC 20 pta-MIR156b -----CAGAAG-AUAGAGAGCACAAC 20 ptc-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156g --UUGCAGAAG-AUAGAGAGCAC--- 20 ptc-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156k -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156l -UUGACAGAAG-AUGGAGAGCAC--- 21
t c c -m i R 156b t c c -m i R 156g s t u -m i R 56h -5t a e -m i R 11s t u -m 56i R 156g -5i R 15s s p -m
3.3 miRNA-156靶基因的预测及其功能分析
为了研究和揭示miRNA-156基因家族的植物生理学作用,此次研究采用了paRNATarget 在线植物miRNA 靶基因预测软件,使用的植物为黄豆、苹果、玉米。将这三种植物的全部miRNA-156基因作为研究对象,可得到其对应的全部靶基因,将具有相同作用位点的靶基因进行合并,最后分别获得10、8、11条靶基因(见表2),可获得其位点信息和作用机能。
表3.3 三种植物miRNA-156的靶基因
物种 Species 黄豆 Glycine
成熟序列名称 Mature ID gma-miR156a
靶基因ID Target ID EV277456
a n t a -a h q c -m y -m i m i R R 1v v i R 515h i
m d d p a r -m -m i R 1566a 6j m -m r -m i R 15a z m m a d -m i R 1i R 11566a m i -R 1565a l y -m i m 5i R 6h a 615-6R 156a 5a e a c p a l y -m i R d -5p 156f -5p
a t a -m i R 156a -5p t a -m i R 156e -5p
m m e d m s -m -m i i R R 1155l u s
6a 6i -m l u s c i R -m 15i R 16i h b 5r 6-g m m
a -m i R 1c
i R 156c m e
5-m i
R 156i
b n a 6b -m i R
156
c a t r -m
i R 15
6a m d m -m
i R 156v
m d m -m i R
156u
fa r-m iR 156b ama-m iR156m dm -m iR 156q
56r
g m a -m iR 156p
i R 1
g m a -m 156b
i R
p t a -m i R 156a b
56a 1p t a -m R -m i R 156
g m a -m i 156g b g y m i R 1p 5-65-R 6j b c y -m i 15a i R 6a 56b g m -m R 1156a a i z m r -m i R 15
m t a -m i R g m r -m
f a
6s s l -m s l y i R 156s o -f -m m i R
i R 11556d 6-5p s b
i -m i R s b i -m 156h s b i R i 1-5r c m i o -R 16c m i R 56a 156c
i 156m i R g v v i -561m i R b v v i -56i R 1a -m 56s t u i R 1a -m 156s t u i R 56f -m 1i R 6e s l y m 5t r -i R 156j m m i R 1t r -m s -m e m
6a 5b 1
i R 156a m
o -m i R 156b c r t c -6i R p c -m i R 15a
56j -5p p t t -m 1
p p t -m i R R 156
i
p p a -m s 56i 5p o 1-R
-m i i R 156f a s o a -m o s 6c
i R 15m -n t a a i R 156m -a t n
i R 156a
m e s -m
156i
m d m -m iR
m d m -m iR 156g
lus-miR156a h v u -m iR 156b h v u -m iR
h a r -m i 156a h a n -m R 156a h a n i R 156b g m -m i R 1g m a -m i R 56a g h a -m i R 156s
15g r -m
d p h r -m i R 156a r i R 6c t r -m i R 156b c p a -m 15a -m i R 6b 1i R 51566b
描述
Description
squamosa promoter-binding protein
6a i 156i R 156a m i R 15b -5p f 5p a --m i R 56566a c p m e e -m i R i 1156e -p c m R 115a -56R m -R i m -c a m a -m i i R 15a -5p c c b r a r -b 156g r a -m c c R b i a f -5p b d i -m 66i R 5511-m p b d -i t i R m iR 156f -5h -a m b n a a th -m iR 156b -5p
功能
Function 启动子结合蛋白
max
gma-miR156ab
gma-miR156e
gma-miR156h
gma-miR156k
gma-miR156n
gma-miR156p
gma-miR156s
gma-miR156u
TC441640
ELMO domain-containing protein ELMO 结构域蛋
A-like 白
TC534312 Phaseolus vulgaris hypothetical protein 启动子结合蛋白 TC135243 TC145314 TC452345
Medicago truncatula Squamosa promoter-binding-like protein
Phaseolus vulgaris hypothetical protein
Musa acuminata subsp. malaccensis squamosa promoter-binding-like
protein 16
squamosa promoter-binding-like protein 16-like (LOC100792071), transcript variant X2, mRNA Musa acuminata subsp. malaccensis squamosa promoter-binding-like
protein 16
Glycine max squamosa
promoter-binding-like protein 13B-like (LOC100806507), transcript variant
X2, mRNA
Betula luminifera SBP-box transcription factor (SPL1) mRNA,
complete cds
Pyrus x bretschneideri squamosa promoter-binding-like protein 6 Pyrus x bretschneideri squamosa promoter-binding-like protein 13 Populus trichocarpa hypothetical
protein
Malus x domestica putative squamosa promoter-binding-like protein 19 Gossypium hirsutum SQUAMOSA promoter binding-like transcription
factor
Gossypium hirsutum clone NBRI_GE9418 microsatellite
sequence
Theobroma cacao LIGULELESS1
protein, putative
Ricinus communis LIGULELESS1
protein, putative, mRNA
转录因子 启动子结合蛋白 转录因子
TC456278 启动子结合蛋白
CO234532 启动子结合蛋白
CO525354 转录因子
gma-miR156w
TC252524 启动子结合蛋白
苹果 Malus domestic a
mdm-miR156aa
mdm-miR156ad
mdm-miR156c
mdm-miR156h
mdm-miR156m
mdm-miR156p
mdm-miR156s
mdm-miR156u
CO051680 TC69221 TC60068 TC76043 CO051680
转录因子 复制因子 启动结合蛋白 根生长控制蛋白 光传导控制蛋白
TC62510 启动结合蛋白
TC60068 CO336544
温度控制结合酶 茎纵向生长反应酶
mdm-miR156w
mdm-miR156y
TC432124 TC453123
Malus domestica squamosa promoter-binding-like protein 13A Zea mays subsp. parviglumis neighbor of TGA1 (not1) gene, partial cds
Malus domestica squamosa promoter-binding-like protein 18 Malus x domestica putative squamosa promoter-binding-like protein 19 Ricinus communis LIGULELESS1
protein, putative, mRNA
Phaseolus vulgaris hypothetical protein Caragana korshinskii squamosa promoter-binding 16-like protein Betula luminifera SBP-box transcription factor (SPL1) mRNA Populus trichocarpa hypothetical protein (POPTR_0015s07140g)
mRNA
Ricinus communis LIGULELESS1
protein, putative, mRNA
Cucumis melo genomic scaffold Ricinus communis LIGULELESS1
protein
启动结合蛋白 叶片生长控制蛋白
叶片发育相关基因
种皮发育调控基因
微卫星序列
zma-miR156a-5p TC434343 玉米
Zea mays
zma-miR156b-5p TC425105
zma-miR156c TC214514
zma-miR156d-5p
zma-miR156e-5p
zma-miR156f-5p
zma-miR156g-5p
CO234454 TC453434 CO453455 TC431235
转录因子 结构域蛋白 启动子结合蛋白 转录因子
zma-miR156h-5p TC453235
zma-miR156i-5p TC453873
5
zma-miR156j-5p TC432534
结构域蛋白
启动子结合蛋白 转录因子
4. 讨论
MicroRNAs (miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20~25个核苷酸[12]。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA 诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。伴随着研究miRNA 技术的不断发展更新, 而miRNA-156家族成员不断地被发现, 今天已成为植物RNA 家族中一类至关重要的成员。本文研究采用
的是生物信息学的分析方法,对miRNA-156家族的结构及其功能进行深入的研究。
从研究的结果可以分析得到,miRNA-156家族分布于44个物种中,是属于高度保守的一类miRNA 序列[13]。从所在植物分布上看,它们大部分分布于裸子植物和被子植物中,甚至在裸子植物中也有分布,由此可见,miRNA-156家族序列在植物中是具有高度保守性的。
miRNA 表达作用是通过调控靶基因的方式产生作用的,从而控制植物的生理代谢活动[14]。研究miRNA 家族基因的作用最主要的就是获得其相应的靶基因。随着生物信息学研究手段的不断创新和发展,越来越多的方法被应用到miRNA 基因的研究上,研究精度和研究水平不断攀升。现在使用的绝大多数的预测软件都是依据miRNA 基因与靶基因的结合特点从而研发的,但是由于各种软件的算法和参数设定各不相同,从而导致的预测结果也是不尽人意[15]。要想避免使用单一某一款软件造成的结果偏差,我们在研究预测时尽可能多的使用多款软件进行研究,取多款软件预测结果的交集作为使用的靶基因,从而提高研究的精确性。
本研究在预测miRNA-156基因家族的作用时,对其上游基因1500bp 序列进行了研究。miRNA 基因与蛋白质的基因作用原理是一样的,都是通过RNA 聚合酶Ⅱ转录作用的,因此其反应调控的机制与蛋白质的基因编码是相同的。通过在线软件PlantCARE 对实验中选中的三个物种miRNA-156基因家族的上游1500bp 序列进行提交,进行启动子元件预测分析。可得结果如表2所示。通过结果分析可得,三个物种的上游启动子区域均含有典型的具有转录起始功能的TATA-box 、CAAT-box 启动子基本元件,可说明这些成员都是有可能具有表达活性功能的[16]。此外,在这三种植物的启动子区域,包含的顺式作用元件是存在明显差别的,大多为逆境胁迫、光信号转导、生物胁迫响应等相关的顺式作用元件。从中我们可以猜测,miRNA-156基因家族可能与植物的抗逆性有一定的关系。
目前对植物miRNA-156家族的研究日益深入,但是还是有很多的作用机制尚不明确,特别是其在植物逆境生长时发挥的作用。需要我们更加深入的探究。本文可为以后后续的研究提供一定的基础。
参考文献
1. Reinhart B J,Weinstein E G,Rhoades M W,et al.Miero RNAs in plants[J]. Genes Dev, 2002,16 :616一1626
2. Zhang BH,PanXP,CannonCH,etal.Conservation and divergence of plant mieroRNA genes [J] Plant J,2006,46(2):243一259.
3. Dennis C. The brave new world of RNA. Nature 2002; 418(6894):122-4. 4. 鲍春,张有近. miRNA 的克隆及其对种子的幼苗的影响「J 〕. 植物研究,2011,31(4): 408一413.
5. zhouXF,RuanJH,WangGD.etal.CharaeterizationandidentifieationofmieroRNAeor
ePromotersinfourmodelspeeies 「J].plosCompurBiol,2007,3(3):412一423. 6. 魏强,梁永宏,李广林. 植物miRNA 的进化[J ]. 遗传,2013,25( 3) :316-341 7. 王文采. 当代四被子植物分类系统简介(一). 植物学通报[J ],1990,7(2):119-129. 8. 王文采,当代四被子植物分类系统简介(二). 植物学通报[J ],1990,7(3):1-18 9. Cronquist A.An Integrated System of Classification of Flowering Plants. New York:Columbia University Press,1981
10. Takhtajan.A L.Outline of the Classification of Flowering Plants (Magnoliophyta).The Botanical Review,1980,46(3):225-239
11. Weier.T E,Barbour M G,Stlcking C R et al.Botany,An Introduction To Plant Biology[J ].California:John Wiley & Sons,Inc.,1982
12. 贺士元主编,植物学(下册),北京师范大学出版社,1987年 :216-221
13. 孙红正,葛颂. 重复基因的进化--回顾与进展[J ], 植物学报,2010.45(2)102-118 14. Le RC, Feinbaum RL, AmbrosV. The C-eleganshetero-ehroniegene lin4 eneodess mRNA senseeom-plementtytolin一14[J ].Cell,1993,75(5):843一854 15. 杨凤玺, 余迪求. 高表达拟南芥miRNA156提高烟草抗早性[J]. 云南植,2009,31(5):421一426.
16. 丁艳菲, 王光钺, 傅亚萍, 朱诚.miR398在植物逆境胁迫应答中的作用[J]DOI:10.3724/SP.J.
致 谢
本设计的完成是在我们的导师王艳芳老师的细心指导下进行的。在每次研究遇问题时,老师不辞辛苦的讲解才使得的研究顺利的进行。从论文的选题到资料的搜集直至最后论文的修改的整个过程中,花费了王老师很多的宝贵时间和精力,在此向导师表示衷心地感谢! 导师严谨的治学态度,开拓进取的精神和高度的责任心都将使学生受益终生!
还要感谢和我同一设计小组的几位同学,是你们在我平时论文中和我一起探讨问题,并指出我论文上的误区,使我能及时的发现问题把论文顺利的进行下去,没有你们的帮助我不可能这样顺利地结稿,在此表示深深的谢意。