miRNA-156基因家族进化及功能分析

本 科 毕 业 论 文

miRNA-156基因家族进化及功能分析

2015年5月20日

独 创 声 明

本人郑重声明:所呈交的毕业论文(设计) ,是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。尽我所知,除文中已经注明引用的内容外,本论文(设计)不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。

此声明的法律后果由本人承担。

作者签名:

二〇一 年 月 日

毕业论文(设计)使用授权声明

本人完全了解鲁东大学关于收集、保存、使用毕业论文(设计)的规定。

本人愿意按照学校要求提交论文(设计)的印刷本和电子版,同意学校保存论文(设计)的印刷本和电子版,或采用影印、数字化或其它复制手段保存论文(设计);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布论文(设计)的部分或全部内容,允许他人依法合理使用。

(保密论文在解密后遵守此规定)

作者签名:

二〇一 年 月 日

毕业论文结题报告

毕业论文成绩评定表

学院(公章): 生命科学学院 学号:[1**********]

注:总成绩=指导教师评定成绩(50%)+评阅人评定成绩(20%)+答辩成绩(30%),将总成绩由百分制转换为五级制,填入本表相应位置。

目 录

1引言 . ...................................................... 2 2材料与方法 .............................................. 3

2.1 MIR-156序列获得 ............................................... 3

2.2 MIR-156序列对比与系统进化分析 ............................. 3

2.3 MIR-156靶基因的预测 .......................................... 3 3结果与分析 ........................................... 4

3.1 MIR-156家族的分布 ............................................. 4

3.2 MIR-156家族的进化 ............................................ 4

3.3 MIRNA-156靶基因的预测及其功能分析 ......................... 8 4 讨论 ............................................... 11 参考文献 .......................................................................................................................... 12 附录 . .................................................................................................................................... 11 致 谢 ............................................................................................................................... 13

miRNA-156基因家族进化及功能分析

王国辉

(生命科学学院,生物技术,生技本1101,[1**********])

摘要:miRNA (MicroRNAs )是真核生物中广泛的一类对基因表达调控具有重要影响的非编码小分子RNA ,其大小长约20~25个核苷酸。通过与靶基因互补配对的原则在转录后水平上调控基因表达,表现出高度保守的特点。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。本文通过研究miRNA-156基因家族的进化机对了解和揭示植物miRNA 基因的进化机制具有重要的参考和科研价值。通过植物信息学的分析,miRNA-156在植物中具有很高的保守性,可推测是在远古较早的植物中保留下来的基因序列;靶基因的预测及其功能分析miRNA-156基因家族在植物的生长中起到了重要的调控作用;通过对上游的启动子研究得知,miRNA-156基因的上游序列中含有与植物胁迫生长、光的传导、温度的感知及调节、激素的分泌及传导相关的顺式作用元件。本文通过对miRNA-156基因的研究,对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。

关键词:MicroRNAs; miRN-156;进化; 功能分析; 靶基因; 启动子

Evolution and Function Analysis of miRNA-156 Gene Family

Wang Guohui

(School of life Science and Biotechnology, LuDongUniversity, Biological technology, class of 2011 [1**********]

Abstract: miRNA (MicroRNAs) are eukaryotes widely used class of small non-coding RNA molecules having a significant impact on the regulation of gene expression, the size of about 20 to 25 nucleotides. By pairing the principle of the target gene regulation of gene expression in the post-transcriptional level, showing a highly conserved features. Based on a collection of genes miRBase search found 44 species CPC search to 288 gene sequences miRNA-156, showed miNA-156 genes among different species widespread presence of highly conserved features. miRNA-156 members with only a small portion is contained within the sub-region, the rest are all located in intergenic regions. miRNA gene family on the mode of action of a target gene, mature miRNAs sequence length is made longer primary transcript through a series of shearing nuclease produced, it is then placed into the RNA-induced silencing complex (RNA- induced silencing complex, RISC), the identification of target gene mRNA through complementary base pairing mode, and guide silencing complex target mRNA degradation or translation repression of target mRNA based on differences in the degree of complementary base pairing. If fully complementary pairing of target genes can cut a lot of cleavage, and thus a large number of miRNA gene

expression, thereby reducing the richness of the target gene. This article has important reference and scientific value of understanding and reveal the evolutionary mechanisms of plant miRNA genes by studying miRNA-156 gene family evolution machine. By analyzing plant informatics, miRNA-156 has a highly conserved in plants, gene sequences can presumably preserved in ancient plants earlier; target gene prediction and functional analysis of miRNA-156 gene family in the growth of plants plays an important role; by promoter upstream of that study, the upstream sequences of miRNA-156 gene contains plant stress growth and transmission of light, temperature sensing and regulation, hormone secretion and conduction associated cis-acting elements. Through the research of miRNA-156 gene family evolution of miRNA genes in plants, function and application of a variety of physiological functions of the foundation. Key words: MicroRNAs; miRN-156; Evolution; Functional analysis; Target gene; Promoter

1. 引言

MicroRNAs(miRNAs)是一类生物体内普遍存在的、长度为20-28nt 左右的内源性单链非编码小分子RNA, 通过与靶mRNA 的互补在转录后水平介导mRNA 降解或抑制其翻译来调控基因表达[1],几乎在所有的生物学过程中都发挥着重要作用[2-3]。miRNA 基因在于基因组中以单拷贝、多拷贝和基因簇等多种形式存存在。成簇基因之间有的具有同源性, 有的无同源性, 成簇的MicroRNA 可能最终转录成为一种转录产物,其原因可能是它们来自于相同的原始转录本。其中串联基因簇(tandem cluster)中的MicroRNA 一般呈现为协同表达[4-5], 暗示着miRNA 基因存在复杂的调控机制。从第一次发现RNA 这类小分子开始,miRNA 变成了人们广泛研究和关注的对象。人们对这类物质进行了大量的、深入的研究和实验。尤其是在动物miRNA 方面更是如雨后春笋般的涌现了很多科研成果,一时间关于miRNA 的科研论文和研究成果大量发表。但是在植物miRNA 方面起步比较晚,没有受到人们的广泛关注。直至等到2002年才有关于植物miRNA 的报道,是从拟南芥中克隆分离出来的。随后植物miRNA 的研究又受到人们的广泛关注。之后的研究和实验也迅速发展起来。涌现出大量的有重要价值的科研成果。由于人们的大量研究,到目前为止,在数据库miRBase 中一共收录了近三万条的关于miRNA 的信息,其中有近一万条信息是关于植物miRNA 的,总共来自于100多种常见和模式植物。 MicroRNAs(miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20-25个核苷酸。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶基因mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。从目前的研究成果分析来看,可得知植物miRNA 家族序列与植物各个阶段的生理发育有很紧密的联系,比如植物叶的形成和生长、光信号的传到、根的生长和延长等,

甚至和植物的环境胁迫生长也有一定的关系。

在miRBase 数据库中,共可得到miRNA-156数据共有288条,分布在44个物种中。一般我们认识,只要miRNA 分布超过十个物种,就可以认为是保守的。由此可知,miRNA-156家族基因是高度保守的。保守的miRNA 家族在不同的植物中发挥的调控控制作用是相同或者是相似的,。由这个保守特性我们可以较为方便的分析和探究不同植物或者物种中的miRNA 家族。

在植物中,MiRNA 对靶基因RNA 的调控过程作用原理,最主要的就是与靶基因的碱基互补配对,通过碱基互补配对程度来对靶基因进行剪切降解或者抑制。如果可以与靶基因完全互补配对的话,就会大量对靶基因进行剪切,表达出大量的miRNA, 从而会减少靶基因的丰富程度[6]。除此之外,miRNA 也可能存在其他的调控作用方式,在本文中就不加以赘述。

在整个研究过程中,首先是要获得miRNA-156基因家族序列,然后对所获得的全部成熟基因进行序列对比,并且在对比的基础上进行系统进化分析,从而利用前体序列构建系统进化树。最后是对成熟序列的靶基因进行预测,从而推断出靶基因在染色体上的位置及其生物功能。

通过研究发现,miRNA-156基因家族是植物界目前为止发现的较为庞大的miRNA 基因家族,但未见到有对此基因家族进行系统分析和研究的报道。为了了解此基因家族的进化和功能分化情况,特做了此研究。本文通过系统的对miRNA-156家族的功能和分子进化情况的研究,以期对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。

2. 材料与方法

2.1 miR-156序列获得

对miRNA-156基因家族进行研究,就要取得其基因家族的序列[7]。全部序列的取得可从miRNA 数据库 miRBase(http://www.mirbase.org/ cgi-bin/browse.pl)中下载所有物种miRNA-156基因家族成员的所有前体序列和成熟序列。

2.2 miR-156序列对比与系统进化分析

采用Clustal W2在线软件对所有物种的miR-156基因的成熟序列及前体序列进行多重序列比对,分析进化特征,在此基础上运用MEGA5.1软件采用基于参数的邻近法对前体序列构建系统进化树[8]。

2.3 miR-156靶基因的预测

以miR-156为研究对象,采用三款植物靶基因预测软件psPNATTarget

(http://www.plantgrn.noble.org/psRNATarget/),WMD3(http://www.wmd3.weigelworld.org/cgi-bin/webapp.cgi?page=TargetSearch;project=stdwmd),TAPIR(http://www.bioinformatics.psb.ugent.be/webtools/tapir)分别在Oryza sativa cDNAlibrary(http://plants.ensembl.org/info/data/ftp/index.html),Zea mays DFCI Gene Index(ZMGI), version 19(http:biocomp.dfci.harvard.edu/index.html),Glycine max phytozome v8.0(http://biocomp.dfci.harvard.edu/index.html)数据库中预测这些物种所有的miR-156成员的靶基因,在预测时所有参数使用默认值。

3. 结果与分析

3.1 miR-156家族的分布

取得miRNA-156家族的全部基因序列,可在miRBase 中进行搜索。经过搜索可获得288条mirRNA-156基因序列。这些基因序列分布在69种植物中,在植物miRNA 中属于高度保守的一类[9]。在所有植物miRNA-156分布中,在花生(Arachis hypogaea)中发现了3个,在拟南芥(Arabidopsis lyrata )中发现了18个,在桐花树(Avicennia marina )中发现了8个,在无油樟(Amborella trichopoda )中发现了5个,在二穗短柄草(B. distachyon)中发现了10个,在木榄(Bruguiera gymnorhiza)中发现了1个,在香瓜(Cucumis melo )中发现了10个,在黄豆(Glycine max )中发现了28个,在苹果(Malus domestica )中发现了31个,在水稻(O. sativa )中发现了12个,在山角叶杨(P. trichocarpa)中发现了12个,在高粱(Sorghum bicolor)中发现了9个,在马铃薯(Solanum tuberosum )中发现了11个,在葡萄(Vitis vinifera )中发现了11个,在玉米(Zea mays )中发现了12个。由此可得出,miRNA-156基因家族虽然广泛分布在各个植物中,但在各个植物中的分布差异还是很明显的,说明miRNA 基因家族在进化过程中,基因的扩张是经过了明显的重排和筛选的,由此导致的结果就是在各类植物的分布具有明显差异性。更加说明了miRNA-156家族在各个植物物种间的调控的复杂性,更加具有重要的科研价值。

通过分析可获得,在分布上看,miRNA-156基因不只单单分布在双子叶植物和单子叶植物中,在裸子植物和被子植物,甚至蕨类植物中都有广泛的分布,可得知其高度保守的特性。在文本文档中将获得的288条成熟碱基序列由上至下一条一条罗列出来,(附图)。最后文本文档保存时属性改成.txt 格式。将以.txt 保存的植物miRNA 基因组数据提交Clustal W2在线软件,经过BLAAT 比对可获得通过分析可获得植物miRNA-156成熟序列比对结果[10]。通过对成熟序列分布对比表(见表3.1)分析,基因miRNA-156在物种基因成熟序列分布中具有高度保守性,特别是位于第1个碱基至第9个碱基上具有高度的重复性。

表3.1 各物种miRNA-156基因数量

物种名称

包含miRNA-156数

Malus domestica苹果 Glycine max 黄豆 Cucumis melo香瓜 Zea mays玉米 Cucumis melo香瓜

31 28 10 11 10

Solanum tuberosum

马铃薯 Vitis vinifera葡萄 Sorghum bicolor高粱 O. sativa水稻 A. thaliana 拟南芥

物种名称

包含miRNA-156数

量 11 11 9 12 10

3.2 miR-156基因家族的进化

对miRNA-156基因家族进行进化分析时,将以.txt 保存的文本文档以.fasta 保存提交给MEGA6软件,将得到的结果以.meg 格式输出保存。再将以.meg 保存的文档提交给软件MEGA6,可得到miRNA-156基因家族的进化树。通过对miRNA-156基因家族的系统进化分析,可得到所有44种植物的miRNA-156系统进化树(见图1)。通过对系统进化树的分析可得到,进化树在整体上是比较集中的,分支的话总共有2支,大部分集中到最顶部的分支上[11]。由此进化树可以看出miRNA-156基因家族具有很强的保守型,在进化过程中基本保持了相同的进化速度。还有,相同物种的成员之间分布比较分散,存在于整个进化树中,产生这种现象的原因可能有进化过程中3'端和5'端的进化特性有一定的相关关系,可见植物前体序列的复杂性。

表3.2 miRNA-156基因家族各成熟序列对比

miRNA 名称 成熟序列

miRNA 名称 成熟序列

Name of miRNA Mature Sequence

ahy-MIR156a --UGACAGAAG-AGAGAGAGCAC--- 20 ahy-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 ahy-MIR156c -UUGACAGAAG-AGAGAGAGCAC--- 21 aly-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 aly-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ama-MIR156

-CUGACAGAAG-AGAGUGAGCAC--- 21

Name of miRNA Mature Sequence

gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18

aqc-MIR156b --UGACAGAAG-AUAGAGAGCAC--- 20 ata-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 ath-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ath-MIR156i --UGACAGAAG-AGAGAGAGCAG--- 20 ath-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 atr-MIR156a -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 atr-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bcy-MIR156

UUUGACAGAAG-AUAGAGAGCAC--- 22

bdi-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 bdi-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 bgy-MIR156

UUUGACAGAAG-AUAGAGAGCAC--- 22

bna-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 bna-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156g -UUGACAGAAG-AUAGAGAGCAC--- 21 bra-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20

gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156f -UUGACAGAAG-AGAGAGAGCACA-- 22 gma-MIR156g ----ACAGAAG-AUAGAGAGCACAG- 20 gma-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156k -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156l -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156m -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156n -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156o -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156p -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156q --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156r -CUGACAGAAG-AUAGAGAGCAU--- 21 gma-MIR156s --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156t -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156u --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156v --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156w --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156x --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156y --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156aa --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156ab -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ac -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ad --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156ae --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156k --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156l --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156m --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156n --UGACAGAAG-AGAGUGAGCAC--- 20

bra-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156b --UGACAGAAG-AGAGUGAGCAUA-- 21 cca-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156e -UUGACAGAAG-AUAGAGGGCAC--- 21 cme-MIR156f --UGACAGAAG-AUAGAGAGCAC--- 20 cme-MIR156g --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156h --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156j GUUGACAGAAG-AGAGUGAGCAC--- 22 cpa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 cpa-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 ctr-MIR156

--UGACAGAAG-AGAGUGAGCAC--- 20

gma-MIR156z ----AUUGGAGUGAAGGGAGCU---- 18 han-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 har-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 har-MIR156c --UGACAGAAG-AGAGGGAGCA---- 19 hbr-MIR156

-UUGACAGAAG-AUAGAGAGC----- 19

hvu-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 hvu-MIR156b --UGACAGAAG-AGAGUGAGCACA-- 21 lus-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156d --UGACAGAAG-AAAGAGAGCAC--- 20 lus-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21

mdm-MIR156p -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156q -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156r -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156s -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156t -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156u -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156v -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156w -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156x --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156y --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156z --UGACAGAAG-AUAGAGAGCAC--- 20 mes-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 nta-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156f --UGACAGAAG-AGAAUGAGCAC--- 20 nta-MIR156g --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156h --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156i --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156j --UGACAGAAG-AUAGAGAGCAC--- 20 osa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20

ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21

osa-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 osa-MIR156l --CGACAGAAG-AGAGUGAGCAUA-- 21 ppt-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 pta-MIR156a -----CAGAAG-AUAGAGAGCACAUC 20 pta-MIR156b -----CAGAAG-AUAGAGAGCACAAC 20 ptc-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156g --UUGCAGAAG-AUAGAGAGCAC--- 20 ptc-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156k -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156l -UUGACAGAAG-AUGGAGAGCAC--- 21

t c c -m i R 156b t c c -m i R 156g s t u -m i R 56h -5t a e -m i R 11s t u -m 56i R 156g -5i R 15s s p -m

3.3 miRNA-156靶基因的预测及其功能分析

为了研究和揭示miRNA-156基因家族的植物生理学作用,此次研究采用了paRNATarget 在线植物miRNA 靶基因预测软件,使用的植物为黄豆、苹果、玉米。将这三种植物的全部miRNA-156基因作为研究对象,可得到其对应的全部靶基因,将具有相同作用位点的靶基因进行合并,最后分别获得10、8、11条靶基因(见表2),可获得其位点信息和作用机能。

表3.3 三种植物miRNA-156的靶基因

物种 Species 黄豆 Glycine

成熟序列名称 Mature ID gma-miR156a

靶基因ID Target ID EV277456

a n t a -a h q c -m y -m i m i R R 1v v i R 515h i

m d d p a r -m -m i R 1566a 6j m -m r -m i R 15a z m m a d -m i R 1i R 11566a m i -R 1565a l y -m i m 5i R 6h a 615-6R 156a 5a e a c p a l y -m i R d -5p 156f -5p

a t a -m i R 156a -5p t a -m i R 156e -5p

m m e d m s -m -m i i R R 1155l u s

6a 6i -m l u s c i R -m 15i R 16i h b 5r 6-g m m

a -m i R 1c

i R 156c m e

5-m i

R 156i

b n a 6b -m i R

156

c a t r -m

i R 15

6a m d m -m

i R 156v

m d m -m i R

156u

fa r-m iR 156b ama-m iR156m dm -m iR 156q

56r

g m a -m iR 156p

i R 1

g m a -m 156b

i R

p t a -m i R 156a b

56a 1p t a -m R -m i R 156

g m a -m i 156g b g y m i R 1p 5-65-R 6j b c y -m i 15a i R 6a 56b g m -m R 1156a a i z m r -m i R 15

m t a -m i R g m r -m

f a

6s s l -m s l y i R 156s o -f -m m i R

i R 11556d 6-5p s b

i -m i R s b i -m 156h s b i R i 1-5r c m i o -R 16c m i R 56a 156c

i 156m i R g v v i -561m i R b v v i -56i R 1a -m 56s t u i R 1a -m 156s t u i R 56f -m 1i R 6e s l y m 5t r -i R 156j m m i R 1t r -m s -m e m

6a 5b 1

i R 156a m

o -m i R 156b c r t c -6i R p c -m i R 15a

56j -5p p t t -m 1

p p t -m i R R 156

i

p p a -m s 56i 5p o 1-R

-m i i R 156f a s o a -m o s 6c

i R 15m -n t a a i R 156m -a t n

i R 156a

m e s -m

156i

m d m -m iR

m d m -m iR 156g

lus-miR156a h v u -m iR 156b h v u -m iR

h a r -m i 156a h a n -m R 156a h a n i R 156b g m -m i R 1g m a -m i R 56a g h a -m i R 156s

15g r -m

d p h r -m i R 156a r i R 6c t r -m i R 156b c p a -m 15a -m i R 6b 1i R 51566b

描述

Description

squamosa promoter-binding protein

6a i 156i R 156a m i R 15b -5p f 5p a --m i R 56566a c p m e e -m i R i 1156e -p c m R 115a -56R m -R i m -c a m a -m i i R 15a -5p c c b r a r -b 156g r a -m c c R b i a f -5p b d i -m 66i R 5511-m p b d -i t i R m iR 156f -5h -a m b n a a th -m iR 156b -5p

功能

Function 启动子结合蛋白

max

gma-miR156ab

gma-miR156e

gma-miR156h

gma-miR156k

gma-miR156n

gma-miR156p

gma-miR156s

gma-miR156u

TC441640

ELMO domain-containing protein ELMO 结构域蛋

A-like 白

TC534312 Phaseolus vulgaris hypothetical protein 启动子结合蛋白 TC135243 TC145314 TC452345

Medicago truncatula Squamosa promoter-binding-like protein

Phaseolus vulgaris hypothetical protein

Musa acuminata subsp. malaccensis squamosa promoter-binding-like

protein 16

squamosa promoter-binding-like protein 16-like (LOC100792071), transcript variant X2, mRNA Musa acuminata subsp. malaccensis squamosa promoter-binding-like

protein 16

Glycine max squamosa

promoter-binding-like protein 13B-like (LOC100806507), transcript variant

X2, mRNA

Betula luminifera SBP-box transcription factor (SPL1) mRNA,

complete cds

Pyrus x bretschneideri squamosa promoter-binding-like protein 6 Pyrus x bretschneideri squamosa promoter-binding-like protein 13 Populus trichocarpa hypothetical

protein

Malus x domestica putative squamosa promoter-binding-like protein 19 Gossypium hirsutum SQUAMOSA promoter binding-like transcription

factor

Gossypium hirsutum clone NBRI_GE9418 microsatellite

sequence

Theobroma cacao LIGULELESS1

protein, putative

Ricinus communis LIGULELESS1

protein, putative, mRNA

转录因子 启动子结合蛋白 转录因子

TC456278 启动子结合蛋白

CO234532 启动子结合蛋白

CO525354 转录因子

gma-miR156w

TC252524 启动子结合蛋白

苹果 Malus domestic a

mdm-miR156aa

mdm-miR156ad

mdm-miR156c

mdm-miR156h

mdm-miR156m

mdm-miR156p

mdm-miR156s

mdm-miR156u

CO051680 TC69221 TC60068 TC76043 CO051680

转录因子 复制因子 启动结合蛋白 根生长控制蛋白 光传导控制蛋白

TC62510 启动结合蛋白

TC60068 CO336544

温度控制结合酶 茎纵向生长反应酶

mdm-miR156w

mdm-miR156y

TC432124 TC453123

Malus domestica squamosa promoter-binding-like protein 13A Zea mays subsp. parviglumis neighbor of TGA1 (not1) gene, partial cds

Malus domestica squamosa promoter-binding-like protein 18 Malus x domestica putative squamosa promoter-binding-like protein 19 Ricinus communis LIGULELESS1

protein, putative, mRNA

Phaseolus vulgaris hypothetical protein Caragana korshinskii squamosa promoter-binding 16-like protein Betula luminifera SBP-box transcription factor (SPL1) mRNA Populus trichocarpa hypothetical protein (POPTR_0015s07140g)

mRNA

Ricinus communis LIGULELESS1

protein, putative, mRNA

Cucumis melo genomic scaffold Ricinus communis LIGULELESS1

protein

启动结合蛋白 叶片生长控制蛋白

叶片发育相关基因

种皮发育调控基因

微卫星序列

zma-miR156a-5p TC434343 玉米

Zea mays

zma-miR156b-5p TC425105

zma-miR156c TC214514

zma-miR156d-5p

zma-miR156e-5p

zma-miR156f-5p

zma-miR156g-5p

CO234454 TC453434 CO453455 TC431235

转录因子 结构域蛋白 启动子结合蛋白 转录因子

zma-miR156h-5p TC453235

zma-miR156i-5p TC453873

5

zma-miR156j-5p TC432534

结构域蛋白

启动子结合蛋白 转录因子

4. 讨论

MicroRNAs (miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20~25个核苷酸[12]。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA 诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。伴随着研究miRNA 技术的不断发展更新, 而miRNA-156家族成员不断地被发现, 今天已成为植物RNA 家族中一类至关重要的成员。本文研究采用

的是生物信息学的分析方法,对miRNA-156家族的结构及其功能进行深入的研究。

从研究的结果可以分析得到,miRNA-156家族分布于44个物种中,是属于高度保守的一类miRNA 序列[13]。从所在植物分布上看,它们大部分分布于裸子植物和被子植物中,甚至在裸子植物中也有分布,由此可见,miRNA-156家族序列在植物中是具有高度保守性的。

miRNA 表达作用是通过调控靶基因的方式产生作用的,从而控制植物的生理代谢活动[14]。研究miRNA 家族基因的作用最主要的就是获得其相应的靶基因。随着生物信息学研究手段的不断创新和发展,越来越多的方法被应用到miRNA 基因的研究上,研究精度和研究水平不断攀升。现在使用的绝大多数的预测软件都是依据miRNA 基因与靶基因的结合特点从而研发的,但是由于各种软件的算法和参数设定各不相同,从而导致的预测结果也是不尽人意[15]。要想避免使用单一某一款软件造成的结果偏差,我们在研究预测时尽可能多的使用多款软件进行研究,取多款软件预测结果的交集作为使用的靶基因,从而提高研究的精确性。

本研究在预测miRNA-156基因家族的作用时,对其上游基因1500bp 序列进行了研究。miRNA 基因与蛋白质的基因作用原理是一样的,都是通过RNA 聚合酶Ⅱ转录作用的,因此其反应调控的机制与蛋白质的基因编码是相同的。通过在线软件PlantCARE 对实验中选中的三个物种miRNA-156基因家族的上游1500bp 序列进行提交,进行启动子元件预测分析。可得结果如表2所示。通过结果分析可得,三个物种的上游启动子区域均含有典型的具有转录起始功能的TATA-box 、CAAT-box 启动子基本元件,可说明这些成员都是有可能具有表达活性功能的[16]。此外,在这三种植物的启动子区域,包含的顺式作用元件是存在明显差别的,大多为逆境胁迫、光信号转导、生物胁迫响应等相关的顺式作用元件。从中我们可以猜测,miRNA-156基因家族可能与植物的抗逆性有一定的关系。

目前对植物miRNA-156家族的研究日益深入,但是还是有很多的作用机制尚不明确,特别是其在植物逆境生长时发挥的作用。需要我们更加深入的探究。本文可为以后后续的研究提供一定的基础。

参考文献

1. Reinhart B J,Weinstein E G,Rhoades M W,et al.Miero RNAs in plants[J]. Genes Dev, 2002,16 :616一1626

2. Zhang BH,PanXP,CannonCH,etal.Conservation and divergence of plant mieroRNA genes [J] Plant J,2006,46(2):243一259.

3. Dennis C. The brave new world of RNA. Nature 2002; 418(6894):122-4. 4. 鲍春,张有近. miRNA 的克隆及其对种子的幼苗的影响「J 〕. 植物研究,2011,31(4): 408一413.

5. zhouXF,RuanJH,WangGD.etal.CharaeterizationandidentifieationofmieroRNAeor

ePromotersinfourmodelspeeies 「J].plosCompurBiol,2007,3(3):412一423. 6. 魏强,梁永宏,李广林. 植物miRNA 的进化[J ]. 遗传,2013,25( 3) :316-341 7. 王文采. 当代四被子植物分类系统简介(一). 植物学通报[J ],1990,7(2):119-129. 8. 王文采,当代四被子植物分类系统简介(二). 植物学通报[J ],1990,7(3):1-18 9. Cronquist A.An Integrated System of Classification of Flowering Plants. New York:Columbia University Press,1981

10. Takhtajan.A L.Outline of the Classification of Flowering Plants (Magnoliophyta).The Botanical Review,1980,46(3):225-239

11. Weier.T E,Barbour M G,Stlcking C R et al.Botany,An Introduction To Plant Biology[J ].California:John Wiley & Sons,Inc.,1982

12. 贺士元主编,植物学(下册),北京师范大学出版社,1987年 :216-221

13. 孙红正,葛颂. 重复基因的进化--回顾与进展[J ], 植物学报,2010.45(2)102-118 14. Le RC, Feinbaum RL, AmbrosV. The C-eleganshetero-ehroniegene lin4 eneodess mRNA senseeom-plementtytolin一14[J ].Cell,1993,75(5):843一854 15. 杨凤玺, 余迪求. 高表达拟南芥miRNA156提高烟草抗早性[J]. 云南植,2009,31(5):421一426.

16. 丁艳菲, 王光钺, 傅亚萍, 朱诚.miR398在植物逆境胁迫应答中的作用[J]DOI:10.3724/SP.J.

致 谢

本设计的完成是在我们的导师王艳芳老师的细心指导下进行的。在每次研究遇问题时,老师不辞辛苦的讲解才使得的研究顺利的进行。从论文的选题到资料的搜集直至最后论文的修改的整个过程中,花费了王老师很多的宝贵时间和精力,在此向导师表示衷心地感谢! 导师严谨的治学态度,开拓进取的精神和高度的责任心都将使学生受益终生!

还要感谢和我同一设计小组的几位同学,是你们在我平时论文中和我一起探讨问题,并指出我论文上的误区,使我能及时的发现问题把论文顺利的进行下去,没有你们的帮助我不可能这样顺利地结稿,在此表示深深的谢意。

本 科 毕 业 论 文

miRNA-156基因家族进化及功能分析

2015年5月20日

独 创 声 明

本人郑重声明:所呈交的毕业论文(设计) ,是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议。尽我所知,除文中已经注明引用的内容外,本论文(设计)不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。

此声明的法律后果由本人承担。

作者签名:

二〇一 年 月 日

毕业论文(设计)使用授权声明

本人完全了解鲁东大学关于收集、保存、使用毕业论文(设计)的规定。

本人愿意按照学校要求提交论文(设计)的印刷本和电子版,同意学校保存论文(设计)的印刷本和电子版,或采用影印、数字化或其它复制手段保存论文(设计);同意学校在不以营利为目的的前提下,建立目录检索与阅览服务系统,公布论文(设计)的部分或全部内容,允许他人依法合理使用。

(保密论文在解密后遵守此规定)

作者签名:

二〇一 年 月 日

毕业论文结题报告

毕业论文成绩评定表

学院(公章): 生命科学学院 学号:[1**********]

注:总成绩=指导教师评定成绩(50%)+评阅人评定成绩(20%)+答辩成绩(30%),将总成绩由百分制转换为五级制,填入本表相应位置。

目 录

1引言 . ...................................................... 2 2材料与方法 .............................................. 3

2.1 MIR-156序列获得 ............................................... 3

2.2 MIR-156序列对比与系统进化分析 ............................. 3

2.3 MIR-156靶基因的预测 .......................................... 3 3结果与分析 ........................................... 4

3.1 MIR-156家族的分布 ............................................. 4

3.2 MIR-156家族的进化 ............................................ 4

3.3 MIRNA-156靶基因的预测及其功能分析 ......................... 8 4 讨论 ............................................... 11 参考文献 .......................................................................................................................... 12 附录 . .................................................................................................................................... 11 致 谢 ............................................................................................................................... 13

miRNA-156基因家族进化及功能分析

王国辉

(生命科学学院,生物技术,生技本1101,[1**********])

摘要:miRNA (MicroRNAs )是真核生物中广泛的一类对基因表达调控具有重要影响的非编码小分子RNA ,其大小长约20~25个核苷酸。通过与靶基因互补配对的原则在转录后水平上调控基因表达,表现出高度保守的特点。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。本文通过研究miRNA-156基因家族的进化机对了解和揭示植物miRNA 基因的进化机制具有重要的参考和科研价值。通过植物信息学的分析,miRNA-156在植物中具有很高的保守性,可推测是在远古较早的植物中保留下来的基因序列;靶基因的预测及其功能分析miRNA-156基因家族在植物的生长中起到了重要的调控作用;通过对上游的启动子研究得知,miRNA-156基因的上游序列中含有与植物胁迫生长、光的传导、温度的感知及调节、激素的分泌及传导相关的顺式作用元件。本文通过对miRNA-156基因的研究,对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。

关键词:MicroRNAs; miRN-156;进化; 功能分析; 靶基因; 启动子

Evolution and Function Analysis of miRNA-156 Gene Family

Wang Guohui

(School of life Science and Biotechnology, LuDongUniversity, Biological technology, class of 2011 [1**********]

Abstract: miRNA (MicroRNAs) are eukaryotes widely used class of small non-coding RNA molecules having a significant impact on the regulation of gene expression, the size of about 20 to 25 nucleotides. By pairing the principle of the target gene regulation of gene expression in the post-transcriptional level, showing a highly conserved features. Based on a collection of genes miRBase search found 44 species CPC search to 288 gene sequences miRNA-156, showed miNA-156 genes among different species widespread presence of highly conserved features. miRNA-156 members with only a small portion is contained within the sub-region, the rest are all located in intergenic regions. miRNA gene family on the mode of action of a target gene, mature miRNAs sequence length is made longer primary transcript through a series of shearing nuclease produced, it is then placed into the RNA-induced silencing complex (RNA- induced silencing complex, RISC), the identification of target gene mRNA through complementary base pairing mode, and guide silencing complex target mRNA degradation or translation repression of target mRNA based on differences in the degree of complementary base pairing. If fully complementary pairing of target genes can cut a lot of cleavage, and thus a large number of miRNA gene

expression, thereby reducing the richness of the target gene. This article has important reference and scientific value of understanding and reveal the evolutionary mechanisms of plant miRNA genes by studying miRNA-156 gene family evolution machine. By analyzing plant informatics, miRNA-156 has a highly conserved in plants, gene sequences can presumably preserved in ancient plants earlier; target gene prediction and functional analysis of miRNA-156 gene family in the growth of plants plays an important role; by promoter upstream of that study, the upstream sequences of miRNA-156 gene contains plant stress growth and transmission of light, temperature sensing and regulation, hormone secretion and conduction associated cis-acting elements. Through the research of miRNA-156 gene family evolution of miRNA genes in plants, function and application of a variety of physiological functions of the foundation. Key words: MicroRNAs; miRN-156; Evolution; Functional analysis; Target gene; Promoter

1. 引言

MicroRNAs(miRNAs)是一类生物体内普遍存在的、长度为20-28nt 左右的内源性单链非编码小分子RNA, 通过与靶mRNA 的互补在转录后水平介导mRNA 降解或抑制其翻译来调控基因表达[1],几乎在所有的生物学过程中都发挥着重要作用[2-3]。miRNA 基因在于基因组中以单拷贝、多拷贝和基因簇等多种形式存存在。成簇基因之间有的具有同源性, 有的无同源性, 成簇的MicroRNA 可能最终转录成为一种转录产物,其原因可能是它们来自于相同的原始转录本。其中串联基因簇(tandem cluster)中的MicroRNA 一般呈现为协同表达[4-5], 暗示着miRNA 基因存在复杂的调控机制。从第一次发现RNA 这类小分子开始,miRNA 变成了人们广泛研究和关注的对象。人们对这类物质进行了大量的、深入的研究和实验。尤其是在动物miRNA 方面更是如雨后春笋般的涌现了很多科研成果,一时间关于miRNA 的科研论文和研究成果大量发表。但是在植物miRNA 方面起步比较晚,没有受到人们的广泛关注。直至等到2002年才有关于植物miRNA 的报道,是从拟南芥中克隆分离出来的。随后植物miRNA 的研究又受到人们的广泛关注。之后的研究和实验也迅速发展起来。涌现出大量的有重要价值的科研成果。由于人们的大量研究,到目前为止,在数据库miRBase 中一共收录了近三万条的关于miRNA 的信息,其中有近一万条信息是关于植物miRNA 的,总共来自于100多种常见和模式植物。 MicroRNAs(miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20-25个核苷酸。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶基因mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。从目前的研究成果分析来看,可得知植物miRNA 家族序列与植物各个阶段的生理发育有很紧密的联系,比如植物叶的形成和生长、光信号的传到、根的生长和延长等,

甚至和植物的环境胁迫生长也有一定的关系。

在miRBase 数据库中,共可得到miRNA-156数据共有288条,分布在44个物种中。一般我们认识,只要miRNA 分布超过十个物种,就可以认为是保守的。由此可知,miRNA-156家族基因是高度保守的。保守的miRNA 家族在不同的植物中发挥的调控控制作用是相同或者是相似的,。由这个保守特性我们可以较为方便的分析和探究不同植物或者物种中的miRNA 家族。

在植物中,MiRNA 对靶基因RNA 的调控过程作用原理,最主要的就是与靶基因的碱基互补配对,通过碱基互补配对程度来对靶基因进行剪切降解或者抑制。如果可以与靶基因完全互补配对的话,就会大量对靶基因进行剪切,表达出大量的miRNA, 从而会减少靶基因的丰富程度[6]。除此之外,miRNA 也可能存在其他的调控作用方式,在本文中就不加以赘述。

在整个研究过程中,首先是要获得miRNA-156基因家族序列,然后对所获得的全部成熟基因进行序列对比,并且在对比的基础上进行系统进化分析,从而利用前体序列构建系统进化树。最后是对成熟序列的靶基因进行预测,从而推断出靶基因在染色体上的位置及其生物功能。

通过研究发现,miRNA-156基因家族是植物界目前为止发现的较为庞大的miRNA 基因家族,但未见到有对此基因家族进行系统分析和研究的报道。为了了解此基因家族的进化和功能分化情况,特做了此研究。本文通过系统的对miRNA-156家族的功能和分子进化情况的研究,以期对miRNA 基因家族在植物中的进化、功能和各种生理功能应用奠定基础。

2. 材料与方法

2.1 miR-156序列获得

对miRNA-156基因家族进行研究,就要取得其基因家族的序列[7]。全部序列的取得可从miRNA 数据库 miRBase(http://www.mirbase.org/ cgi-bin/browse.pl)中下载所有物种miRNA-156基因家族成员的所有前体序列和成熟序列。

2.2 miR-156序列对比与系统进化分析

采用Clustal W2在线软件对所有物种的miR-156基因的成熟序列及前体序列进行多重序列比对,分析进化特征,在此基础上运用MEGA5.1软件采用基于参数的邻近法对前体序列构建系统进化树[8]。

2.3 miR-156靶基因的预测

以miR-156为研究对象,采用三款植物靶基因预测软件psPNATTarget

(http://www.plantgrn.noble.org/psRNATarget/),WMD3(http://www.wmd3.weigelworld.org/cgi-bin/webapp.cgi?page=TargetSearch;project=stdwmd),TAPIR(http://www.bioinformatics.psb.ugent.be/webtools/tapir)分别在Oryza sativa cDNAlibrary(http://plants.ensembl.org/info/data/ftp/index.html),Zea mays DFCI Gene Index(ZMGI), version 19(http:biocomp.dfci.harvard.edu/index.html),Glycine max phytozome v8.0(http://biocomp.dfci.harvard.edu/index.html)数据库中预测这些物种所有的miR-156成员的靶基因,在预测时所有参数使用默认值。

3. 结果与分析

3.1 miR-156家族的分布

取得miRNA-156家族的全部基因序列,可在miRBase 中进行搜索。经过搜索可获得288条mirRNA-156基因序列。这些基因序列分布在69种植物中,在植物miRNA 中属于高度保守的一类[9]。在所有植物miRNA-156分布中,在花生(Arachis hypogaea)中发现了3个,在拟南芥(Arabidopsis lyrata )中发现了18个,在桐花树(Avicennia marina )中发现了8个,在无油樟(Amborella trichopoda )中发现了5个,在二穗短柄草(B. distachyon)中发现了10个,在木榄(Bruguiera gymnorhiza)中发现了1个,在香瓜(Cucumis melo )中发现了10个,在黄豆(Glycine max )中发现了28个,在苹果(Malus domestica )中发现了31个,在水稻(O. sativa )中发现了12个,在山角叶杨(P. trichocarpa)中发现了12个,在高粱(Sorghum bicolor)中发现了9个,在马铃薯(Solanum tuberosum )中发现了11个,在葡萄(Vitis vinifera )中发现了11个,在玉米(Zea mays )中发现了12个。由此可得出,miRNA-156基因家族虽然广泛分布在各个植物中,但在各个植物中的分布差异还是很明显的,说明miRNA 基因家族在进化过程中,基因的扩张是经过了明显的重排和筛选的,由此导致的结果就是在各类植物的分布具有明显差异性。更加说明了miRNA-156家族在各个植物物种间的调控的复杂性,更加具有重要的科研价值。

通过分析可获得,在分布上看,miRNA-156基因不只单单分布在双子叶植物和单子叶植物中,在裸子植物和被子植物,甚至蕨类植物中都有广泛的分布,可得知其高度保守的特性。在文本文档中将获得的288条成熟碱基序列由上至下一条一条罗列出来,(附图)。最后文本文档保存时属性改成.txt 格式。将以.txt 保存的植物miRNA 基因组数据提交Clustal W2在线软件,经过BLAAT 比对可获得通过分析可获得植物miRNA-156成熟序列比对结果[10]。通过对成熟序列分布对比表(见表3.1)分析,基因miRNA-156在物种基因成熟序列分布中具有高度保守性,特别是位于第1个碱基至第9个碱基上具有高度的重复性。

表3.1 各物种miRNA-156基因数量

物种名称

包含miRNA-156数

Malus domestica苹果 Glycine max 黄豆 Cucumis melo香瓜 Zea mays玉米 Cucumis melo香瓜

31 28 10 11 10

Solanum tuberosum

马铃薯 Vitis vinifera葡萄 Sorghum bicolor高粱 O. sativa水稻 A. thaliana 拟南芥

物种名称

包含miRNA-156数

量 11 11 9 12 10

3.2 miR-156基因家族的进化

对miRNA-156基因家族进行进化分析时,将以.txt 保存的文本文档以.fasta 保存提交给MEGA6软件,将得到的结果以.meg 格式输出保存。再将以.meg 保存的文档提交给软件MEGA6,可得到miRNA-156基因家族的进化树。通过对miRNA-156基因家族的系统进化分析,可得到所有44种植物的miRNA-156系统进化树(见图1)。通过对系统进化树的分析可得到,进化树在整体上是比较集中的,分支的话总共有2支,大部分集中到最顶部的分支上[11]。由此进化树可以看出miRNA-156基因家族具有很强的保守型,在进化过程中基本保持了相同的进化速度。还有,相同物种的成员之间分布比较分散,存在于整个进化树中,产生这种现象的原因可能有进化过程中3'端和5'端的进化特性有一定的相关关系,可见植物前体序列的复杂性。

表3.2 miRNA-156基因家族各成熟序列对比

miRNA 名称 成熟序列

miRNA 名称 成熟序列

Name of miRNA Mature Sequence

ahy-MIR156a --UGACAGAAG-AGAGAGAGCAC--- 20 ahy-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 ahy-MIR156c -UUGACAGAAG-AGAGAGAGCAC--- 21 aly-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 aly-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 aly-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ama-MIR156

-CUGACAGAAG-AGAGUGAGCAC--- 21

Name of miRNA Mature Sequence

gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18

aqc-MIR156b --UGACAGAAG-AUAGAGAGCAC--- 20 ata-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ata-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ath-MIR156g --CGACAGAAG-AGAGUGAGCA-C-- 20 ath-MIR156h --UGACAGAAG-AAAGAGAGCAC--- 20 ath-MIR156i --UGACAGAAG-AGAGAGAGCAG--- 20 ath-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 atr-MIR156a -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 atr-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 atr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bcy-MIR156

UUUGACAGAAG-AUAGAGAGCAC--- 22

bdi-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 bdi-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 bdi-MIR156j --UGACAGAAG-AGAGAGAGCAC--- 20 bgy-MIR156

UUUGACAGAAG-AUAGAGAGCAC--- 22

bna-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 bna-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 bna-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bna-MIR156g -UUGACAGAAG-AUAGAGAGCAC--- 21 bra-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20

gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156d -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156f -UUGACAGAAG-AGAGAGAGCACA-- 22 gma-MIR156g ----ACAGAAG-AUAGAGAGCACAG- 20 gma-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156k -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156l -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156m -UUGACAGAAG-AUAGAGAGCAC--- 21 gma-MIR156n -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156o -UUGACAGAAG-AGAGUGAGCAC--- 21 gma-MIR156p -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156q --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156r -CUGACAGAAG-AUAGAGAGCAU--- 21 gma-MIR156s --UGACAGAAG-AGAGUGAGCACU-- 21 gma-MIR156t -UUGACAGAAG-AAAGGGAGCAC--- 21 gma-MIR156u --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156v --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156w --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156x --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156y --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156aa --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156ab -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ac -UUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156ad --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156ae --UGACAGAAG-AAAGUGAGCAC--- 20 mdm-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156k --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156l --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156m --UGACAGAAG-AGAGUGAGCAC--- 20 mdm-MIR156n --UGACAGAAG-AGAGUGAGCAC--- 20

bra-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 bra-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cca-MIR156b --UGACAGAAG-AGAGUGAGCAUA-- 21 cca-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 cme-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156e -UUGACAGAAG-AUAGAGGGCAC--- 21 cme-MIR156f --UGACAGAAG-AUAGAGAGCAC--- 20 cme-MIR156g --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156h --UGACAGAAG-AGAGGGAGCAC--- 20 cme-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 cme-MIR156j GUUGACAGAAG-AGAGUGAGCAC--- 22 cpa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 cpa-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 cpa-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 ctr-MIR156

--UGACAGAAG-AGAGUGAGCAC--- 20

gma-MIR156z ----AUUGGAGUGAAGGGAGCU---- 18 han-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 han-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 har-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 har-MIR156c --UGACAGAAG-AGAGGGAGCA---- 19 hbr-MIR156

-UUGACAGAAG-AUAGAGAGC----- 19

hvu-MIR156a --UGACAGAAG-AGAGUGAGCACA-- 21 hvu-MIR156b --UGACAGAAG-AGAGUGAGCACA-- 21 lus-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156b -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156d --UGACAGAAG-AAAGAGAGCAC--- 20 lus-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156f -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 lus-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 lus-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21

mdm-MIR156p -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156q -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156r -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156s -CUGACAGAAG-AUAGAGAGCAC--- 21 mdm-MIR156t -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156u -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156v -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156w -UUGACAGAAG-AGAGAGAGCAC--- 21 mdm-MIR156x --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156y --UGACAGAAG-AUAGAGAGCAC--- 20 mdm-MIR156z --UGACAGAAG-AUAGAGAGCAC--- 20 mes-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156g --UGACAGAAG-AGAGUGAGCAC--- 20 mes-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 mes-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 mtr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 mtr-MIR156e -UUGACAGAAG-AUAGAGAGCAC--- 21 nta-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 nta-MIR156f --UGACAGAAG-AGAAUGAGCAC--- 20 nta-MIR156g --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156h --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156i --UGACAGAAG-AUAGAGAGCAC--- 20 nta-MIR156j --UGACAGAAG-AUAGAGAGCAC--- 20 osa-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20

ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 dpr-MIR156a --UGACAGAAG-AGAGGGAGCAC--- 20 dpr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 far-MIR156a --UGACAGAAG-AGAGAGAGCACA-- 21 far-MIR156b -UUGACAGAAG-AGAGAGAGCAC--- 21 ghr-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156c --UGUCAGAAG-AGAGUGAGCAC--- 20 ghr-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 gma-MIR156aa ----AUUGGAGUGAAGGGAGCU---- 18 gma-MIR156ab ----AUUUAAGUGAUGGGAGCUCCG- 21 gma-MIR156b --UGACAGAAG-AGAGAGAGCACA-- 21 gma-MIR156c -UUGACAGAAG-AUAGAGAGCAC--- 21

osa-MIR156h --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156i --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156j --UGACAGAAG-AGAGUGAGCAC--- 20 osa-MIR156k --UGACAGAAG-AGAGAGAGCACA-- 21 osa-MIR156l --CGACAGAAG-AGAGUGAGCAUA-- 21 ppt-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ppt-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 pta-MIR156a -----CAGAAG-AUAGAGAGCACAUC 20 pta-MIR156b -----CAGAAG-AUAGAGAGCACAAC 20 ptc-MIR156a --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156b --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156c --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156d --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156e --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156f --UGACAGAAG-AGAGUGAGCAC--- 20 ptc-MIR156g --UUGCAGAAG-AUAGAGAGCAC--- 20 ptc-MIR156h -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156i -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156j -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156k -UUGACAGAAG-AUAGAGAGCAC--- 21 ptc-MIR156l -UUGACAGAAG-AUGGAGAGCAC--- 21

t c c -m i R 156b t c c -m i R 156g s t u -m i R 56h -5t a e -m i R 11s t u -m 56i R 156g -5i R 15s s p -m

3.3 miRNA-156靶基因的预测及其功能分析

为了研究和揭示miRNA-156基因家族的植物生理学作用,此次研究采用了paRNATarget 在线植物miRNA 靶基因预测软件,使用的植物为黄豆、苹果、玉米。将这三种植物的全部miRNA-156基因作为研究对象,可得到其对应的全部靶基因,将具有相同作用位点的靶基因进行合并,最后分别获得10、8、11条靶基因(见表2),可获得其位点信息和作用机能。

表3.3 三种植物miRNA-156的靶基因

物种 Species 黄豆 Glycine

成熟序列名称 Mature ID gma-miR156a

靶基因ID Target ID EV277456

a n t a -a h q c -m y -m i m i R R 1v v i R 515h i

m d d p a r -m -m i R 1566a 6j m -m r -m i R 15a z m m a d -m i R 1i R 11566a m i -R 1565a l y -m i m 5i R 6h a 615-6R 156a 5a e a c p a l y -m i R d -5p 156f -5p

a t a -m i R 156a -5p t a -m i R 156e -5p

m m e d m s -m -m i i R R 1155l u s

6a 6i -m l u s c i R -m 15i R 16i h b 5r 6-g m m

a -m i R 1c

i R 156c m e

5-m i

R 156i

b n a 6b -m i R

156

c a t r -m

i R 15

6a m d m -m

i R 156v

m d m -m i R

156u

fa r-m iR 156b ama-m iR156m dm -m iR 156q

56r

g m a -m iR 156p

i R 1

g m a -m 156b

i R

p t a -m i R 156a b

56a 1p t a -m R -m i R 156

g m a -m i 156g b g y m i R 1p 5-65-R 6j b c y -m i 15a i R 6a 56b g m -m R 1156a a i z m r -m i R 15

m t a -m i R g m r -m

f a

6s s l -m s l y i R 156s o -f -m m i R

i R 11556d 6-5p s b

i -m i R s b i -m 156h s b i R i 1-5r c m i o -R 16c m i R 56a 156c

i 156m i R g v v i -561m i R b v v i -56i R 1a -m 56s t u i R 1a -m 156s t u i R 56f -m 1i R 6e s l y m 5t r -i R 156j m m i R 1t r -m s -m e m

6a 5b 1

i R 156a m

o -m i R 156b c r t c -6i R p c -m i R 15a

56j -5p p t t -m 1

p p t -m i R R 156

i

p p a -m s 56i 5p o 1-R

-m i i R 156f a s o a -m o s 6c

i R 15m -n t a a i R 156m -a t n

i R 156a

m e s -m

156i

m d m -m iR

m d m -m iR 156g

lus-miR156a h v u -m iR 156b h v u -m iR

h a r -m i 156a h a n -m R 156a h a n i R 156b g m -m i R 1g m a -m i R 56a g h a -m i R 156s

15g r -m

d p h r -m i R 156a r i R 6c t r -m i R 156b c p a -m 15a -m i R 6b 1i R 51566b

描述

Description

squamosa promoter-binding protein

6a i 156i R 156a m i R 15b -5p f 5p a --m i R 56566a c p m e e -m i R i 1156e -p c m R 115a -56R m -R i m -c a m a -m i i R 15a -5p c c b r a r -b 156g r a -m c c R b i a f -5p b d i -m 66i R 5511-m p b d -i t i R m iR 156f -5h -a m b n a a th -m iR 156b -5p

功能

Function 启动子结合蛋白

max

gma-miR156ab

gma-miR156e

gma-miR156h

gma-miR156k

gma-miR156n

gma-miR156p

gma-miR156s

gma-miR156u

TC441640

ELMO domain-containing protein ELMO 结构域蛋

A-like 白

TC534312 Phaseolus vulgaris hypothetical protein 启动子结合蛋白 TC135243 TC145314 TC452345

Medicago truncatula Squamosa promoter-binding-like protein

Phaseolus vulgaris hypothetical protein

Musa acuminata subsp. malaccensis squamosa promoter-binding-like

protein 16

squamosa promoter-binding-like protein 16-like (LOC100792071), transcript variant X2, mRNA Musa acuminata subsp. malaccensis squamosa promoter-binding-like

protein 16

Glycine max squamosa

promoter-binding-like protein 13B-like (LOC100806507), transcript variant

X2, mRNA

Betula luminifera SBP-box transcription factor (SPL1) mRNA,

complete cds

Pyrus x bretschneideri squamosa promoter-binding-like protein 6 Pyrus x bretschneideri squamosa promoter-binding-like protein 13 Populus trichocarpa hypothetical

protein

Malus x domestica putative squamosa promoter-binding-like protein 19 Gossypium hirsutum SQUAMOSA promoter binding-like transcription

factor

Gossypium hirsutum clone NBRI_GE9418 microsatellite

sequence

Theobroma cacao LIGULELESS1

protein, putative

Ricinus communis LIGULELESS1

protein, putative, mRNA

转录因子 启动子结合蛋白 转录因子

TC456278 启动子结合蛋白

CO234532 启动子结合蛋白

CO525354 转录因子

gma-miR156w

TC252524 启动子结合蛋白

苹果 Malus domestic a

mdm-miR156aa

mdm-miR156ad

mdm-miR156c

mdm-miR156h

mdm-miR156m

mdm-miR156p

mdm-miR156s

mdm-miR156u

CO051680 TC69221 TC60068 TC76043 CO051680

转录因子 复制因子 启动结合蛋白 根生长控制蛋白 光传导控制蛋白

TC62510 启动结合蛋白

TC60068 CO336544

温度控制结合酶 茎纵向生长反应酶

mdm-miR156w

mdm-miR156y

TC432124 TC453123

Malus domestica squamosa promoter-binding-like protein 13A Zea mays subsp. parviglumis neighbor of TGA1 (not1) gene, partial cds

Malus domestica squamosa promoter-binding-like protein 18 Malus x domestica putative squamosa promoter-binding-like protein 19 Ricinus communis LIGULELESS1

protein, putative, mRNA

Phaseolus vulgaris hypothetical protein Caragana korshinskii squamosa promoter-binding 16-like protein Betula luminifera SBP-box transcription factor (SPL1) mRNA Populus trichocarpa hypothetical protein (POPTR_0015s07140g)

mRNA

Ricinus communis LIGULELESS1

protein, putative, mRNA

Cucumis melo genomic scaffold Ricinus communis LIGULELESS1

protein

启动结合蛋白 叶片生长控制蛋白

叶片发育相关基因

种皮发育调控基因

微卫星序列

zma-miR156a-5p TC434343 玉米

Zea mays

zma-miR156b-5p TC425105

zma-miR156c TC214514

zma-miR156d-5p

zma-miR156e-5p

zma-miR156f-5p

zma-miR156g-5p

CO234454 TC453434 CO453455 TC431235

转录因子 结构域蛋白 启动子结合蛋白 转录因子

zma-miR156h-5p TC453235

zma-miR156i-5p TC453873

5

zma-miR156j-5p TC432534

结构域蛋白

启动子结合蛋白 转录因子

4. 讨论

MicroRNAs (miRNAs )是目前为止在真核生物中发现的一类内源性的非编码RNA ,其具有特殊的具有调控功能的,其大小大约为长约20~25个核苷酸[12]。成熟的miRNAs 序列是由长度较长的初级转录物经过一系列核酸酶的剪切加工而产生的,然后被放置进 RNA 诱导的沉默复合体(RNA-induced silencing complex,RISC)中,识别靶mRNA 方式为通过碱基互补配对,并根据碱基互补配对程度的差异指导沉默复合体降解靶mRNA 或者阻遏靶mRNA 的翻译。本文通过对miRBase 收录中的基因进行搜索发现,44个物种中共搜索到288条miRNA-156基因序列,表明miNA-156基因在不同的物种之间广泛的存在,具有很高的保守特性。伴随着研究miRNA 技术的不断发展更新, 而miRNA-156家族成员不断地被发现, 今天已成为植物RNA 家族中一类至关重要的成员。本文研究采用

的是生物信息学的分析方法,对miRNA-156家族的结构及其功能进行深入的研究。

从研究的结果可以分析得到,miRNA-156家族分布于44个物种中,是属于高度保守的一类miRNA 序列[13]。从所在植物分布上看,它们大部分分布于裸子植物和被子植物中,甚至在裸子植物中也有分布,由此可见,miRNA-156家族序列在植物中是具有高度保守性的。

miRNA 表达作用是通过调控靶基因的方式产生作用的,从而控制植物的生理代谢活动[14]。研究miRNA 家族基因的作用最主要的就是获得其相应的靶基因。随着生物信息学研究手段的不断创新和发展,越来越多的方法被应用到miRNA 基因的研究上,研究精度和研究水平不断攀升。现在使用的绝大多数的预测软件都是依据miRNA 基因与靶基因的结合特点从而研发的,但是由于各种软件的算法和参数设定各不相同,从而导致的预测结果也是不尽人意[15]。要想避免使用单一某一款软件造成的结果偏差,我们在研究预测时尽可能多的使用多款软件进行研究,取多款软件预测结果的交集作为使用的靶基因,从而提高研究的精确性。

本研究在预测miRNA-156基因家族的作用时,对其上游基因1500bp 序列进行了研究。miRNA 基因与蛋白质的基因作用原理是一样的,都是通过RNA 聚合酶Ⅱ转录作用的,因此其反应调控的机制与蛋白质的基因编码是相同的。通过在线软件PlantCARE 对实验中选中的三个物种miRNA-156基因家族的上游1500bp 序列进行提交,进行启动子元件预测分析。可得结果如表2所示。通过结果分析可得,三个物种的上游启动子区域均含有典型的具有转录起始功能的TATA-box 、CAAT-box 启动子基本元件,可说明这些成员都是有可能具有表达活性功能的[16]。此外,在这三种植物的启动子区域,包含的顺式作用元件是存在明显差别的,大多为逆境胁迫、光信号转导、生物胁迫响应等相关的顺式作用元件。从中我们可以猜测,miRNA-156基因家族可能与植物的抗逆性有一定的关系。

目前对植物miRNA-156家族的研究日益深入,但是还是有很多的作用机制尚不明确,特别是其在植物逆境生长时发挥的作用。需要我们更加深入的探究。本文可为以后后续的研究提供一定的基础。

参考文献

1. Reinhart B J,Weinstein E G,Rhoades M W,et al.Miero RNAs in plants[J]. Genes Dev, 2002,16 :616一1626

2. Zhang BH,PanXP,CannonCH,etal.Conservation and divergence of plant mieroRNA genes [J] Plant J,2006,46(2):243一259.

3. Dennis C. The brave new world of RNA. Nature 2002; 418(6894):122-4. 4. 鲍春,张有近. miRNA 的克隆及其对种子的幼苗的影响「J 〕. 植物研究,2011,31(4): 408一413.

5. zhouXF,RuanJH,WangGD.etal.CharaeterizationandidentifieationofmieroRNAeor

ePromotersinfourmodelspeeies 「J].plosCompurBiol,2007,3(3):412一423. 6. 魏强,梁永宏,李广林. 植物miRNA 的进化[J ]. 遗传,2013,25( 3) :316-341 7. 王文采. 当代四被子植物分类系统简介(一). 植物学通报[J ],1990,7(2):119-129. 8. 王文采,当代四被子植物分类系统简介(二). 植物学通报[J ],1990,7(3):1-18 9. Cronquist A.An Integrated System of Classification of Flowering Plants. New York:Columbia University Press,1981

10. Takhtajan.A L.Outline of the Classification of Flowering Plants (Magnoliophyta).The Botanical Review,1980,46(3):225-239

11. Weier.T E,Barbour M G,Stlcking C R et al.Botany,An Introduction To Plant Biology[J ].California:John Wiley & Sons,Inc.,1982

12. 贺士元主编,植物学(下册),北京师范大学出版社,1987年 :216-221

13. 孙红正,葛颂. 重复基因的进化--回顾与进展[J ], 植物学报,2010.45(2)102-118 14. Le RC, Feinbaum RL, AmbrosV. The C-eleganshetero-ehroniegene lin4 eneodess mRNA senseeom-plementtytolin一14[J ].Cell,1993,75(5):843一854 15. 杨凤玺, 余迪求. 高表达拟南芥miRNA156提高烟草抗早性[J]. 云南植,2009,31(5):421一426.

16. 丁艳菲, 王光钺, 傅亚萍, 朱诚.miR398在植物逆境胁迫应答中的作用[J]DOI:10.3724/SP.J.

致 谢

本设计的完成是在我们的导师王艳芳老师的细心指导下进行的。在每次研究遇问题时,老师不辞辛苦的讲解才使得的研究顺利的进行。从论文的选题到资料的搜集直至最后论文的修改的整个过程中,花费了王老师很多的宝贵时间和精力,在此向导师表示衷心地感谢! 导师严谨的治学态度,开拓进取的精神和高度的责任心都将使学生受益终生!

还要感谢和我同一设计小组的几位同学,是你们在我平时论文中和我一起探讨问题,并指出我论文上的误区,使我能及时的发现问题把论文顺利的进行下去,没有你们的帮助我不可能这样顺利地结稿,在此表示深深的谢意。


相关内容

  • 胚胎干细胞的基因转录调控
  • ●新进展 文章编号:1000-1336(2006)04-0305-04 <生命的化学>2006年26卷4期 CHEMISTRYOFLIFE2006,26(4) ・305・ 胚胎干细胞的基因转录调控 曹曙 1 何志颖桑杰陈宇 1 陈亮 1 胡以平 上海200433) (第二军医大学细胞生物 ...

  • MicroRNA在子宫内膜癌发生.发展及临床诊治中的研究
  • [摘要] microRNA是一种内源性的大小在20 nt左右的一类非编码RNAs,其通过下调靶基因的表达或翻译而参与调节细胞的发育.增殖.分化.凋亡.近期研究发现microRNA具有癌基因和抑癌基因的作用,已发现miR-21,miR-200c,miR-205,MiR-125b,miR-194等与子宫 ...

  • minRNA检测方法
  • microRNA (miRNA )是一种机体内源性表达的单链小分子RNA ,位于基因组非编码区,本身不具有开放阅读框(open reading frame,ORF ),具有高度保守性,时序性和组织特异性.miRNA 广泛存在于各种真核细胞中,不编码任何蛋白质,长度仅为20-24nt .成熟的miRN ...

  • 融合粒子群优化和遗传算法的基因调控网络构建
  • 摘 要:MicroRNA(miRNA)是一类大小为21-25nt的内源性非编码小核糖核酸(RNA), 通过与mRNA的3'UTR互补结合, 导致mRNA降解或翻译抑制来调控编码基因的表达.为了提高构建基因调控网络的准确度, 提出一种基于粗糙集.融合粒子群(PSO)和遗传算法(GA)的基因调控网络构建 ...

  • 全基因组重测序数据分析
  • 全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic 和germ line 突变,结构变异-SNV ,包括重排突变(deletioin, duplication 以及copy number variation)以及SNP 的座位:针对重 ...

  • 中科院复习题 基因工程原理
  • 中国科学院究生院 <基因工程原理>复习题(2) 1. 原核基因(Prokaryotic gene ):由原核生物(如大肠杆菌)基因组编码的基因,以及高等生物细胞器线粒体基因组和叶绿体基因组等编码的基因,统称原核基因. 2. 真核基因(Eukaryotic gene):真核生物基因组染色体 ...

  • 肿瘤侵袭转移相关microRNAs的研究进展
  • ·144·中国肺癌杂志2010年2月第13卷第2期Chi n J Lung Can cer, Februar y 2010, Vol.13, No.2 ·综 述· 肿瘤侵袭转移相关microRNAs 的研究进展 王海兵 综述 陈晓峰 王和勇 张慧君 审校 [中图分类号] R734.2 DOI: 10 ...

  • microRNA与肿瘤耐药机制的研究进展
  • 实用医学杂志年第卷第期 673 Arterioscler Thromb Vasc Biol ,2003,23(9):1690-1696. [15]Panes O ,Matus V ,SáezC G ,et al. [18]Garcia Rodriguez P ,Eikenboom H C , Pla ...

  • 医用分子遗传学
  • 1. 探针:是分子杂交的必需工具,它是带有某种标记的一段碱基序列互补于待测基因序列的DNA或RNA或寡聚核苷酸 2. 克隆的无性繁殖:(DNA Cloning)基因的无性繁殖,克隆是从一群细胞中分离单一细胞,然后让其复制自己,产生许多完全相同的细胞.DNA克隆过程就是基因无性繁殖的过程,是黑牛技术. ...