Clustalx 多重序列比对图解教程(图解使用)

Clustalx 多重序列比对图解教程(By Raindy)

本帖首发于Raindy'blog,转载请保留作者信息,谢谢!欢迎有写生物学软件专长的战友,加入生信教程写作群:13559330,接头暗号:你所擅长的生物学软件名称

软件简介:

CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。

序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。

主要功能:

你可以剪切、粘贴序列以更改比对的顺序;

你可以选择序列子集进行比对;

你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;

可执行比对质量分析,低分值片段或异常残基将以高亮显示。

当前版本:1.83

PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的Clustalx 1.81版 链接地址:http://www.hanzify.org/index.php?Go=Show:ist&ID=7435 (请完整复制)

应用:Clustalx比对结果是构建系统发育树的前提

实例:植物呼肠孤病毒属外层衣壳蛋白P8(AA序列)为例

流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果

1.载入序列:运行ClustalX,主界面窗 口如下所图(图1),依次在程序上方的菜单栏选择“File”-“Load Sequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replace existing sequences),根据具体情形选择操作。

图1

图2

2.编辑序列: 对标尺(Ruler)上方的序列进行编辑操作,主要有Cut

sequences(剪切序列)、Paste sequences(粘贴)、Select All sequences(选定所有序列),Clear sequence Selection(清除序列选定)、Search for string(搜索字串)、Remove All gaps(移除序列空位)、Remove Gap-Only Columns(仅移除选定序列的空位)

图3

3.参数设置: 可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参数主要有六个,分别是Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数),Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数),Secondary structure Parameters(二级结构参数),如图4所示:

图4

修改参数只需点击相应标签,示例比对的是多序列比对,故可选择“Multiple Alignment Parameters”弹出参数设置窗口,如图5所示:

图5

4.完全比对: 返回菜单栏选择“Complete Alignment”标签,此时会弹出输出文件路径的设置窗口,设置Guide Tree File(向导树或指导树文件)、Alignment File(比对文件)的保存位置(存放路径),点击“Align”按钮程序自动开始序列的完全比对,比对所需时间因序列文件大小和长度、计算机性能而异, 如图6-8所示:

图6

图7

图8

当主界面的左下状态栏会提示“CLUSTAL-Alignment File created []”时说明比全完毕,这时文件保存位置的目录下会生成生成两个文件,分别是*.aln和*.dnd,aln是序列比对的文件,可以进一步用于构树系统发 育树,dnd是向导树文件(指导树),这两个文件可以用Windows系统中的“记事本”或第三方程序“UltraEdit”等打开,如:

图9 ALN文件

图10 dnd文件

5.后续分析:

1)Clustalx比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如Boxshade、ESPript,这两个工具都是在线进行,其中Boxshade图解教程详见本Blog日志。

Boxshade在线网址:http://www.ch.embnet.org/software/BOX_form.html ESPript在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

2)转换ALN文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在PHYLIP分析前需要将ALN格式转换为PHY格式方可...

注意事项:

1)dnd是向导树文件,可以用TreeViews软件查看树图。注意:向导树不是系统发育树,两者区别敬请关注近期-系统发育分析专题。

2)多重比对文件推荐要求为规范的FASTA格式,文件扩展名不限,格式大致如下: 引用:

>RGDV_BAA02676

MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN

>RGDV_ABC75537

MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN

>RGDV_AAO64253

MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN

>RGDV_AAY14576

常见问题:

正在整理中,欢迎大家将使用过程存在的问题在此提出,以便于解答...

Clustalx 多重序列比对图解教程(By Raindy)

本帖首发于Raindy'blog,转载请保留作者信息,谢谢!欢迎有写生物学软件专长的战友,加入生信教程写作群:13559330,接头暗号:你所擅长的生物学软件名称

软件简介:

CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。

序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。

主要功能:

你可以剪切、粘贴序列以更改比对的顺序;

你可以选择序列子集进行比对;

你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;

可执行比对质量分析,低分值片段或异常残基将以高亮显示。

当前版本:1.83

PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的Clustalx 1.81版 链接地址:http://www.hanzify.org/index.php?Go=Show:ist&ID=7435 (请完整复制)

应用:Clustalx比对结果是构建系统发育树的前提

实例:植物呼肠孤病毒属外层衣壳蛋白P8(AA序列)为例

流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果

1.载入序列:运行ClustalX,主界面窗 口如下所图(图1),依次在程序上方的菜单栏选择“File”-“Load Sequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replace existing sequences),根据具体情形选择操作。

图1

图2

2.编辑序列: 对标尺(Ruler)上方的序列进行编辑操作,主要有Cut

sequences(剪切序列)、Paste sequences(粘贴)、Select All sequences(选定所有序列),Clear sequence Selection(清除序列选定)、Search for string(搜索字串)、Remove All gaps(移除序列空位)、Remove Gap-Only Columns(仅移除选定序列的空位)

图3

3.参数设置: 可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参数主要有六个,分别是Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数),Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数),Secondary structure Parameters(二级结构参数),如图4所示:

图4

修改参数只需点击相应标签,示例比对的是多序列比对,故可选择“Multiple Alignment Parameters”弹出参数设置窗口,如图5所示:

图5

4.完全比对: 返回菜单栏选择“Complete Alignment”标签,此时会弹出输出文件路径的设置窗口,设置Guide Tree File(向导树或指导树文件)、Alignment File(比对文件)的保存位置(存放路径),点击“Align”按钮程序自动开始序列的完全比对,比对所需时间因序列文件大小和长度、计算机性能而异, 如图6-8所示:

图6

图7

图8

当主界面的左下状态栏会提示“CLUSTAL-Alignment File created []”时说明比全完毕,这时文件保存位置的目录下会生成生成两个文件,分别是*.aln和*.dnd,aln是序列比对的文件,可以进一步用于构树系统发 育树,dnd是向导树文件(指导树),这两个文件可以用Windows系统中的“记事本”或第三方程序“UltraEdit”等打开,如:

图9 ALN文件

图10 dnd文件

5.后续分析:

1)Clustalx比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如Boxshade、ESPript,这两个工具都是在线进行,其中Boxshade图解教程详见本Blog日志。

Boxshade在线网址:http://www.ch.embnet.org/software/BOX_form.html ESPript在线网址:http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi

2)转换ALN文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在PHYLIP分析前需要将ALN格式转换为PHY格式方可...

注意事项:

1)dnd是向导树文件,可以用TreeViews软件查看树图。注意:向导树不是系统发育树,两者区别敬请关注近期-系统发育分析专题。

2)多重比对文件推荐要求为规范的FASTA格式,文件扩展名不限,格式大致如下: 引用:

>RGDV_BAA02676

MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN

>RGDV_ABC75537

MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN

>RGDV_AAO64253

MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN

>RGDV_AAY14576

常见问题:

正在整理中,欢迎大家将使用过程存在的问题在此提出,以便于解答...


相关内容

  • 多重序列比对及系统发生树的构建
  • 多重序列比对及系统发生树的构建 来源:生物谷 2010-1-8 访问量:6568 评论(0) 分享0 [实验目的] 1.熟悉构建分子系统发生树的基本过程,获得使用不同建树方法.建树材料和建树参数对建树结果影响的正确认识: 2.掌握使用Clustalx 进行序列多重比对的操作方法: 3.掌握使用Phy ...

  • 进化树分析步骤
  • 进化树分析步骤 一.用CLUSTALX (1.83)排列序列(alignment ) 方法: 1.打开记事本,以FASTA 格式粘贴序列到记事本,所有要比对的序列都这么粘贴,格式如下: >aa (序列名称) aaagggtttttcccc (序列) >bb aaagggtttttcccc ...

  • 生物信息学试卷
  • 1.以下关于DNA测序的说法中不正确的是(B) A.chain terminction sequencing(链终止测序?) B.弗朗西斯方法(PPT1 47) C.双脱氧核酸测定 D.Sanger方法(PPT1 10) 2.蛋白质结构分析方法包括(ABC) A.X衍射晶体学 B,核磁共振普 C.电 ...

  • 生物信息学作业
  • CDK2基因和蛋白质序列的生物信息学分析 姓名: 学号: 专业: 1前言 细胞周期蛋白依赖激酶2(cyclin-dependent kinase 2,CDK2) ,又名细胞分裂激酶2(cell division kinase 2)或p33蛋白激酶(p33 protein kinase),其基因定位于 ...

  • 蛋白质结构预测及方法介绍2
  • 随着蛋白质结构数据的积累,人们开始注意到一些较简单的序列与结构关系.可以利用各种氨基酸的疏水值定位蛋白质的疏水区域,通过疏水氨基酸出现的周期性预测蛋白质的二级结构.Lim等人很早就对α螺旋和β折叠归纳出了一套预测模式.例如α螺旋的轮状结构特征,轮的一侧通常处于蛋白质的疏水核心,另一侧则常处于亲水表面 ...

  • 细胞周期蛋白家族的生物信息学分析
  • 安徽农业科学.Journal ofAnhui Agri.Sci.2012,40(30):14668-14672责任编辑朱琼琼责任校对况玲玲 细胞周期蛋白家族的生物信息学分析 7)-晶,冯沛春,王万军+ (西南交通大学生命科学与工程学院,四川成都610031) 摘要[目的]对细胞周期蛋白家族的序列进行 ...

  • 生物信息学发展概况及研究进展
  • 生物信息学发展概况及研究进展 韩龙 生物化学与分子生物学 2010200531 1 概述 生物信息学是在生命科学.计算机科学和数学的 基础上逐步发展而形成的一门新兴的边缘学科,它 以核酸和蛋白质为主要研究对象,以数学.计算机科 学为主要研究手段,对生物学实验数据进行获取.加 工.存储.检索与分析,从 ...

  • 最新小汽车驾驶图解
  • 汽车驾驶图解教程!(套图收藏) 低速控制训练(多重起步法) 多重起步法:需要低于起步档(一般为1.2档)最低档速时,可以用"多重起步法"来控制行车速度,即可控操作性 强又安全实用:多重起步法的实际运用是非常重要,运用范围也非常广泛,如:繁华地带跟车.场地车辆移位.准确转弯找点.实 ...

  • 东方伊萨酵母菌.其组合物和应用的制作方法
  • 专利名称东方伊萨酵母菌.其组合物和应用的制作方法 东方伊萨酵母菌.其组合物和应用发明所属领域 本发明属于白酒酿造领域,具体地说,本发明涉及东方伊萨酵母菌.含该菌的酿酒 菌剂组合物,及该酵母菌和其组合物在白酒酿造中的应用 背景技术中国白酒香味物质种类繁多,包括醇.醛.酮.酸.酯.缩醛.芳香族化合物.含 ...