列举常用的生物信息学数据库及序列对比常用软件及特点
一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。
一、步骤:打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。
二、结果:输出序列长度918bp,载体序列的区域456bp——854bp.克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。
一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。
得出序列是human的。
进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择 Annotation File :RM2sequpload_1287631711.out.html3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。
一、步骤:进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!二、结果:CpG岛的长度:385bp 区域:48——432;GC数量:Sum C+G=297,百分数=77.14 Obs/Exp:1.014、预测下面序列的启动子,输出可能的启动子序列及相应的位置。
一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。
得出序列是human的 进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!二、结果:位置:711—761 ,1388—1438,1755—1805;5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。
一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。
得出序列是human的 进入google首页,搜索Splice Site Prediction,进入主页,复制序列。
Organism选择Human or other。
其他默认,运行!二、结果:供体:受体:6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。
一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST。
得出序列是Zea的 进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。
复制序列,默认,运行!二、结果:ORF图 三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!四、结果:G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。
一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!在MboI中选择第一个,EcoI选择第二个。
二、结果:ENSCAN图8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。
请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。
一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。
二、结果:GC含量:引物的位点:Tm值:产物长度:。
9、将下面的序列用NEBcutter 2.0工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求1.4% agarose和Marker为100bp DNA Ladder。
一、步骤:进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。
进入google首页,搜索NEBcutter 2.0,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。
View gel。
选择1.4% agarose和Marker为100bp。
二、结果:然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物 NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库 数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN) 蛋白质序列与数据库中蛋白质序列比较(BLASTP) 两序列比对(Align two sequences) DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html) 分析实验序列外显子部分——GENSCAN(http://genes.mit.edu/GENSCAN.html) 分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php) 注: Custom digest -- view gel 限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html) 设计引物扩增实验序列——Genefisher Primer 3 蛋白质序列分析及结构预测: 1.预测蛋白质的分子量及等电...
本地blast序列比对结果怎么看
.打开BLAST 页面,http://www.ncbi.nlm.nih.gov/BLAST/ 打开后如图所示:对上面这个页面进行一下必要的介绍:BLAST 的这个页面主体部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。
相信大家可以看懂这三个短语的意思,我就不多说了;我要说 的是,可以认为这是三种序列比对的方法,或者说是BLAST 的三条途径。
第一部分BLAST Assembled Genomes 就是让你选择你要比对的物种,点击相应物种之后即可进入比对页面。
第二部分Basic BLAST 包含了5 个常用的BLAST,每一个都附有简短的介绍。
第三部分Specialized BLAST 是一些特殊目的的BLAST,如IgBLAST、SNP 等等,这个时候你就需要在Specialized BLAST 部分做出适当的选择了。
总之,这是一个导航页面,它的目的是让你根据自己的比对目的选择相应的BLAST 途径。
下面以最基本的核酸序列比对来谈一下BLAST 的使用,期间我也会含沙射影的说一下其 他序列比对的方法。
2. 点击Basic BLAST 部分的nucleotide blast 链接到一个新的页面。
打开后如图所示: 介绍一下上述页面:Enter Query Sequence 部分是让我们输入序列的,你可以直接把序列粘贴进去,也可以上传序列,还可以选择你要比对的序列的范围(留空就代表要比对你要输入的整个序列)。
Job Title 部分还可以为本次工作命一个名字。
Choose Search Set 部分是让我们选择要与目的序列比对的物种或序列种类(genome DNA、mRNA 等等)。
如果是人或老鼠的话,就可以直接选择了如果是其他物种就要选择 “others”了,这时候网页会主动跳出一个下拉对话框和一个输入式对话框,你可以分别选 介绍一下上述页面:Enter Query Sequence 部分是让我们输入序列的,你可以直接把序列粘贴进去,也可 以上传序列,还可以选择你要比对的序列的范围(留空就代表要比对你要输入的整个序列)。
Job Title 部分还可以为本次工作命一个名字。
Choose Search Set 部分是让我们选择要与目的序列比对的物种或序列种类(genomeDNA、mRNA 等等)。
如果是人或老鼠的话,就可以直接选择了如果是其他物种就要选择 “others”了,这时候网页会主动跳出一个下拉对话框和一个输入式对话框,你可以分别选择和输入要跟你的序列比对的序列种类和物种。
下面的Entrez Query 可以对比对结果进行适当的限制。
Program Selection 部分其实是让我们选择本次比对的精确度,种内种间等等。
在BLAST 按钮下面有一个“Algorithm parameters” ,这是参数设置选项,一般用户 使用不到此项,所以它比较隐蔽,点击,原网页下方即可增加了Algorithm parameters 的 内容。
大部分战友都用不到更改这里面的选项,我也不多说了,有兴趣的朋友可以自己研究 一下。
3.依次填写上述网页必须部分,点击BLAST 按钮后,出现如下界面(只截取其中一部分): 出现的这个结果页面信息含量非常大,如果我们用心观察,还是可以发现其中的一些主要指标的。
列举上图也是为了给大家展示一下这些评价标准。
其中Description 部分推荐大 家详细看一下,另外说一下“E value” 这个指标与其他指标不同,它的数值越小相似程度越高,其他几个(如Totle score)都是数值越高相似度越高。
在这个图示的表格下方就是具体的相似性的核酸序列了,还配合着各种参数的得分。
NCBI上怎么用BLAST对比序列
BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。
BLAST程序能迅速与公开数据库进行相似性序列比较。
BLAST结果中的得分是对一种对相似性的统计说明。
在NCBI上分为多种,常用的有N-BLAST(核苷酸序列比对检索)和P-BLAST(蛋白比对检索)。
此外还有primer Blast等。
BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。
BLAST还能发现具有缺口的能比对上的序列。
BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。
所查询的序列和调用的数据库则可 以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。
序列比对可以揭示哪些序列特征,可开展哪些方面的分析。
序列比对通过比较生物分子序列,发现它们的相似性,找出序列之间共同的区域,同时辨别序列之间的差异,从而揭示生物序列的功能、结构和进化的信息。
最常见的比对是蛋白质序列之间或核酸序列之间的两两比对,通过比较两条序列之间的相似区域和保守性位点,寻找二者可能的分子进化关系。
还可以对多条蛋白质或核酸序列同时进行比较,寻找这些有进化关系的序列之间共同的保守区域、位点和概型,从而探索导致它们产生共同功能的序列模式。
此外,还可以通过比较蛋白质序列和核酸序列相比来探索核酸序列可能的表达框架;把蛋白质序列与已知三维结构信息的蛋白质相比,从而获得蛋白质折叠类型的信息。
氨基酸序列对比的问题
这个图案是用DNAman,是美国LynnonBiosoft公司开发的高度集成化的分子生物学应用软件,几乎可完成所有日常核酸和蛋白质序列分析工作,包换多重序列对齐、PCR引物设计、限制性酶切分析、蛋白质分析、质粒绘图等。
你下一个绿化版的软件,对了都是英文的,你根据软件的指引操作就行了,很简单的。
生物信息学常用的软件有哪些?
NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN)蛋白质序列与数据库中蛋白质序列比较(BLASTP)两序列比对(Align two sequences)DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)分析实验序列外显子部分——GENSCAN(http://genes.mit.edu/GENSCAN.html)分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php) 注: Custom digest -- view gel限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)设计引物扩增实验序列——Genefisher Primer 3蛋白质序列分析及结构预测:1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw)2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam)3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale)4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) [* :kinase K]5.分析蛋白质的信号肽:ExPASy(SignalP)6.预测蛋白质的二级结构:ExPASy(Jpred 3)多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W人脂联素蛋白质序列:NP_004788人类胰岛素生长因子IB前体:P05019
blast序列比对怎么条参数,总出现No significant similarity found?
翻译后用你的序列比对,这是一个很明显的核糖体小亚基组成蛋白S3 我估计你用核酸序列比对时候,在Database的选择上出的问题。
那里有三个选项,Human genomic+transcript、Mouse genomic + transcript、Others (nr etc.);默认是第一个,也就是跟人类基因组比较。
如果你的基因不是来源于人类的,应该选第三个 实际上,你选第三个之后,用核酸序列比对也有匹配的了,但不如蛋白序列匹配的多。