1. 首页
  2. 文档大全

第三章序列对比与数据库搜索(下)

上传者:9****8 2022-07-21 09:03:42上传 PPT文件 6.13MB
第三章序列对比与数据库搜索(下)_第1页 第三章序列对比与数据库搜索(下)_第2页 第三章序列对比与数据库搜索(下)_第3页

《第三章序列对比与数据库搜索(下)》由会员分享,可在线阅读,更多相关《第三章序列对比与数据库搜索(下)(43页珍藏版)》请在文档大全上搜索。

1、4 BLAST4 BLAST程序简介程序简介 BLAST是现在应用最广泛的序列相似性搜索工具是现在应用最广泛的序列相似性搜索工具,相比相比FASTA有更多改进有更多改进,速度更快。速度更快。 它建立在严格的统计学基础之上。它建立在严格的统计学基础之上。 http:/www.ncbi.nlm.nih.gov/blast/BlAST BlAST 工具主页面工具主页面4.1 BLAST搜索主界面 BLAST 2.2.12, BLAST 2.2.12, 具体功能包括具体功能包括: : (1)核酸数据库搜索:分为标准的核酸与核酸数核酸数据库搜索:分为标准的核酸与核酸数据库搜索据库搜索,MEGABLAST

2、提供大量长序列的比较提供大量长序列的比较,完全匹配的短序列的搜索。完全匹配的短序列的搜索。 (2)蛋白数据库搜索蛋白数据库搜索:分为标准的蛋白与蛋白数据分为标准的蛋白与蛋白数据库搜索;库搜索;PSI-and PHI-BLAST,其中其中PSI用于用于搜索证实远源进化关系是否存在,进一步获取搜索证实远源进化关系是否存在,进一步获取这个蛋白家族中的功能信息。而这个蛋白家族中的功能信息。而PHI用于搜索蛋用于搜索蛋白基序;同样包括蛋白的完全匹配的短序列搜白基序;同样包括蛋白的完全匹配的短序列搜索。索。 (3)已翻译蛋白的已翻译蛋白的BLAST搜索包括:搜索包括:blastx、tblastn,Ctbl

3、astx。 (4)保守区域的搜索:主要使用保守区域的搜索:主要使用RPS-BLAST。 (5)配对序列的两两比较:用于核酸和蛋白的配对序列的两两比较:用于核酸和蛋白的两两比较分析。两两比较分析。 (6)针对特定数据库的搜索:比如人类基因组、针对特定数据库的搜索:比如人类基因组、微生物基因组等。微生物基因组等。 (7)检索已提交的申请结果:主要用于申请比检索已提交的申请结果:主要用于申请比较的序列较长较的序列较长,等待时间长时等待时间长时,只需记住申请的只需记住申请的编号编号,在在ID框中输入即可框中输入即可,但结果只保留但结果只保留24h。4.2 BLAST 4.2 BLAST 程序及其数据库

4、名称和意义程序及其数据库名称和意义1) BLAST 1) BLAST 程序程序BLAST BLAST 蛋白质数据库蛋白质数据库BLAST BLAST 的核酸数据库的核酸数据库4.3 BLAST4.3 BLAST搜索格式搜索格式 BLASTBLAST搜索框中允许搜索框中允许3 3种输入格式种输入格式: : FASTA FASTA 格式格式 单纯序列输入格式单纯序列输入格式 标识符格式标识符格式FASTA格式格式 FASTAFASTA格式第格式第1 1行是描述行行是描述行, ,第第1 1个字符必须是个字符必须是字字符符; ;随后的行是序列本身随后的行是序列本身, ,一般每行序列不要超过一般每行序列

5、不要超过8080个字符个字符, ,各行之间不允许有空行各行之间不允许有空行, ,回车符不会影回车符不会影响程序对序列连续性。序列由标准的响程序对序列连续性。序列由标准的IUB/IUPACIUB/IUPAC氨基酸和核酸代码代表氨基酸和核酸代码代表; ;小写字符会全部转换成大小写字符会全部转换成大写写, ,序列可由基因库中调出序列可由基因库中调出, ,亦可输入。如亦可输入。如: : gi|129295|splP01013|OVAX-CHICK GENE X PROTEIN (OVALBUMIN-RE-LATED) QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTR- E

6、MPFHVTKQESKPVQMMCMNNSFNVATLPAEKMKILELPFASGDLSMLVLLPDEVSDLERIEIKTINFEIKLTEJTNPNTMEIKRRVIKVYLPQMIKIEEIKYNVLMALGMTDLFIPSANLIBSQAVEHfGAFMELSEDGIEMAGSTGVIEDIHIK核酸表示字符核酸表示字符: :符 号含 义说 明GGGuanine 鸟嘌呤AAAdenine 腺嘌呤TTThymine 胸腺嘧啶CCCytosine胞嘧啶UUUridine尿嘧啶RG or APurine 嘌呤YT or CPyrimidine 嘧啶MA or CAmino 氨基的KG o

7、r TKeto 酮基的SG or CStrong interaction (3H bonds) 强的WA or TWeak interaction (2 H bonds) 弱的HA or C or TNot-G非鸟嘌呤BG or T or Cnot-A非腺嘌呤VG or C or Anot-T(not-U) 非胸腺,尿嘧啶DG or A or Tnot-C 非胞嘧啶NG or A or T or CAny 任何BLASTPBLASTP、TBLASTNTBLASTN接受的氨基酸输入代码接受的氨基酸输入代码 A alanine (A alanine (丙氨酸丙氨酸) P proline() P p

8、roline(脯氨酸脯氨酸) ) B aspartate or asparagine (B aspartate or asparagine (天门冬氨酸天门冬氨酸) Q glutamine () Q glutamine (谷氨酰胺谷氨酰胺) ) C cystine(C cystine(胱氨酸胱氨酸) R arginine() R arginine(精氨酸精氨酸) ) D aspartate(D aspartate(天冬氨酸天冬氨酸) S serine() S serine(丝氨酸丝氨酸) ) E glutamate(E glutamate(谷氨酸盐谷氨酸盐) T threonine() T t

9、hreonine(苏氨酸苏氨酸) ) F phenylalanine(F phenylalanine(苯丙氨酸苯丙氨酸) U selenocysteine() U selenocysteine(晒代半胺氨酸晒代半胺氨酸) ) G glycine(G glycine(甘氨酸甘氨酸) V valine() V valine(缬氨酸缬氨酸) ) H histidine(H histidine(组氨酸组氨酸) ) W tryptophan(W tryptophan(色氨酸色氨酸 I isoleucine(I isoleucine(异亮氨酸异亮氨酸) ) Y tyrosine(Y tyrosine(酪氨

10、酸酪氨酸) ) K lysine (K lysine (赖氨酸赖氨酸) )Z glutamate or glutamineZ glutamate or glutamine L leucine (L leucine (亮氨酸亮氨酸) )X any(X any(任何一种氨基酸任何一种氨基酸) ) M methionine(M methionine(蛋氨酸蛋氨酸) )translation stop(translation stop(翻译终止符翻译终止符) ) N asparagine(N asparagine(天冬酰胺天冬酰胺) )-gap of indeterminate length-gap

11、of indeterminate length2.单纯序列数据输入格式单纯序列数据输入格式 该格式无该格式无FASTAFASTA描述定义行描述定义行, ,亦可是亦可是GenBank/GMPeptGenBank/GMPept中的单纯文本中的单纯文本格式。如:格式。如:QKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAEKMKEELPFASGDLSMLVLLPBEVSDLERIEKTIMEKLTEWTNPNTMEKRRVKVYLPQMIGEEKYNLTSVLMALGMTDLFIPSANLTGISSAESLKISQ


文档来源:https://www.renrendoc.com/paper/212714326.html

文档标签:

下载地址