生物信息学软件-1
来源:互联网 发布:迅龙数据软件注册码 编辑:程序博客网 时间:2024/06/09 20:39
(一)分类
•单机分析软件,如:winplas
•在线分析软件, 如:webcutter
•生物学数据库,如:NCBI, DDBJ, EBI
(二)意义
1.分析和处理实验数据和公共数据,加快研究进度,缩短科研时间。
2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验。
3.用计算机管理实验数据。
(三)常用功能(核酸类)
DNA 序列片断拼接----Contig Express
DNA序列测定图谱分析
分析mRNA开放读框
限制性酶切位点分析
DNA 模拟电泳
PCR 引物设计
RNA二级结构分析
常用功能(蛋白质类)
蛋白质一级结构分析(氨基酸分析)
蛋白质二级结构分析(结构域分析)
蛋白质三级结构分析(空间结构分析)
常用功能(共同类)
DNA、蛋白质序列同源分析
进化树构建
常用功能(其它类)
质粒绘图类
图象处理软件
二、DNA 序列片断拼接(电子基因克隆)
•获得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻找同源序列,标准:长度≥100bp,同源性50%以上、85%以下。
•然后将检出序列组装为重叠群(contig),以此重叠群为被检序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重复以上过程,直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸,有时可获得全长的基因编码序列。
•再与GeneBank核酸数据库进行相似性检测,假如有精确匹配基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着与蛋白质序列数据库进行比较分析。
Vector NTI 5.2 中的contig Express
Contig Express软件:
Sequencer软件:
ftp://genecodes.com/pub/SequencherPC.zip
举例说明使用
三、DNA序列测定图谱分析
Chromas软件: http://www.technelysium.com.au/chromas230.exe
四、限制性核酸内切酶位点的分析
(一)定义:
限制性核酸内切酶(restriction endonuclease)
识别DNA的特异序列,并在识别位点或其周围切割双链DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸序列的DNA水解酶。
是细菌内存在的保护性酶。分为I、II、III三类。
其中的II类限制性核酸内切酶是重组DNA技术中的重要工具酶。
II类酶识别序列特点为回文结构,大多为 4~6 bp 回文结构(palindrome sequence),
如EcoRI 识别序列:
n5’GAATTC 3’ 5’GGATCC 3’
3’CTTAAG 5’ 3’CCTAGG 5’
限制性核酸内切酶命名
•Smith和Nathame命名原则(1973)
属名 + 种名 + 株名 + 流水
例如: 流感噬血杆菌d株
(Haemophilus influengae d)
Hind Ⅰ
Hind Ⅱ
Hind Ⅲ
Hind Ⅳ
常用的限制性核酸内切酶酶切序列
限制酶 识别序列及切口 限制酶 识别序列及切口
Alu Ⅰ AG/CT Hind Ⅲ A/AGCTT
TC/GA TTCGA/A
BamHⅠ G/GATCC SalⅠ G/TCGAC
CCGAG/G CAGCT/G
BglⅠ A/GATCT SmaⅠ CCC/GGG
TCTAG/A GGG/CCC
EcoRⅠ G/AATTC
CTTAA/G
CTTAA/G
(二)分析步骤:
利用Vector NTI软件:
http://register.informaxinc.com/solutions/
vectornti/molecular_viewer.html
该软件输入文件格式广泛,除了molecule documents (.gb) 是该公司本身文件格式外,还能识别各种数据库应用格式软件:EMBL,GenBank,FASTA,Sequence files. 可以查找特定序列,ORF(可以设置相关参数),描述载体、限制酶位点、一些功能序列和附注。整个界面由文本、图形和序列三部分构成,而且点击任意的序列、RE、基因,图形和序列均会自动标记到相应位置,非常直观方便。 载体可以圆形表示也可以线形表示。 还可进行核酸到蛋白的翻译等功能。
利用webcutter 2.0在线免费软件分析:
http://www.firstmarket.com/cutter/cut2.html
或:
http://www.ccsi.com/firstmarket/cutter
DNAStar、DNAClub、DNATool 等其他商业软件均能分析。
以DNAClub为例说明。
五、PCR 引物设计(包括杂交探针设计)
(一)引物设计的原则
1.引物要跟模板紧密结合;
2.引物与引物之间不能有稳定的二聚体或发夹结构存在;
3.引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。
(二)引物设计需要考虑的因素
?引物长度(primer length),
?产物长度(product length),
?序列Tm值 (melting temperature),
?ΔG值(internal stability),
?引物二聚体及发夹结构(duplex formation and hairpin),
?错误引发位点(false priming site),
?引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。
(三)引物设计要点
?一般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。
?引物3’端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。
?引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。
?引物所对应模板序列的Tm值最好在72℃左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。
?ΔG值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。
?一般情况下,在Oligo 5.0软件的ΔG值窗口中,引物的ΔG值最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。
?其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5’端与中间段的ΔG值应较高,而3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。
?可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。
?引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。
?对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。
(四)、引物设计软件的使用
?推荐使用自动搜索软件(商业软件): Primer Premier 5.0
?推荐使用引物评价软件(商业软件) : Oligo 6
其网址: http://www.oligo.net
?设计引物的免费在线软件Primer3,其网址:
http://www-genome.wi.mit.edu/cgi-bin/primer/primer3.cgi
或http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi
我的评价:
是非常优秀的设计引物的软件!
是真正的“免费的午餐”!
Winplas (商业软件)
pDRAW32软件(商业软件),其网址:
http://hjem.get2net.dk/acaclone,可以看到演示版和有关信息
Vector NTI (商业软件)
Plasmid processor
其免费下载的网址
http://www.hytti.uku.fi/%7Eoikari/plasmid.html
?DMUP beta
其免费下载的网址
http://biosoft.im.ac.cn/down/dmup.zip
Plasmid processor质粒作图软件是压缩软件,需要先将其解压到一个目录下(不需安装即可直接应
用),然后才能应用。(压缩文件是网络传输的最常用文件,目的是为了传输
方便);
1)在资源管理器中双击Plasmid.exe 文件(553kb),进入作图的界面;
2)点file-->new,在出来的对话框中填上Plasmid name和length,比如分别填
pBR322和4322(bp)(注意不能填4.322kb,否则软件不认识)。点击OK,进入
下一个界面,上面是一个圆,标着pBR322和4322bp。
3)点-->date-->restriction site加酶切位点,填酶的名称及定位;
4)点Date-->multiple-->Genes,填基因名称(如E6),位点在500至890处,
还是在此对话框中,选择右下角的style选所加基因的格式是箭头还是长的圆
弧等格式(根据喜好),选厚薄度(thichness),然后点击此对话框右上部分
的Add Gene,,在点击done,于是基因就加上了。基因和酶切位点可反复加多次。
5)但本软件缺陷之处上多克隆位点不能直接加,只能通过点-->date-->
restriction site加酶切位点,在此对话框中加多克隆酶切位点(如加HinIII,
EcoRI,BstI时,点-->date-->restriction site加酶切位点,出现对话框后,
HinIII,location比如填1,-->Add site; EcorI填3,-->Add site; Bst填5-->
Add site;然后点击OK.在圆上将位点1~5处用鼠标往旁边分别一拖,就可看见这三个位点了。
七、进化树分析软件
MEGA3.0:免费分子进化遗传分析软件
http://www.megasoftware.net
Vector NTI:商业软件
Vector NTI Suit 同源比较—主窗口
随着人类基因组计划的开展,争夺有限基因资源的竞争日益激烈,利用网上软件分析未知序列,迅速得到尽可能多的信息显得尤为重要。仅仅在几年前,网上只零散地分布着一些功能简单的小程序用于新基因的鉴别,现在这些软件有了长足的发展。
目前,在国际上,一些优秀的软件根据功能归类被集中在一个网页上,极大地方便了使用。 http://bioinformatics.weizamann.ac.il/gdp/gdp.html
在国内,很多生物信息学软件来源信息(包括不少免费下载的软件)都可以生物软件网上获得。
http://www.bio-soft.net
http://biosoft.im.ac.cn
- 生物信息学软件-1
- 生物信息学QuantumClone软件使用
- 生物信息学1
- 生物信息学软件和数据库使用方法
- 生物信息学
- 生物信息学之我见-(前言1)
- 生物信息学数据库大全
- 生物信息学(Bioinformatics)
- 生物信息学学习感悟
- 生物信息学---分子生物学基础
- biology_生物信息学常用工具
- 生物信息学相关网站
- 科普一点生物信息学
- 生物信息学之数据库
- 生物信息学学习感悟
- 生物信息学期刊
- 生物信息学数据库大全
- 生物信息学基础
- Interface+工厂方法设计模式
- 运行Eclipse plugin时java.lang.NoClassDefFoundError
- Linux查看目录信息命令
- Cairngorm
- HDOJ Robberies 01背包
- 生物信息学软件-1
- Struts2多个文件上传的分析及源代码说明
- 合并排序算法
- 堪比2012的六种美味毒药
- 安装dedeeims Deprecated: Function ereg_replace() is deprecated in
- MySQL建表出错
- linux下安装后缀为bin的Java JDK
- HDU--4018(Parsing URL)
- REST是什么