基因表达/芯片分析的工具

53次阅读
没有评论

共计 15613 个字符,预计需要花费 40 分钟才能阅读完成。

用于基因表达 / 芯片分析的工具

** Avadis – gene expression analysis with GO browser (商业软件) [http://avadis.strandgenomics.com/]
Avadis 是基因表达数据的数据分析和可视化工具,内置一个显示 GO 等层的浏览器,许多基因有共同的本体途径(common ontology paths),对基因表达聚类可以通过 GO 语义进行聚类以识别功能标识(functional signatures)

** BiNGO [http://www.psb.ugent.be/cbd/papers/BiNGO/]
开源的 java 工具,在一个基因集合里确定那个 GO 类别是统计上过表达 (over-represented) 的。BinGO 以 Cytoscape 的插件实现,Cytoscape 是分子相互作用网络数据整合和可视化的软件平台。BinGO 映射给定基因集的主要功能主题到 GO 等级上,并输出这一映射为 Cytoscape 图。

** CLENCH:CLuster ENriCHment [http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/]
CLENCH 允许拟南芥 (A. Thaliana) 研究者从 TAIR 上执行自动的 GO 注释检索并计算给定的基因集 (相对于参考集) 的 GO 术语富集。在计算富集之前,CLENCH 允许把返回的注释映射到 GO slim 术语表 (能够被用户编辑) 和本地安装的 GO 上的任何粗糙水平,

** DAVID atabase for Annotation, Visualization and Integrated Discovery [http://david.abcc.ncifcrf.gov/]
基于 web 的工具,提供由高通量技术产生的基因组水平数据集 (诸如表达谱和蛋白组平台) 的注释和分析的整合解决方案。分析结果和图形显示保留动态链接到主要的数据库和外部数据仓库,从深度和广度上覆盖数据。DAVID 为数据收集到生物意义的转变提供便利,加速了基因组水平数据的分析。

** EASE [http://david.niaid.nih.gov/david/ease.htm]
EASE 对于一个给定的基因列表概述主要的生物学主题。给定的基因列表来自于表达谱或其它的基因组水平实验,EASE 能够快速计算相对于数据集里所有基因每一个统计上可能的过表达 GO 术语。

** eGOn v2.0:explore Gene Ontology [http://www.genetools.no/]
基于 web 的工具,映射表达谱数据到 GO 结构上。多个的输入文件能够同时分析以比较两个或多个实验的注释基因的分布。
eGOn V2.0 的核心特性:
. 可视化:基因注释以 GO DAG 可视化显示或以表格的形式显示,GO DAG 的尺寸能够由用户自由定义。
. 过滤:GO 注释能够基于 evidence codes 进行过滤。
. 包含用户定义的 GO 注释:事先加入到 NMC 注释数据库中。
. 统计分析:多个基因列表能够同时分析以比较 GO 等级上注释基因的分布,统计测验设计成允许用户在两个基因列表之内或之间计算 GO 注释的不同(dissimilarities)。
. 连接注释数据库:连接到 NMC 注释数据库,基因和蛋白的信息直接由 GO DAG 或导出的数据提供。
. 导出:GO DAG 信息、统计结果、基因和蛋白信息能够导出为 Excel、text、XML 格式。

** ermineJ [http://bioinformatics.ubc.ca/ermineJ]
分析表达数据中的基因集 (用户定义或通过 GO 术语定义) 的工具。这个软件设计为给只有很少或没有信息学背景的生物学家使用。为想使用 ermineJ 脚本的用户提供一个命令行接口。实现了多个不同的对基因集的打分方法,不是简单地集中于依赖过分表达 (over-representaion) 方法上。

** FatiGO [http://www.fatigo.org/]
FatiGO 对给定的基因集,以代表性的功能信息 (低表达或过表达 GO 术语) 对其赋值。通过多重检验纠正 (multiple-testing correction) 得到统计显著性。FatiGO 被设计成在 DNA 芯片数据分析的上下文里进行功能注释,FatiGO 链接到基因表达模式分析套件 (Gene Expression Pattern Analysis Suite) 里。FatiGO 使用主要的基因组和蛋白组数据库 (GeneBank, UniProt, Unigene, Ensembl,etc) 的基因 IDs。FatiGO 适用于任何类型的大规模实验进行功能注释。

** FIVA:Functional Information Viewer and Analyzer [http://bioinformatics.biol.rug.nl/standalone/fiva/]
FIVA 协助原核生物社区的研究者进行转录组分析时快速识别相关生物过程。此软件分析大量基因的功能谱并对影响的生物过程产生一个综合的概述

** FuncAssociate [http://llama.med.harvard.edu/cgi/func/funcassociate]
FuncAssociate 是一个基于 web 的工具,接受一个基因列表作为输入,并返回输入列表中过表达或低表达 (over- or under-represented) 的 GO 属性。经过多重假设检验后只有那些统计上具有显著性的过表达或低表达的属性才会被报道。目前有 10 个物种被支持。除了输入基因列表外,用户还可以指定 a)这一列表是否被认为是排序还是乱序的。b)FuncAssociate 所认为的总基因 (the universe of genes)。c) 单独报道过表达或低表达的属性,还是两者都报道。d)p-value cutoff 值。
新版的 FuncAssociate(还处于测试阶段)支持更广泛的基因命名方案,并使用更为频繁更新的 GO 相关文件(GO associations),然而原来版本的一些特性诸如按 LOD 排序或查看基因属性表格的选项还没有实现。

** FuncExpression [http://www.barleybase.org/funcexpression.php]
FuncExpression 是一个基于 web 的资源,对大规模的基因组数据进行功能解析。FuncExpression 能对植物、动物和真菌的基因列表 (从基因组和蛋白组实验中产生) 进行功能比较。多个的基因列表能够被分类、比较和可视化显示。FuncExpression 支持双通道整合 (two way-integration) 植物功能信息和基因表达数据,这使得后续的交叉验证 (cross-validation) 成为可能,交叉验证使用 BarleyBase 相关实验获得的植物芯片数据。

** FunCluster:FunCluster, Functinal Profiling of Microarray Expression Data [http://corneliu.henegar.info/FunCluster.htm]
FunCluster 是一个基因组数据分析工具,设计成对 cDNA 芯片实验产生的基因表达数据进行功能分析。除了自动对基因表达数据进行功能注释外,FunCluster 通过特定设计的共棸类对涉及到的生物注释和基因表达数据进行功能分析,能够检测出共调控的生物过程 (注释基因组主题所展示)。FuncCluster 的功能分析依赖于 GO 和 KEGG 注释,并且只支持三个物种:人(Homo sapiens)、小鼠(Mus musculu) 和酿酒酵母(Saccharomyces cerevisiae)。

** FunNet:Functional Analysis of Transcriptional Networks [http://www.funnet.info/]
FunNet 设计为一个分析基因共表达网络 (由芯片表达数据所构建) 的整合工具,此工具的分析模块的实现涉及到两个抽像层:转录 (如基因表达谱) 和功能 (如转录分析所显现的生物学主题)。依赖于 GO 和 KEGG 注释的功能分析技术,应用于从基因芯片表达数据中抽提一系列相关生物学主题。多重情况表达(multiple-instance representations) 用来关联注释转录本和相关的生物学主题。一个原创 (original) 的非线性动态模型被用来量化相关基因组主题 (genomic themes) 上下文的接近度,这一量化基于在基因共表达网络 (如在注释主题中捕获转录本的相似的表达谱) 中基因组主题的增殖模型 (patterns of propagation)。最后,一个非监督的多重情况光谱聚类过程(an unsupervised multiple-instance spectral clustering procedure) 被用来探索共表达网络的模块结构,这是通过聚集共表达网络所显示出来的显著性相互关系的生物主题来实现的。提供了共表达网络的功能、转录表达、相关的转录和基因组主题的上下文详细信息。
FunNet 提供了基于 web 的工具以及作为一个标准的 R 包。标准 R 实现能够运行在任何能运行 R 环境的操作系统 (windows, Mac OS,  各种 Linxu 和 Unix) 上,能够从 FunNet 网站或者从 CRAN 的镜像站上下载到。两种实现的 FunNet 都是使用 GPL2.0 发布的。

** G-SESAME [http://bioinformatics.clemson.edu/G-SESAME/]
G-SESAME 包含了一系列工具,分别是:
1. 衡量 GO 术语语义相似性的工具。
2. 衡量基因功能相似性的工具。
3. 基于 GO 术语注释信息聚类基因的工具。

** GARBAN [http://www.garban.org/garban/home.php]
GARBAN 是对 cDNA 芯片和蛋白质组技术产生的数据进行分析和快速功能注释的工具,GARBAN 实现为生物信息学工具,以快速比较、分类和图形展示各种数据集 (genes/ESTs 或 proteins),目的在于为病理和药学研究中识别分子标记(molecular markers) 提供便利。GARBAN 链接到主要的基因组和蛋白质组数据库 (Ensembl, GeneBank, UniProt Knowledgebase, InterPro,etc.) 并遵循 GO 委员会的标准进行语义分类。代码是共享的: e-mail [email protected]

** GENECODIS [http://genecodis.dacya.ucm.es/]
GENECODIS 是一个基于 web 的对基因列表进行功能分析的工具,它整合了不同的信息资源来搜索最频繁的共存在基因集的注释,并通过统计显著性排列它们。注释分析来自于不同的数据库如 GO,KEGG 或 SwissProt。

** GeneMerge [http://www.oeb.harvard.edu/hartl … erge/GeneMerge.html]
GeneMerge 对于一个给定的基因集返回功能基因组信息,并提供此基因集里过表达的特定功能或分类的统计秩值(statistical rank scores)。展示了所有的 GO 类别和功能基因组数据。

** GFINDer: Genome Function INtegrated Discoverer [http://www.medinfopoli.polimi.it/GFINDer/]
GFINDer 是一个多重数据库系统 (multi-database system) 提供了大规模的用户分类的序列标识列表和基因组生物学信息以及列表中不同基因类别的特征生物学功能谱。GFINDer 自动从不同的资源检索更新功能分类的注释信息,识别用户分类的基因列表中每个分类的富集类别。并计算每一个类别的统计显著性。而且,GFINDer 能够根据挖掘的功能类别对基因进行功能分类并且对这些分类进行统计分析,使得能够更好地解释芯片实验结果。

** GOALIE: Generalized Ontological Algorithmic Logical Invariants Extractor [http://bioinformatics.nyu.edu/Projects/GOALIE/]
GOALIE 是用来构建时间序列依赖富集的工具,需要 ODBC 连接到 GO 数据库。

** GOArray [http://ycmi.med.yale.edu/gomine]
GOArray 是一个 Perl 程序,输入一系列基因注释为“感兴趣 (of interest)”(GOI) 或者不感兴趣,并确定相关的 GO 术语对于 GOI 是否过表达。一个置换检验 (permutation test) 是可选的,用来评估结果的可靠性。输出包括了多个可视化图和补充信息以及进一步的参考,还有对所使用的统计方法的概述。

** GOdist [http://basalganglia.huji.ac.il/links.htm]
GOdist 是一个 Matlab 程序,用于分析 Affymetrix 芯片表达数据,实现了 Kolmogorov-Smirnov(KS)连续统计方法。还引入一个两侧超几何分布 (two-tailed hypergeometric distribution) 使用 Fisher exact 检验实现了离散方法。GOdist 能够检测出芯片基因相关的 GO 术语相对于不同总体的差别,总体可是是全局芯片总体、分析的 GO 术语的直接父节点或全局父节点。

** GOHyperGAll [http://faculty.ucr.edu/~tgirke/D … oCondManual.html#go]
检验样本总体基因得到过表达的 GO 术语,R/BioC 函数 GOHyperGAll 对所有的 GO 节点进行超几何分布检验计算并返回相应的 P 值,后续的过滤函数使用默认的或自定义的 GO Slim 类别执行 GO Slim 分析,使用此工具必须有基本的 R 和 BioConductor 知识。

** GoMiner and MatchMiner [http://discover.nci.nih.gov/gominer/htgm.jsp]
High-Throughput GoMiner 是一个工业级别的整合 GO 工具,用于解析多芯片实验。GOMiner 是基于 Java 的程序包,对感兴趣的基因 (如芯片实验里上调或下调基因) 在 GO 的上下文里进行生物学解析。GoMiner 提供定量和统计的输出文件和两个有用的可视化文件:(i)树状结构类似于 AmiGO 浏览器里所显示的 (ii) 一个压缩的,动态交互的 DAG。GoMiner 所展示的基因链接到主要的公开生物信息学资源。一个陪伴工具(companion)MatchMiner 用于做前处理,为 GoMiner 或其它的 GO 工具的输入获取基因名称,提供了一个自动化脚本以便于安装本地化的数据库。

** GOstat [http://gostat.wehi.edu.au/]
GOstat 是一个易于使用的 web 工具,用于确定基因列表中过表达或低表达的 GO 类别的统计显著性。数据每月更新。

** GoSurfer [http://biosun1.harvard.edu/complab/gosurfer/]
GoSurfer 在分析基因集 (来自于基因组范围的计算、芯片分析或其它相应的高端方法) 时使用 GO 信息,GoSurfer 包含了严格的统计检验,交互的图形和自动更新注释信息 (基因标识符(UniGene,LocusLink) 或 Affymetrix 探针集)。

** GO Term Finder [http://search.cpan.org/dist/GO-TermFinder/]
GO Term Finder 对给定基因列表的基因产物的 GO 术语或其父节点作显著性的分析。Saccharomyces Genome Database  实现了一个基于 web 的 GO Term Finder 用于为出芽酵母基因产物搜索注释。一个通用的 GO Term Finder 由 Standford Microarray Database 创建,可以从 CPAN 下载到。这个代码被普林斯顿基因组研究组 (Princeton genomics group) 用于创建基于 web 的通用 GO Term Finder,通过该 web 工具提供了分析 GO 站点上所公开的有 GO 注释的任何种属 (包括人) 的基因。

** GOTM:Gene Ontology Tree Machine [http://bioinfo.vanderbilt.edu/gotm/]
GOTM 是一个基于 web 的工具,基于 GO 等级结构分析和显示感兴趣的基因集。这个工具提供了用户友好的数据导航和可视化。产生可扩展的树用于浏览 GO 等级结构,以 HTML 的形式生成固定的树用于对不同注释水平进行归档并生成柱状图,GOTM 提供统计分析以显示 GO 类别和相对富集的基因数目以及暗示 (suggest) 了进一步研究的生物领域。富集的 GO 类别能够以子树或 DAGs 的形式展示。基因的子集能够检索 GO 术语或进行关键字搜索。每一个基因的细节信息能够直接从 GeneKeyDB 里检索到。

** GOToolBox [http://gin.univ-mrs.fr/GOToolBox/]
GOToolBox 是一系列基于 web 的程序,允许从一个基因集 (相对于被检索的参考基因集) 识别统计上过表达或低表达的术语、基因集里对功能相关的基因进行聚类和检索基因集里共享的注释。GO 注释能够限制在 GO slim 等级上或者是给定的 GO 术语水平上,而且术语可以使用 evidence codes 进行过滤。GO 和基因关联文件每月更新。

** L2L [http://depts.washington.edu/l2l/]
L2L 是一个简单但功能强大的工具,用于发现芯片数据中隐藏的生物学显著性,通过易于使用的 web 界面,L2L 挖掘 GO 术语显著富集的上调或下调的基因,L2L 还将基因列表与数据库中上以千计的芯片实验作比较,以识别共有的基因调控模式。此工具可以下载到一个命令行的版本,可以自定义运行或者批量分析。

** Machaon Clustering and Validation Environment [https://www.cs.tcd.ie/Nadia.Bolshakova/Machaon.html]
Machaon Clustering and Validation Environment 是一个聚类验证的工具,将样本或基因按相似的基因表达模式进行分类并评估聚类的质量。在基因表达数据分析中 GO 术语用于衡量基因间的相似性 (生物学距离) 以支持生物医学知识发现(biomedical knowledge discovery)。

** MAPPFinder [http://www.genmapp.org/MAPPFinder.html]
MAPPFinder 是 GenMAPP 的辅助程序。这个程序允许用户检索任何存在的,相对于 GO 基因相关和 GenMAPP 芯片通路谱 (MAPPs, microarray pathway profiles) 的表达谱数据标准。分析产生的结果能够通过选择感兴趣的术语或 MAPPs 直接以 GO 等级或在 GenMAPP 中展示出来。

** Onto-Compare [http://vortex.cs.wayne.edu/projects.htm#Onto-Compare]
Onto-Compare 是一个基于 web 的工具,可以基于 GO 对商业芯片进行比较。Onto-Compare 允许用户对每一个芯片做功能偏好性评估并确定对于某个特定生物学现象 (由 GO 术语描述) 最好的芯片。

** Onto-Design [http://vortex.cs.wayne.edu/projects.htm#Onto-Design]
Onto-Design 允许用户设计定制芯片,通过选择一系列 UniGene cluster IDs,这些 IDs 代表了一个给定的生物过程子集(使用 GO 术语描述)。

** Onto-Express [http://vortex.cs.wayne.edu/projects.htm#Onto-Express]
Onto-Express 搜索公共数据库并返回一系列表格,包换相关表达谱、基因细胞发生定位(cytogenetic gene locations)、生物医学和分子功能、生物过程、细胞组分和翻译的蛋白的细胞功能。

** Onto-Miner [http://vortex.cs.wayne.edu/projects.htm#Onto-Miner]
Onto-Miner 允许用户通过 clone ID, UniGene gene symbol, LocusLink ID, accession number 等搜索不同的公开生物信息学数据库,允许使用基因列表进行批量检索。第三方开发者可以把这个站点作为资源,提供对于任意的基因列表的详细基因信息。

?? * Onto-Translate [http://vortex.cs.wayne.edu/projects.htm#Onto-Translate]
Onto-Translate 是基于 web 的工具,允许用户对下列 ID 进行快速转换:accessions IDs, Unigene cluster IDs  和 Affymetrix probe IDs。Onto-Translate 使用不同的数据库并降低任意基因列表的冗余,帮助识别相同的信息。

** OntoGate [http://functionalgenomics.de/ontogate/]
OntoGate 提供使用 GO 术语和与 GO 术语相关的外部数据库进入 GenomeMatrix(GM)的入口,以找寻 GM 中不同物种的基因,这些基因能到映射到 GO 术语上。OntoGate 包含了对相应注释基因的氨基酸序列进行 BLAST 搜索。

** Ontologizer [http://www.charite.de/ch/medgen/ontologizer/]
Ontologizer 能够对一组或多组基因或基因产物产生相应的 GO 注释,并根据每一个聚类的使用频率进行排列,以 HTML 或 XML 格式显示。如果提供了总体的数据集,程序会对每一个 GO 术语执行过表达的统计分析。产生“Dot”(GraphViz)文件对过表达的 GO 术语提供图形化概述。提供了每一个基因的详细列表。

** Ontology Traverser [http://franklin.imgen.bcm.tmc.ed … e=OntologyTraverser]
Ontology Traverser 是芯片基因列表富集工具,此工具为一些 cDNA 芯片和相对于芯片类型所使用的所有探针 / 克隆集列表提供了简单的上传格式,接收 AffyIDs 和 NIAIDs。支持许多报告格式:flat html,flat tsv, xml 和展示 GO 结构的动态可点击 HTML。对每一个 GO 节点报告不同的统计 / 结果: 列表 fq,  芯片 fq, fold change,? Fisher’s exact test P 值和基因的映射到的节点或子节点的标识。

** Probe Explorer [http://probeexplorer.cicancer.org/]
Probe Explorer 是一个开放使用的基于 web 的生物信息学程序,显示芯片寡核苷酸探针和在基因组上下文中的转录本的关联,此软件很灵活,可以简单地作为基因组和转录组的浏览器。提供了 15 种后生动物 (metazoa) 和两种酵母提供基因组实体 (genomic entities)(位点,  外显子,  转录本) 的序列和对等物包括矢量图输出。序列比对工具用来建立 Affymetrix 芯片探针序列和转录组 (人,小鼠,大鼠和酵母) 之间的关联。提供使用任何的 DNA 或蛋白序列进行关键字搜索、用户搜索和在基因组上进行比对。

** ProfCom: ProfCom, Profiling of Complex Functionality [http://webclu.bio.wzw.tum.de/profcom/]
ProfCom 是基于 web 的工具,用于对实验相关的基因列表进行功能解释。使得 ProfCom 成为独特工具的一个特征是除了 GO 术语外还可以使用复杂函数 (complex function) 进行富集分析。复杂函数由可用的 GO 术语的布尔组合构建。ProfCom 对复杂函数作推断能够更加特异地比较单个的术语并更为准确地描述基因的功能。

** SeqExpress [http://www.seqexpress.com/]
SeqExpress 是一个综合的分析和可视化软件包,用于基因表达实验。组合了特定开发的技术和通用的统计学方法,GO 被用来对聚类的功能富集进行打分。这些结果能够在内嵌的浏览工具或通过通过网页进行浏览。SeqExpress 还支持许多数据转换,投影(projection),可视化显示,文件输入 / 输出,搜索,与 R 整合,和聚类等选项。

** SerbGO [http://estbioinfo.stat.ub.es/apli/serbgo/]
SerbGO 是基于 web 的工具,帮助研究者确定那一个基因芯片分析工具、GO 语义分析工具适合他们的项目。SerbGO 是一个双向 (bidirectional) 程序。用户能通过检索表单索要感兴趣的工具的特性,用户还能比较每一个工具所实现的特性。

** SOURCE [http://source.stanford.edu/]
SOURCE 编辑来自多个公开访问的数据库 (包括 UniGene, dbEST, UniProt Knowledgebase, GeneMap99, RHdb, GeneCards 和 LocusLink) 的信息,SOURCE 使用的 GO 术语与 LocusLink 相关。

** Spotfire Gene Ontology Advantage Application (商业软件) [http://www.spotfire.com/services/advantage.asp]
Spotfire Gene Ontology Advantage Application 整合 GO 注释和基因表达分析。研究者在 DecisionSite 里可视化地选择一个子集的基因,软件展示了基因的 GO 等级分布。类似地,在 GO 等级里选择任何的过程、功能或细胞定位可以在 DecisionSite 里可视化地显示其相应的基因。

** STEM: Short Time-series Expression Miner [http://www.cs.cmu.edu/~jernst/stem/]
STEM 是一个 Java 程序,用于聚类、比较和可视化短时间序列的基因表达数据(少于或等于 8 个时间点)。STEM 允许研究者识别显著性的时间表达谱和与这些表达谱相关的基因,并比较不同条件下这些基因的行为。STEM 完整地整合了 GO 数据库,并支持对具有相同的时间表达谱的基因集做 GO 类别富集分析。STEM 还支持对特定 GO 类别的基因行为进行简易的识别和可视化,识别在这些基因中那些时间表达谱被富集。

** T-Profiler [http://www.t-profiler.org/]
T-Profiler 使用 t 检验对预定义的基因集的平均活性改变进行打分。基因集分别基于 GO 类别、ChIP-chip 实验、上游与相应的转录因子结合模体匹配、在相同染色体上的定位进行定义。一个大折刀 (jack-knife) 过程使得计算比其它软件要更为稳健。T-Profiler 使得对芯片数据进行解析以直观和严格统计成为可能,而不需要结合实验或者选择参数。

** THEA:Tools for High-throughput Experiments Analysis [http://thea.unice.fr/index-en.html]
THEA 是一个整合的信息处理系统,用于分析后基因组数据。可以自动化进行数据 (由通过选择的生物学信息包括 GO 进行分类) 注释。用户可以对这些注释手动搜索和浏览,或根据统计标准 (数据挖掘) 产生有意义的概述。


其它工具

** APID:Agile Protein Interaction Data Analyzer? [http://bioinfow.dep.usal.es/apid/index.htm]
APID 是一个交互的生物信息学 web 工具,在一个统一的和比较性的主要平台,用于整合和分析,目前已知的信息是由特定的小规模或大规模的实验方法所展示的蛋白质相互作用。目前,此应用程序包含来自于 5 个主要数据库资源的信息,装入于单一服务器以探索 4 万个不同蛋白和接近于 15 万已证实的不同相互作用。网站包含搜索工具以检索和浏览数据,允许通过计算的参数选择相互作用对,这些参数衡量每一个特定的蛋白相互作用的可靠性。蛋白的参数是连通性、聚类系数、GO 功能环境、GO 环境富集; 相互作用方式的数目、GO 重叠(GO overlapping)、iPfam 结构域 - 结构域相互作用。APID 同样包含了一个图形互动的工具用来显示选择的子网或者整个网络以及对其导航。

** Blast2GO [http://www.blast2go.de/]
B2G 基于 GO 注释和功能分析进行相似性搜索。B2G 对基因功能信息可能性提供直接的统计分析并在 GO 有向非循环图中高亮显示相应的功能特性。而且 B2G 包含了不同的统计图表概述了包括 BLASTing、GO 映射、注释和富集分析(Fisher’s Exact Test)。所有的分析过程是可配置的以及支持在任何分析阶段进行数据的输入和输出。这一程序同样接受已存在的 BLAST 或注释文件并将它们加入到后续的分析中。这个工具还提供了非常合适的平台来进行非模式生物的高通量功能基因组研究。B2G 是一个不依赖于物种、直观和互动的桌面程序,允许监示和理解整个注释和分析过程,分析过程支持附加的特性如 GO Slim 整合,考虑 evidence code(EC),批量模式或 GO 多水平饼图。

** Db for Dummies! [http://www.dbfordummies.com/go.asp]
DBD 是一个小数据库,导入 GO Slim,它允许数据以树的形式显示。

** Flash GViewer [http://www.gmod.org/flashgviewer/]
Fash GViewer 是一定制的 Flash 电影能够轻易地被嵌入到网页以显示染色体上单独特性的位点。它试图提供特定特征集 (如基因相关的特定 GO 术语等) 的基因组位点的概述,而不是显示基因组的特性。特性能超链接到外部的网页以获得细节信息,使得 GView 能够作为一个导航工具。提供了大鼠、小鼠、人和线虫的基因组图谱(其它的基因组图谱也能够创建)。注释数据以静态的文本文件提供或者通过服务器端的脚本产生 XML 文件。
这个工具不是 GO 特异的,但是设计成可以显示 GO 注释数据。

** FunSpec [http://funspec.med.utoronto.ca/]
FunSpec 是一个基于 web 的工具,对基因和蛋白集 (如共调控基因、蛋白复合体、基因相互作用) 基于已存在的注释包括 GO 术语进行统计评估。

** FuSSiMeG:Functional Semantic Similarity Measure between Gene Products [http://xldb.di.fc.ul.pt/rebil/ssm/]
能够通过比较基因注释中 GO 术语间的语义相似性来衡量基因产物间的功能相似性。还可以对任意 GO 术语进行语义相似性评估。

** Generic GO Term Mapper [http://go.princeton.edu/cgi-bin/GOTermMapper]
Generic GO Term Mapper 映射基因列表中的粒状 GO 注释 (granular GO annotations) 到更为广泛、更高水平的 GO 父节点术语(有时候索引到 GO Slim 术语上),允许把基因归到更大的类别里。

** Genes2Diseases [http://www.bork.embl-heidelberg.de/g2d/]
Gene2Disease 是一个映射到人类遗传疾病的候选基因的数据库。通过使用分析相关的表型特征和生化实体(chemical objects)、从生化实体到 GO 蛋白功能术语以及基于 MEDLINE 和 RefSeq 数据库产生了本数据库。能够用来显示特定遗传疾病相关的所有 GO 术语。

** GO Slim Mapper [http://db.yeastgenome.org/cgi-bin/GO/goTermMapper]
GO Slim Mapper 用来注释出芽酵母基因产物,使用 SGD GO Slim 集,映射特定的粒状 GO 术语 (granular GO terms) 到相应的更为通用的 GO slim 父节点术语上。

** GO Terms Classification Counter [http://www.animalgenome.org/bioinfo/tools/countgo/]
GO Terms Classification Counter 以一个包含 GO 术语 IDs 的格式化或非格式化文本文件作为输入,用户选择以下可供选择的类别如 GO_slim、GOA、EGAD、MGI_GO_slim 或 GO-ROOT,程序执行计数,并返回结果于网页上(如果时间长的话,程序会给用户发送含有结果的链接)。结果包含了计数表格、百分比和一个饼图。

** GOBU:Gene Ontology Browsing Utility [http://gobu.iis.sinica.edu.tw/]
GOBU 是一个基于 Java 的程序,使用 GO 和用户定义的等级两大目录 (catalogs) 在一个可扩展的体系下整合生物学注释目录 (biological annotation catalogs)。GOBU 拥有以下的特性  1) 用户特定的等级数据作为输入数据,(2)用户定义描述不同注释的数据类型,(3)一个处理用户定义的数据类型的可扩展软件体系。

** GOChase [http://www.snubi.org/software/GOChase/]
GOChase 是一系列基于 web 的工具,用于检测和纠正基于 GO 注释的错误。
.GOChase-History 解决所有 GO IDs 修改的历史。
.GOChase-Correct 高亮显示整合的 GO IDs 和重定向到正确主术语并进一步到整合的二级 ID。对于过时的 GO 术语,GOChase 推荐使用最短距离的非丢弃父术语。这个功能被用于 GO 浏览器如 AmiGO 和 QuickGO 以修复失效的超链接。
. 完整的数据库 (如 LocusLink) 可以作为平文件载入到 GOChase 里,报导注释错误和 GOChase 的纠正。
. 当给一个 GO ID 输入时,GOChase 会给出所有主要数据库里被这一 GO ID 所注释的所有基因产物。

** GOProfiler [http://agbase.msstate.edu/GOProfiler.html]
GOProfiler 对 AgBase 中可用的 GO 注释提供一个概述。用户提供一个物种(分类学 id),GOProfiler 显示此物种 GO 相关的数目和蛋白注释的数目。结果以 evidence code 列出,并提供了一个未被注释的蛋白列表。

** GORetriever [http://agbase.msstate.edu/GORetriever.html]
用户提供一个蛋白 ID 列表,GORetriever 在 AgBase 里搜索相应的 GO 注释,目前支持的 ID 类型是 Uniprot ID、Uniprot Accession、GO ID。GORetriever 产生蛋白和相应注释的列表以及一个没有 GO 注释的入口列表(list of entries)。没有 GO 注释的列表可以作为 Goanna 工具的输入以寻找相似序列(如果有注释的话会提供)。

** GOSlimViewer [http://agbase.msstate.edu/GOSlimViewer.html]
GOSlimViewer 对一个数据集提供高水平的 GO 类别概述。它设计成使用 GORetriever 的输出。你可以为 GORetriever 文件添加附加的注释(来自于 GOanna 或其它的资源).GOSlim Viewer 目前只支持 GOSlim 集。

** ProteInOn [http://xldb.fc.ul.pt/biotools/proteinon/]
ProteInOn 能够找寻相互作用的蛋白、找寻相应的 GO 术语并计算蛋白相似的功能语义并获取信息内容和计算每个 GO 术语的功能语义相似性。

** TXTGate [http://www.esat.kuleuven.ac.be/txtgate]
TXTGate 基于 web-service,结合选择的公开生物学资源的文献索引到一个灵活的文本挖掘系统以分析不同的基因集。通过裁剪词汇表 (tailored vacabularies)、选择文本文件、LocusLink 的 MedLine 摘要和索引 SGD。子聚类(subcluster) 和到各个外部资源的链接提供了对结果进行深度分析。

** Wandora [http://www.wandora.org/]
Wandora 是一个基于 Topic Maps(ISO 13250)的通用知识抽提、管理和发布环境。Wandora 支持 OBO 平文件 v1.2 格式,能够对 OBO 文件 (包括 GO) 和 topic map 进行相互转换。Wandora 对于非常适合于显示 OBO 以及结合 OBO、RDF 和 Topic Map 资源进行知识整合(knowledge mashups)。

** WEGO:Web Gene Ontology Annotation Plot [http://wego.genomics.org.cn/]
WEGO 是一个简单但有用的工具,用于绘制 GO 注释结果图。与其它的商业软件的图表创建不同,WEGO 设计成处理 GO 的有向非循环图 (directed acyclic graph, DAG) 结构以便于为 GO 注释结果创建直方图。WEGO 已经在许多的生物学研究项目中得到应用,包括水稻基因组项目和蚕基因组项目。它已经成为一个下游基因注释分析的有用工具,特别适合于执行比较基因组任务。

** Whatizit [http://www.ebi.ac.uk/Rebholz-srv/whatizit/form.jsp]
Whatizit 是一个 web 程序,重点突出在文档中所有感兴趣的东西。它的一个模块标识所有的 GO 术语和来自于 UniProt 蛋白跟基因的名称,并分别链接到 GO 和 UniProt 上。

正文完
 0