定量,多途径的数据集分析(ReactomeGSA)

ReactomeGSA是融入Reactome生态系统的一个新途径的分析工具。它的主要特征是,它执行定量途径分析(所谓的基因组分析)。这增加了差异表达分析,这是在该通路电平直接进行的统计功效。

ReactomeGSA可以同时分析多个数据集,从而进行比较路径分析。因此,可以迅速评估是否在独立的实验或研究中观察到同样的效果。

ReactomeGSA目前支持定量蛋白质组学,转录和微阵列数据。从所有这些方法集可以在单个分析相结合。由此,可以ReactomeGSA执行多组学途径的分析。

使用ReactomeGSA

我们目前提供三种方式访问​​ReactomeGSA:

  • Reactome的基于网络的路径浏览器(见下面)
  • 从r使用我们ReactomeGSA Bioconductor的[R包(见在这里
  • 编程,使用在ReactomeGSA APIhttps://gsa.www.joaskin.com

在路径浏览器中的ReactomeGSA

ReactomeGSA被集成到Reactome的路径浏览器的“分析基因表达”标签下。

选择

在这第一个屏幕,您需要选择要使用的算法为差分路径分析。在写这篇文章的时候,ReactomeGSA提供三种算法。PADOG和照相机执行两组样本之间的差异表达分析。ssGSEA是一个所谓的基因组变异的方法,对于每个样品返回通路级的量化数据。

每种算法的详细参数可以通过点击该算法的对话框左侧的蓝色图标进行调整。

添加数据集

点击“下一步”后,会出现与数据集的现在空列表。点击“+添加数据集”按钮来添加新的数据集。

添加数据集

首先,你必须选择的数据集要加载的类型。

要上传自己的数据,请选择“从本地文件夹中选择文件”下的选项之一。该文件必须是一个制表符分隔的文本文件(CSV或TSV文件),其中第一列包含基因或蛋白质标识符,所有后续列包含各自的样本。第一行包含样本名称,随后的所有行包含基因/蛋白质。

为了测试工具,它可以快速加载示例数据。目前,ReactomeGSA提供了三个示例数据集,两(匹配的)上黑素瘤相关的B细胞的数据集(蛋白质组学和转录测量)和B细胞上的一个scRNA-SEQ数据集。

最后,它可以直接加载数据集从ExpressionAtlas。要做到这一点,首先导航到ExpressionAtlas(在一个单独的标签页或窗口)在https://www.ebi.ac.uk/gxa。一旦你已经确定感兴趣的数据集,您可以通过打开数据集和复制后的部分得到了数据集的ID“www.ebi.ac.uk,下一个“/”之前。

例如,如果你打开https://www.ebi.ac.uk/gxa/experiments/E-MTAB-6592/Results该数据集的标识是“E-MTAB-6592”。

对于单细胞实验,您还必须定义参数“k”,以便定义应该使用哪些集群。“k”对结果的影响可以在ExpressionAtlas中各自单细胞实验的第一页上看到(见https://www.ebi.ac.uk/gxa/sc/experiments/E-CURD-46/results/tsne举个例子)。在这种情况下,数据集标识符将是“E-CURD-46”和“K”的可能值是17,25,32,例如。

实验的元数据注释

一旦一个数据集被添加,你需要注释的实验元数据。这是必要的,以便以限定的基团为在下一步骤的差异表达分析。

您可以在顶部的“数据集名称”框中适应数据集的名称。这一名称将用于所有结果。为了增加可读性,我们建议短名称尽可能使用。

如果您从ExpressionAtlas加载数据或选择一个示例数据集(如屏幕截图所示),示例注释表将已经被预先填充了某些元数据。如果您上传了自己的数据集,表格将只在左侧显示橙色的样本标签。

要添加注释,点击右侧的“加号”符号。这将一个新的空列添加到表中。首先,添加标题定义属性(例如,“治疗”)的名称。接下来,您要在您的比较,包括每个样本添加值。没有任何价值的样品将完全忽略。

定义实验设计

添加数据集EXP

在添加数据集的最后一步中,您必须定义要比较的组。“比较因子”下拉菜单包含之前示例表中注释的所有参数(如果它们包含至少两个不同的值)。“第一组”和“第二组”定义了哪些样本可以相互比较。

根据您选择的“比较因子”,“第一组”和“第二组”的可用值将自动更改。

此外,一些基因组分析方法允许你定义所谓的“协变量”。这些参数可能会导致你的结果有偏差。使用的排序设施),您想要纠正。只需为您的实验选择相关的。

一旦你点击“继续”,您将返回到数据集,在这里你将看到在列表中注释的数据集的列表。如果你愿意,你可以在任何数量的数据集添加到单个请求。

在开始分析

开始分析

一旦你点击从数据集列表视图“继续”,说到底选项会显示。

“创建REACTOME可视化”总是选中的。如果取消选中,则无法在Reactome的路径浏览器中显示结果。该选项通常只与ReactomeGSAř包

如果您选择“创建报告” ReactomeGSA会自动创建结果的Microsoft Excel和PDF报告。此外,它会创建一个短[R脚本,让你直接加载数据到一个R会话。

如果您提供您的电子邮件地址,您就自动会立即通知作为分析完成。邮件将包含直接链接到生成的报告(如果您选择创建它们),并在PathwayBrowser到可视化的链接。

通过点击“GO”按钮启动分析。

如果你提供了一个电子邮件地址,你也可以关闭浏览器。分析仍将继续在我们的服务器上进行,一旦分析完成,您将得到通知。使用许多大型数据集进行的一些分析(例如在一次分析中比较五个TCGA数据集)可能需要一个小时才能完成。

援引ReactomeGSA

如果您在您的研究中使用ReactomeGSA,请引用以下出版物:

ReactomeGSA - 高效的多组学的比较途径分析

约翰内斯GRISS,吉列尔梅比特里,康斯坦丁Sidiropoulos,VY阮,安东尼Fabregat,亨宁Hermjakob

bioRxiv 2020.04.16.044958;DOI:https://doi.org/10.1101/2020.04.16.044958

引用我们!