概述

ReactomeFIViz应用程序的目的是找到与癌症和其他类型疾病相关的途径和网络模式。这个应用程序访问Reactome存储在数据库中的通路,帮助您对一组基因进行通路富集分析,直接在Cytoscape中使用手工绘制的通路图可视化hit pathway,并研究hit pathway中基因之间的功能关系。应用程序还可以访问Reactome功能交互(FI)网络,一个高度可靠,手动策划pathway-based蛋白质功能交互网络覆盖超过60%的人类蛋白质,并允许您构建一个FI子网络基于一组基因,查询FI为底层数据源交互的证据,构建分析高相互作用基因群网络模块,进行功能富集分析对模块进行注释,通过查找与实验数据集相关的基因扩展网络,显示路径图,叠加癌症基因索引注释等多种信息源。最近,我们还增加了一些功能,帮助用户在FI网络和Reactome途径的背景下可视化fda批准的癌症药物,并使用直接从Reactome途径构建的布尔网络模型来调查显示的癌症药物的潜在功能影响。

例如,我们如何使用Reactome FIs进行癌症数据分析,请参阅我们的出版物:人功能蛋白相互作用网络及其在癌症数据分析中的应用

下载并启动ReactomeFIViz

ReactomeFIViz app 6需要Cytoscape 3.7.0或以上版本。如果你没有安装Cytoscape 3.7.0或以上版本,请从Cytoscape的网站下载:http://www.cytoscape.org..启动Cytoscape后,使用“Apps/App Manager”菜单打开“App Manager”对话框,搜索“ReactomeFI”。您应该看到中间面板中列出的ReactomeFIViz应用程序(见下图)。您可能会看到一个不同的版本号。注意:这个app的名字是“ReactomeFIPlugIn”,这是该应用程序的原始名称)。选择应用程序,然后点击对话框底部的“安装”按钮。按照步骤完成安装。

从app Store安装ReactomeFIViz应用

使用Reactome通路

使用路径可视化和分析功能,您可以将Reactome数据库中的路径加载到Cytoscape中,在本地路径图视图或FI网络视图中可视化Reactome路径,对一组基因进行路径富集分析,并从hit路径列表中检查基因。

探索Reactome通路

  1. Load Reactome pathways:使用“Apps/Reactome FI/Reactome pathways”菜单将路径加载到Cytoscape中。加载的路径按照层级方式组织,就像Reactome web应用程序(//www.joaskin.com/PathwayBrowser/),并在左侧的“控制面板”中列出名为“Reactome”的选项卡。
    Reactome通路
  2. View Patchways在反弹中:在路径层次结构中选择路径后,可以从弹出菜单中选择“View Reactome Source”(右键单击Windows或Control-Click-Click in Mac以获取弹出菜单)
    路径弹出菜单
    来查看Reactome中的详细注释。也可以选择“在Reactome中查看”,在Reactome web应用程序中查看详细信息。
    笔记:所选路径的祖先途径(容器路径)显示在“中间”面板上,“选定的”事件分支“,在”反应“选项卡中。您可以单击此中间面板中的祖先路径,以查看原始路径层次树中的单击的通路位置。但是,祖先途径将不会在原始树中选择。这是一个设计的行为,以保持原始树中的选择。
  3. 搜索路径:在弹出菜单中选择“搜索”,弹出搜索对话框。发现的路径将在路径树中以蓝色突出显示。
    笔记:搜索将针对所有加载的路径,而不限于选择的路径及其包含的子路径。
    搜索路径
  4. Open Reactome Reacfoam:ReaCfoam视图提供了反应数据库中所有(不含疾病)人类途径的整体视图。在弹出菜单中选择“打开reactome reacoam”,以在默认浏览器中打开反垃圾邮件。
    打开Reactome Reacfoam
    打开Reacfoam
    笔记:按下鼠标并将其按住路径框,将自动选择ReactomeFIV树中的路径。
    Reactome Reacfoam
  5. 开放路径图:Reactome中的路径以分层方式组织。并非所有路径都有自己的路径图。一个较小的路径(称为子路径)可以绘制在一个较大的路径中,该路径有自己的路径图。大多数顶级路径(称为模块或超级路径)用于组织相关路径(例如疾病、信号转导),因此只包含代表典型路径的矩形框。
    1. 展示图:如果选择的路径有自己的路径图,您可以在弹出菜单中选择“Show diagram”,打开路径图到中心的Cytoscape桌面。
    2. 在图:如果一个选择的路径是一个更大路径中的子路径,你可以在弹出菜单中选择“在图中查看”,在它的容器路径中查看它的绘图。图表打开后,所选途径所包含的反应将用蓝色突出显示。例如,参见下面“细胞周期检查点”路径中打开的“G1/S DNA损伤检查点”路径:
      通路图
  6. 搜索图:路径图中显示的对象可以在弹出菜单中使用“搜索图”进行搜索(在Windows中单击右键,或者在mac中不选择路径图中的任何对象而单击Control,即可得到弹出菜单)。找到的对象将被选中并以蓝色高亮显示。
    笔记:将不会在图表中搜索反应。使用路径树中的搜索功能搜索反应。
  7. 导出图:可导出为PDF、JPG、PNG格式。使用弹出菜单中的“导出关系图”导出显示的关系图。
  8. 查看反磁源或View in reactome:选择一个对象,然后右键单击(或控制单击)以获取弹出菜单。选择“View Reactome Source”以查看表中所选对象的详细注释(有关示例的下图)。或选择“在反垃圾中的视图”以在反应网站应用程序中查看所选对象。
    Reactome实例视图
  9. 列表基因:在选择一个对象后,可以使用菜单项“列表基因”查看一个复杂或蛋白质组所包含的基因,或与显示的蛋白质相关的基因。例如,下面的对话框显示了复杂的hBUBR1:hBUB3:MAD2*:CDC20所包含的基因。点击一个基因符号将带你到GeneCard网站的基因网页。
    基因列表

在FI网络视图中显示反应路径

  1. 在FI网络视图中显示路径:一个Reactome路径可以通过我们建立的方法转换成一个功能性的相互作用网络(见人功能蛋白相互作用网络及其在癌症数据分析中的应用).在弹出菜单中使用“转换到FI网络”,在路径图面板中右键单击(Windows)或控制单击(mac)一个没有任何选择的空白区域。将原路径图移至左下角,根据原路径图生成新的FI网络,并在新的网络面板中显示。
    笔记:显示的路径包含的子路径也将被提取到FI网络中。
    途径在网络视图中
  2. 探索路径和网络视图中的对象:三种视图中的对象选择已同步。可以选择的对象包括:路径树视图中的事件,左下角的路径视图中的对象,以及网络视图中的基因和FIS。您可以在三个视图之一中选择一个对象,也应选择其他两个视图中的相应对象。此外,您应该在每个视图中使用弹出菜单中实现的功能,以便在单个视图中浏览对象。


笔记:使用Cytoscape内置的“save Session”功能可以从通路中保存转换的FI网络。但是,当前无法将显示的路径保存到会话文件中。我们将在未来的版本中实现这个功能。

通路富集分析

  1. 通路富集分析:基因列表可以用来检查是否有任何的Reactome途径被富集。为此,使用弹出菜单项“Analyze Pathway Enrichment”(左下方图),获得选择基因集文件的对话框(右下方图)。您可以使用三种文件格式之一的基因集文件:每行一个基因,所有基因在同一行并以逗号分隔,或所有基因在同一行并以制表符分隔。你也可以通过点击“点击进入”按钮手动输入基因(一行代表一个基因)。
    笔记:根据您的基因列表大小,可能需要1分钟以上的时间进行途径富集分析。该功能中使用的路径与用于注释FI网络或网络模块的Reactome路径不同。这里有2000多条通路被使用。对于注释,只使用了预先选定的特定大小的Reactome通路的子集。
    分析途径富集分析富集途径的对话
    笔记:为获得路径富集分析结果的整体视图,分析完成后使用路径树的弹出菜单“open Reactome Reacfoam”打开Reactome Reacfoam。您也可以通过点击右上角的下载按钮来下载Reacfoam视图。对于windows 10用户,要打开Reacfoam视图,你需要在“系统和安全”控制设置中“允许应用程序通过windows防火墙”的设置中勾选“公共”,以允许“公共”访问Cytoscape。
    Reacfoam视图进行浓缩分析
  2. 查看富集分析结果:途径富集结果在Cytoscape主窗口下方的“table Panel”中以“Reactome Pathway enrichment”的表格形式显示。可以使用“图中的视图”在路径图视图中查看命中路径,使用“导出标注”将结果保存到表中。Reactome路径树中的路径根据它们的FDR值以不同的颜色突出显示。在路径图视图中,包含基因列表中的基因的对象以紫色背景和白色字体高亮显示。在FI网络视图中,命中路径的命中基因显示在紫色的粗边上。
    笔记:在“基因列表”功能的“基因列表”对话框中,命中基因以相同的颜色显示。
    通路富集的结果
  3. 执行GSEA分析:基因集富集分析(GSEA)是一种基于秩的路径富集分析方法,广泛应用于基于路径的数据分析。ReactomeFIViz支持使用基因评分文件对Reactome路径进行GSEA分析。基因评分可以是来自差异基因表达分析的t评分,也可以是其他类型的评分,可以进行排名。要执行GSEA路径富集分析,需要提供一个以制表符分隔的文本文件,其中包含两列:第一列用于基因符号(仅用于人类),第二列用于基因得分。第一行保留给列标题,不会导入进行分析。要进行GSEA分析,在路径树中使用弹出菜单“perform GSEA analysis”,弹出GSEA配置对话框,在对话框中输入基因评分文件,选择最小和最大路径大小以及排列数。
    执行GSEA分析
    执行GSEA分析
    Congigure GSEA分析
    配置GSEA分析

    GSEA分析结果显示在标记为Cytoscape表面板中标记为“反应GSEA分析”的表格中。通过基于基于基于基于基于基于基于基于基于基于基于基于基于基于基于基于基于基于基于G基于基于GA的途径的途径来突出显示(参见上文)。有关结果表中显示的列含义的详细信息,请咨询原始GSEA文档:GSEA文件

    GSEA分析结果
    GSEA分析结果
  4. 在路径上覆盖基因评分:对于GSEA分析产生的重要通路,可以叠加基因评分,以调查具有显著高或低评分的基因产品的位置,从而了解这些极端评分造成的潜在通路活性影响。为此,在路径图视图中使用弹出菜单“覆盖基因评分”,在配置对话框中选择基因评分文件。文件加载后,路径图中的实体将根据分数高亮显示。您可以在正确的基因评分表视图中选择一个或多个基因,以可视化路径图中的相关实体。
    重叠基因的分数
    重叠基因的分数
    基因评分覆盖结果
    基因评分覆盖结果

    笔记:如果是一个以上的基因组成的权利(例如,复杂或实体集),则实体的分数是该实体注释的所有基因的平均值。要在通路图中清除覆盖基因分数,请使用弹出菜单“删除基因分数”。要查看在显示的通道图中注释的基因分数的分布,请在Cytoscape结果面板中的“基因分数”标签中选择“绘图视图”(见下文)。

    基因的分数分布
    基因的分数分布

基于概率图形模型的路径分析

我们通过将途径图中绘制的反应转换为因子图中的因子,一种概率图形模型(PGM)来改编反应途径的范式方法。有关范式方法的详细信息,请参阅:利用PARADIGM从多维癌症基因组学数据推断患者特异性通路活动. 有关因子图的介绍,请参阅以下维基百科条目:因子图.为测试目的,您可以下载两个样本数据文件的100 TCGA卵巢癌患者:基因拷贝数异变mRNA基因表达.原始TCGA OV文件被下载布罗德研究所消防水带网站。

  1. 批量运行图形模型分析:此功能用于对具有手动布局图的所有反应途径进行批量图形模型分析。
    1. 开始分析:选择路径层次树中的弹出菜单“运行图形模型分析”。选择此菜单后,将要求您在“运行图形模型分析”对话框的以下两个选项卡中选择数据文件并提供推理算法的参数:
      loaddata.
      SetUpAlgorithms

      笔记
      1)。如果在“数据加载”对话框中选择“使用实证分布”,则加载的数据将直接用于构建因子功能而无需离散化。目前,我们建议使用“选择阈值以使”离散化“。
      2).建议使用默认参数的推理算法的批处理分析快速性能。你可以在批次分析中发现有趣的路径后,为一些特定的路径尝试不同的参数。如果要执行两种情况(例如案例控制,药物敏感/不敏感等),请选中“用于具有两种情况的样本的路径分析”复选框,并根据需要提供示例信息文件。对于两种情况分析,不会生成随机数据集。将通过比较上传的数据文件中的两种样本来呈现结果。
    2. 运行分析:单击“确定”按钮以启动批处理分析。根据您的示例大小,可能需要数小时完成整个分析。
    3. 完成分析:批量分析完成后,如果由于推理算法无法收敛,您可能会看到以下某些路径,您可能会看到以下列表。请确保以下列表很小(可能少于10个路径),以便您可以获得足够的结果。
      FaillevatePathwaseList.
    4. 查看结果:批分析的结果显示在Cytoscape桌面的底部表格面板上,如下所示:
      BatchResults
      笔记:此表中有7列:APP分析的路径名称的反弹;普通植物通过与随机背景(IPA:集成路径活动相比,普通植物显示出途径扰动。有关详细信息,请参阅上述范例纸张);AverageRigteDipa表明途径扰动了多少;ConversyPvalue是一个p值,表明该途径基于通路输出和渔民的方法有多显而易识;LineumpValue是路径输出的最小P值;基于Benjamini-Hochberg方法,最后两列是两个p值的fdrs。普通植物或平均南极洲可以是NaN,其表明基于该分析没有检测到的扰动。FDR筛选基于在“或”操作的最后两列中显示的FDR值。
    5. 保存结果:要保存结果,使用表格中的弹出菜单“Export Annotations”,将结果保存到外部文本文件中。保存的结果可以稍后在路径树中使用弹出菜单“加载图形模型结果”来加载。
  2. 对单个路径运行图形模型分析:此特性用于对显示在Cytoscape桌面中的路径执行图形模型分析。
    1. 打开一个途径:与前面一样,您可以在路径树中选择一个路径,并在Cytoscape桌面中打开它的关系图。或者,您可以通过选择弹出菜单“在图中查看”,从批分析结果表中选择一个有趣的路径。
    2. 开始分析:从路径图窗口的弹出菜单列表中选择弹出菜单,“运行图形模型分析”。您将被要求提供数据文件,并在批处理分析中设置推理算法。点击“OK”按钮后,你会被要求在下面的对话框中提供路径中不会被图形模型考虑的实体的转义名称列表(如ATP、ADP等):
      EscapeNameDialog

      笔记:如果有加载数据文件,则可以选择使用加载的数据文件而不显示数据加载对话框。
    3. 查看结果:分析完成后,在Cytoscape的表格窗格中显示三个选项卡:IPA Pathway analysis、IPA Sample analysis和IPA Node Values。IPA路径分析通过比较数据文件中的样本和应用程序基于数据文件动态生成的随机数据集,显示路径中实体的推断结果。IPA样品分析显示每个样品的结果为向上或向下扰动。您可以选择显示/隐藏表中示例的p值和FDR值。IPA节点值显示了每个样本路径图中所选实体的推理结果。路径图中的实体根据IPA路径分析选项卡中MeanDiff列中的值高亮显示。
      CellCycleCheckPointsResults

      笔记:您可以通过双击路径图窗口底部的色谱条来更改路径图高亮的色谱映射,以获得设置最小/最大值的对话框。您可以通过使用弹出菜单“保存分析结果”来保存路径的分析结果,并在稍后通过“打开分析结果”加载结果。
    4. 分析基因水平结果:上或下扰动的结果是根据个体基因的基因组数据文件推断的。该应用程序提供分析单个基因的观察结果和推断结果的功能。通过弹出菜单“Show Gene Level Analysis results”和“Show Observations”,可以查看整个路径的基因级观察和推断结果。您还可以查看这些结果的实体所包含的基因显示在路径图后,选择该实体,然后使用这两个弹出菜单。以下两个对话框显示了细胞周期检查通道中“hBUBR1:hBUB3:MAD2*:CDC20 complex [cytosol]”复合物所含基因的基因水平观察和推断结果:
      ObservationsForEntity
      GeneLevelResultsForEntity
    5. 分析和可视化个别样本的结果:推论结果和加载的观测数据显示在右边的“结果面板”中(见下)。通过勾选“为样本突出路径”,将根据“选择样本”框中所显示的选定样本的推断IPA值突出显示路径图中的实体。您也可以通过点击播放按钮来启用动画。有两个选项卡“结果面板”:“推理”显示推断出来的价值观,“观察”选项卡加载相关的观测数据通路中的实体(注意:如果你选择“离散化”,显示的观察值是离散:0低于正常水平,为正常,1和2高等师范)。三个视图(路径图、推断表和观察表)中的对象同步进行选择。
      PGM样本视图:推断
      PGM样本视图:观察
    6. 比较两个样本的分析结果:您可以比较两个样本的观察数据和推理结果。为此,请在“底部结果”窗格中的“IPA样本分析”选项卡中选择两个样本,并使用弹出菜单“比较样本”,从而带出另一个名为“示例比较”的选项卡。您可以查看比较结果的推理和观察数据。
      两样本比较

布尔基于网络的路径分析

我们开发了一种方法(手稿正在准备中),将基于反应体通路的生化反应转化为布尔网络,然后根据训练信号通路映射到生化数据与约束模糊逻辑:定量分析肝细胞对炎症刺激的反应查询定量逻辑模型(Q2LM)以研究细胞内信号网络和细胞因子相互作用.基于此方法,用户可以使用基于布尔网络的模糊逻辑的丰富的Reactome路径在Cytoscape内部进行路径模拟。

  1. 建立和运行逻辑模型仿真:在路径图视图中选择弹出菜单“运行逻辑模型分析”以获取新的模拟对话框。输入模拟的名称和默认值,通常应该为1.0,以便启用模拟可以继续,然后为AND GATE模式选择PRIS或MIN(通常应该是正常的默认选择刺激)。
    笔记:您也可以选择一个传递函数和调整希尔函数的参数。但是,为了简单起见,建议首先使用“恒等函数”。关于如何应用药物进行逻辑模型模拟,请参见下面。
    运行布尔网络分析
    新BN模拟

    在New Simulation对话框中单击OK按钮后,默认的初始配置将显示在Results Panel中。您可以通过单击选定变量的单元格来更改设置表中的变量Type和modify。要运行模拟,请单击结果面板中的Simulate按钮。
    建立布尔网络分析
    选择BN变量类型
    选择BN改性类型
  2. 可视化仿真结果:完成模拟后,将基于模拟值突出显示路径图中的实体,这些值应在0到1.之间。您可以选择一个或多个实体以在Cytoskape底部的表面板内可视化其时间行为。从模拟计算的吸引子也在结果面板内的原始设置表中的右列中列出。笔记:模拟后,您将无法修改任何初始配置。
    布尔网络仿真结果

    笔记:为避免混乱,如果为逻辑模型模拟生成了过多的时间步,则表中仅显示最后20个时间步。但是,该图显示了所有时间步长。在选择表中的任何变量后,您可以使用弹出菜单“配置列”选择要在表中显示的不同列。
  3. 通过修改执行途径模拟:布尔网络模拟可以帮助用户揭示实体活动的修改(如体细胞突变引起的抑制或激活)对通路行为的影响。例如在PIP3激活AKT信号通路中,Complex AKT:PIP3与EntitySet THEM4/TRIB3形成复合物,形成另一个复合物,抑制AKT的激活(具体参见)Reactome PIP3激活AKT信号).要执行带有修改的模拟,请在模拟设置表中选择修改类型,并将强度分配给修改。
    选择禁止布尔网络仿真

    单击“模拟”按钮使用此配置的禁止调用约束模糊逻辑模型模拟。您可以通过选择实体,然后在Cytoscape底部切换模拟结果表来比较两种配置之间的模拟结果。
    抑制AKT的活性

    默认激活AKT

    你也可以使用结果面板中的“比较”按钮来获得比较对话框,然后选择两个模拟进行比较。比较结果显示在底部表面板中列出的新表中。
    比较对话框

    AKT活性比较

    注:比较结果表中的相对差值是根据每个模糊逻辑变量的相对变化计算的,计算为(valueInSim2 - valueInSim1) / (valueInSim2 + valueInSim1)。时间过程可以根据吸引子插值,直到相对的差异收敛为止。
  4. 要删除所有显示的受限模糊逻辑仿真结果,请使用弹出菜单,“运行逻辑模型分析”下“删除分析结果”。应将路径图重置为原始颜色,并且将删除与逻辑模型模拟相关的所有表。

反应通路背景下结构变异的可视化

通过与博士合作。海德堡大学的Francesco Raimondi和Rob Russell利用蛋白质相互作用的三维结构提供Mechismo,是由罗素博士的小组为了研究单个氨基酸残基对蛋白质结构和功能的贡献,我们系统地分析了TCGA数据集中的突变,并收集了一组反应和功能性相互作用,这些反应和功能性相互作用涉及到在其相互作用界面中显着富集突变的蛋白质(手稿正在准备中)。我们在ReactomeFIViz中添加了一些功能,以便在Reactome途径、反应和相互作用的上下文中可视化这些3D结构和突变残基。

  1. 在路径及其反应的上下文中可视化分析结果:在打开的路径图视图中(见探索Reactome通路有关如何打开路径图),请使用弹出菜单“加载机电机构结果”将分析结果加载到打开的通路图中。在加载结果后,基于标记为“机动反应”的底部表中所列的FDR值,反应着色。
    Mechismo反应视图
    Mechismo反应视图
    笔记:您可以选择不同类型的癌症或panccancer的结果,通过点击底部标签上方的列表“选择一种癌症类型,以突出反应基于表格中的fdr”。有些反应没有任何颜色突出显示,因为没有发现注释这些反应的蛋白质的结构变异。要从路径图中删除加载的结果,请使用另一个弹出菜单“remove Mechismo results”。
  2. 在通路FI网络的背景下可视化分析结果:将机电机构的结果加载到通路图中后,可以使用弹出菜单“转换为FI网络”将图表转换为FI网络。基于标记为“Mechismo Interaction”的底部表中列出的FDR值,突出显示了FI网络视图中的边缘。
    Mechismo交互视图
    Mechismo交互视图
    笔记:要使FI网络视图更简单,请在路径图视图中查看“仅适用于所选”的“显示FIS”。您可以选择反应或复杂,然后查看路径图视图中所选对象的提取的FIS。一些反应和复合物可能不含任何方法(例如,由蛋白质和化学品或蛋白质和化学物质之间的反应组成的复合物。
  3. 可视化蛋白质-蛋白质三维结构中的结构变异:在FI网络视图中,选择“Fetch Mechismo Results”弹出菜单,即可查看蛋白质-蛋白质相互作用的3D模型。将TCGA数据集中收集到的结构变异映射到原蛋白质-蛋白质相互作用的三维结构Mechismo站台
    Mechismo结构视图
    Mechismo结构视图
    笔记:在结构视图中,将坐标映射到结构变体的氨基酸残基以球的形式显示。映射到底部表中选定行的留数用黄色突出显示。ReactomeFIViz使用Jmol用于蛋白质3D结构可视化。有关如何使用JMOL的详细信息,请参阅其文档:http://jmol.sourceforge.net/docs/

使用反应功能互动(FI)网络

安装了ReactOmeFiviz应用程序后,您应该在“应用”菜单下会看到一个名为“反垃圾FI”的菜单项。单击此菜单,您将看到6个子菜单:基因/突变分析PGM影响分析微阵列数据分析Reactome通路和用户指南。基因集/突变分析用于对一组基因或一个突变数据文件进行基于FI网络的数据分析,PGM影响分析用于基于Reactome FI网络的概率图形模型进行功能影响分析,使用多个组学数据类型。HotNet突变分析HotNet算法搜索网络模块(见http://compbio.cs.brown.edu/projects/hotnet/),进行MCL的微阵列数据分析(马尔可夫图形聚类,http://micans.org/mcl/通过使用网络中的基因之间的相关性,从反应组数据库中的基因之间转换为加权网络来基于网络聚类分析,从反应数据库中加载途径,直接在其本地方式中直接在Cytoskape中进行可视化途径,并进行途径丰富分析和用户指南将您带来此用户指南。

ReactomeFIViz应用程序菜单

基因/突变分析

  1. 您可以通过单击“Enter”按钮直接进入ReactomeFiviz的基因列表,或从本地文件加载它。目前ReactomeFiviz支持基因集/突变分析的三种文件格式:
    1. 简单的基因集:每个基因一株。例如,GWASFuzzyGenes.txt, T2D GWAS基因列表。
    2. 基因/样本数量对.例如,genesamplenumber.txt.,其中包含两个必需的列,基因和有基因突变的样本数量,以及一个可选的第三列,列出样本名称(以“;”分隔)。
    3. NCI MAF(突变注释文件).例如,GlioblastomaMutationTable.txt, TCGA GBM项目的突变文件。
  2. 从列出的三个版本中选择一个FI网络版本。
    笔记:你可能会得到不同的结果使用不同的FI网络版本,因为一个较晚的版本可能包含更多的蛋白质/基因和更多的FI。但根据我们的经验,一个重要的FI网络模块在多个版本中通常是稳定的。
  3. 点击“确定”按钮直接输入基因,或者选择一个包含你想要用来构建功能交互网络的基因的文件。选择文件,选择合适的文件格式和参数,在对话框中加载基因,构建FI网络。点击“确定”按钮,开始FI网络建设过程。
    基因/突变分析
  4. 构建好的FI网络将显示在网络视图面板中。将自动为FI网络创建一个FI特定的视觉风格。
    反应fi子网
  5. Reactome FI插件的主要功能应该从弹出菜单中调用,右键单击网络视图面板中的空白区域即可显示弹出菜单。
    弹出菜单的网络
  • 获取FI注释:查询所选FIs的详细信息。将创建三个与FI相关的边缘属性:FI Annotation、FI Direction和FI Score。边缘将根据FI方向属性值显示。在下面的截图中,“->”表示激活/催化,“-|”表示抑制,“-”表示从复合物或输入物中提取的FIs,“-”表示预测的FIs。查看“VizMapper”标签,边缘源箭头形状和边缘目标箭头形状的值的详细信息。
    FI注释

    笔记:这是一个关于显示列的简短解释:在由查询基因列表中击中的反应Fi网络中收集的途径的Geneset;比例为在反应FI网络中含有总基因的基因数量的基因数量的比例;NumberofProteinineNESet用于途径中基因数量;来自查询基因列表的蛋白质从Quick基因数量的命中基因;基于二项式测试计算的p值的p值;基于使用Benjamini-Hocherberg方法的P值计算的FDR的FDR;途径中击中基因的节点。
  • 分析网络功能:显示网络的路径或GO术语富集分析。您可以选择按FDR截止值过滤浓缩结果。此外,通过选中“隐藏未选定行中的节点”,可以选择在网络面板中显示选定行的节点。每个通路基因集名称后括号中的字母对应于通路注释的来源:C-细胞图、R-反应组、K-KEGG、N-NCI PID、P-Panther和B-BioCarta。下面的屏幕截图显示了路径富集分析的结果。
    FI子网络中的通路

    提示:要分析未链接在一起的一组基因的路径或GO术语富集,请在“为FI网络设置参数”对话框中选择“显示未链接到其他基因”选项。
  • 集群FI网络:运行网络聚类算法(基于谱划分的网络聚类由纽曼2006)。不同网络模块中的节点将以不同的颜色显示(根据尺寸,仅前15个模块使用不同的颜色)。
    网络模块
  • 分析模块的功能:每个单独的网络模块的途径或转义富集分析。您可以选择尺寸截止以过滤掉太小的网络模块,选择FDR截止,以在某个FDR值下查看丰富的路径或GO术语,并仅在网络图中查看所选行或行中的节点。
  • 分析一组选定基因的功能:选择网络视图中显示的一组节点,然后选择弹出菜单“Analyze nodes Functions”,进行路径或GO term富集分析。结果将显示在一个对话框中。
  • 负载癌症基因指数:加载癌症基因指数注释。有关详细信息,请参阅部分负载癌症基因指数

PGM影响分析

  1. 我们开发了一种基于概率图形模型(PGM)的功能影响分析,利用Reactome FI网络将多种组学数据类型集成在一起。当前版本的ReactomeFIViz支持四种组学数据类型:CNV、mRNA表达、DNA甲基化和体细胞突变。用于此分析的铂质谱是基于马尔可夫随机场.目前我们支持两种类型的mrf:点对马尔可夫随机场最近的邻居吉布斯MRF.你可以从这两种型号中选择一种。为了简单起见,我们推荐成对MRF。
  2. 要执行基于PGM的功能影响分析,请选择菜单,应用/直肠FI / PGM影响/分析。您可以使用PGM配置对话框输入您的OMICS数据。
    FI-PGM配置对话框

    笔记
    1). ReactomeFIViz支持连续观测变量,不需要离散化,在配置中选择“使用经验分布”。对于体细胞突变,目前它只支持NCI MAF文件格式,并需要一个名为“MA_FI”的特定列。“得分”为突变函数的影响得分突变评估员或来自其他一些来源。
    2)。使用的默认MRF型号是pairwisemrf。您可以选择第一次测试的默认设置。
    3). MRF模型需要几个参数。我们根据一个小玩具模型调整了这些参数。在当前版本的ReactomeFIViz中,不能更改这些参数。
  3. 完成整个分析可能需要几个小时。实际运行时间将取决于数据的大小。作业运行的进度显示在以下进度窗格中。您可以随时取消运行。
    FI-PGM运行进展
  4. 分析完成后,您应该看到类似于以下屏幕截图的结果对话框。您可以使用过滤功能过滤到要用于构建进一步分析的FI子网的基因列表。
    FI-PGM结果对话框

    笔记:如果在结果表中选择一个或多个基因,则仅将使用这些所选基因来构造一个文件网络网络。您可以通过单击“保存”按钮来保存完整分析结果(所有基因的结果,而不是仅显示的结果,将保存)。我们强烈建议首先在单击“确定”按钮之前先保存结果,以便您可以访问您的结果。
  5. 选择“OK”按钮后,将构建一个FI子网,并显示在网络视图中。显示节点的大小与FI-PGM模型推导出的影响分数成正比。要查看影响分数和加载的观察数据,您可以在结果面板的“样本列表”选项卡中选择一个样本。您还可以通过检查sample List选项卡中的“为示例突出显示网络”来启用基于示例的网络可视化。如果您想查看用于构建FI子网络的原始结果,请单击“表格面板”中的“影响基因值”选项卡中的“显示所有结果”。
    FI-PGM结果网络

微阵列数据分析

这ReactomeFIVizapp can load gene expression data file, calculate correlations among genes involved in the same FIs, use the calculated correlations as weights for edges (i.e. FIs) in the whole FI network, apply MCL graph clustering algorithm to the weighted FI network, and generate a sub-network for a list of selected network modules based on module size and average correlation. The generated FI sub-network will be displayed in the network panel, and can be used for analysis as in Gene Set/Mutation Analysis. For details about this method, please see our publication:基于网络模块的识别癌症预后特征的方法

阵列数据文件应该是带表标题的选项卡分隔的文本文件。第一列应该是基因名称。所有其他列应该是不同样本中的表达值。文件中的数据集应该预先规范化。例如,请看乳腺癌的基因表达文件:NejmLogRatioNormGlobalZScore_070111.txt.zip.这个数据集是从van de Vijver等人的研究,并已被标准化。

  1. 选择微阵列数据文件并运行MCL网络聚类:在菜单Plugins/Reactome FIs中选择子菜单“Microarray Data Analysis”后,你应该会看到下面的对话框。选择一个微阵列数据文件,检查是否要使用绝对值作为边的权重,并为MCL聚类算法输入膨胀参数(-I)。膨胀参数越小,生成的网络模块的平均大小越大。根据我们自己的经验,我们用5.0作为膨胀参数,推荐值最高,边权值选择绝对值。有关如何选择膨胀参数的更多细节,请参阅http://micans.org/mcl/. 设置这些参数后,单击“确定”按钮加载数据文件,计算相关性,并应用MCL聚类算法。
    设置阵列数据分析参数
  2. 选择网络模块,建立FI子网生成的网络模块在MCL聚类结果对话框中列出(见下面)。只能列出2个以上基因的模块,用于FI子网络建设。您可以选择模块大小或平均相关值(绝对值,如果绝对值之前已经检查过),以过滤掉可能不重要的模块(注:设置这些截止值后,请按“Enter”键提交您的更改。)在我们的分析中,我们选择具有7个或更多基因且平均相关值不低于0.25的模块。这些值在对话框中被用作默认值。在对话框中,你可以看到有多少模块和基因将被选择在你选择的过滤值下建立FI子网络。单击OK按钮开始构建子网络。构建的子网络将被显示出来,并可以像基因集/突变分析生成的子网络一样进行分析。
    选择制程模块

在反应途径和FI网络的背景下可视化药物

ReactomeFIViz提供了一套功能,以帮助用户在reactomepathway和网络的背景下可视化药物。药物数据来源包括两个:Cancer Targetome (布吕歇尔等人,2017年),收集了所有fda批准的癌症药物(2018年之前)及其靶标相互作用,来自四个来源,包括DrugBank、治疗靶标数据库、IUPHAR和BindingDB;DrugCentral,一个由NIH IDG程序

想象药物在反应通路中的作用

  1. 列出所有FDA批准的抗癌药物:在Reactome路径树中使用弹出菜单“查看癌症药物”,在表格对话框中获得Cancer Targetome中收集的所有FDA批准的癌症药物列表。
    ViewCancerDrugs
    视图抗癌药物

    药物列表的截图如下:
    癌症药物清单
  2. 药物/目标交互视图:在药物表中选择一个药物(参见上图)来执行谷歌搜索,或者通过单击对话框中的一个按钮来查看它的目标。为药物/靶标相互作用提供了两种视图。药物靶标表视图(下图)显示了收集到的结合亲和力所选药物的靶标,将其分为不同的类别(如KD、IC50、Ki和EC50)。显示的目标使用一组默认过滤器进行预过滤。你可以通过点击“筛选”按钮来改变药物/目标交互筛选对话框中的默认筛选。
    DrugTargetsTableView
    药物靶标表视图
    药物-靶相互作用过滤器
    在Drug targets表视图中,可以选择一个交互,点击“view Details”按钮,可以查看所选交互的详细信息。在详细信息视图中,您可以通过点击超链接来浏览原始pubmed的实验证据、靶标的基因卡条目或谷歌药物。
    癌症药物互动细节视图
    您还可以通过单击“覆盖目标到路径”来选择表中的多行来执行路径浓缩分析。看通路富集分析有关路径富集分析结果的详细信息。
    药物靶标图视图(下图)提供了一个分段的柱状图,显示了所选药物与其所有靶标之间的证据支持的相互作用,在一个图形视图中显示了主要靶标和次要靶标。
    DrugTargetsPlotView
    药物靶点图
  3. 在途径图中查看癌症药物:癌症药物可以直接叠加到显示的路径图使用弹出菜单,“获取癌症药物”,在通路关系图视图.获取的癌症药物显示在路径图中,与包含显示药物靶点的实体相链接。
    提取抗癌药物
    药物通路图
    注:使用弹出菜单“Filter Drugs”调整过滤器,在路径图视图中选择药物和相互作用;使用“移除叠加的相互作用”来移除显示的药物;您可以在路径图中选择一个显示的实体,然后使用弹出菜单“获取癌症药物”只显示针对所选实体的药物。

    要查看显示的药物与其靶标实体之间相互作用的详细信息,请选择链接并使用pupup菜单“Show Details”打开药物靶标视图。
    查看详细信息
  4. 执行系统路径影响分析:在癌症药物列表表(见上面),您可以通过选择“运行路径影响分析”按钮,对所有具有实体级别视图的Reactome路径执行路径影响分析。分析完成后,影响结果显示在Cytoscape table Panel中所选药物的表格中。下面是伊马替尼的结果示例:
    PathwayImpactAnalysisTable
    路径影响分析结果
    笔记:您可以使用弹出式菜单“在图中查看”打开路径图,并使用结果表中的“导出表”菜单将表格导出为文本文件。

在FI网络中想象癌症药物

Reactome FI网络提供了一个基于网络的蛋白质/基因视图,其中每个基因/蛋白质只显示一次。在FI网络环境中可视化癌症药物显示了癌症药物和它们的靶标之间的简化关系。在FI网络视图,使用弹出菜单“Reactome FI/Overlay Cancer Drugs/Fetch Cancer Drugs”,加载FI网络中显示的蛋白质/基因的癌症药物。装载的药物以及药物与蛋白质/基因之间的相互作用分别呈现在绿色菱形和蓝色边缘。

在FI网络中获取癌症药物
在FI网络中显示药物靶标


笔记:要移除FI网络视图中覆盖的药物,使用弹出菜单“Reactome FI/Overlay Cancer drugs / remove drugs”;就像在路径图视图中一样,你也可以通过使用“Filte Drugs”弹出菜单来应用过滤器;要查看药物和靶点相互作用的详细信息,请选择边缘,然后使用弹出菜单“Reactome FI/Show drug / target interaction details”。(您可能需要放大所选的边缘。)

可视化DrugCentral药物

在DrugCentral中收集的可视化药物与在cancer Targetome中收集的癌症药物类似。您可以使用弹出菜单“查看DrugCentral药物”路径树中列出所有药物DrugCentral数据库中收集,“获取DrugCentral药物”弹出菜单路径图视图中覆盖药物途径,或“ReactomeFI /覆盖药物/取回DrugCentral药物”覆盖药物到FI网络在网络视图。

模拟药物对通路活性的影响

将抗癌药物叠加到Reactome通路及其FI网络中,有助于用户了解药物应用对通路活动和网络行为的潜在影响。然而,药物在途径上的实际干扰可能要复杂得多。进行路径模拟可以帮助用户了解实际影响。ReactomeFIViz实现了帮助用户执行基于布尔网络的药物模拟的功能。在你做药物模拟之前,请阅读部分布尔基于网络的路径分析第一。在本节中,我们将使用路径HDR通过同源重组(HR)或单链退火(SSA)以药物伊马替尼为例(注:要获得以下截图,请打开此通路的图表,然后使用名称过滤器获取癌症药物并将药物过滤到伊马替尼)。

骆matinib在路上
  1. 建立新的药物模拟:在路径图视图中,使用弹出菜单,“运行逻辑模型分析”。在“新建模拟”对话框中,输入仿真的名称(例如iMtatinib)和默认值,然后选择常规逻辑模型仿真中的AND门的模式。要执行药物模拟,请选择“药物应用程序”选项卡和“药物数据源”,然后单击“...”按钮以显示“药物选择”对话框。
    笔记
    :您需要调整药物过滤器以显示IMatinib的所有目标,如下屏幕截图所示。基于癌症药物及其目标之间的相互作用的收集注释,将选择默认修改类型(如预期,其中大部分是抑制)。根据我们的聚合药物/目标数据库收集的亲和力,预先配置修改强度。
    伊马替尼BN模拟
    iMatinib BN仿真II

    选择模拟BN的药物

    注:由于伊马替尼与CHEK1或CDK2之间的相互作用没有亲和性,CHEK1和CDK2在新模拟对话框中没有列出。勾选“Filter members in sets to drug targets”将选择EntitySet实例中被drug靶向的成员,强制显示药物引起的潜在路径影响。
  2. 用药物进行模拟药物选择对话框中的药物配置将被复制到结果面板中显示的布尔网络配置表中。点击“模拟”按钮进行模拟。模拟完成后,路径图中的实体根据吸引子中的值用不同的颜色突出显示,详细的时间值显示在表面板底部的表格中。
    伊马替尼BN设置

    伊马替尼BN的结果
  3. 调查对途径活动的药物影响:要查看药物对通路活动的影响,在不应用癌症药物的情况下执行另一个布尔网络模拟(此处为默认值)(详情请参见布尔基于网络的路径分析).“HDR through homoologous Recombination (HR) or Single Strand退火(SSA)”路径默认初始配置的逻辑模型仿真结果截图如下:
    HDR到HR或SSA默认结果

    要查看药物对通路中显示的实体的活性的影响,选择该实体并在BN:Default和BN:Imatinib表中检查其时间行为。例如,以下是一个与ABL1相关的复合物(见上面的截图)(向上为应用伊马替尼,向下为默认无药物):
    imatinib一个变量

    默认的一个变量

    您还可以使用“比较”按钮检查计算机上的吸引子的详细差异。
    p-S456-ABL1值

    笔记:从以上比较来看,我们可以看到伊马替尼的应用会显着影响HDR中复合物的形成,其他人报告了伊曼尼替米特对DNA修复途径的影响(例如,伊马替尼(STI571)在BCR / Abl表达白血病细胞中诱导DNA损伤,但不在正常淋巴细胞中).由于ReactomeFIViz新版本中路径注释的更新,您可能会看到一些不同的模拟结果。

执行scRNA-seq数据分析和可视化

ReactomeFIViz实现了一套功能,用户可以进行scRNA-seq数据分析和可视化。为此,我们将几个为scRNA-seq数据分析和可视化开发的流行Python包打包成一个Python独立应用程序。这些包包括scanpy用于例行的scRNA-seq数据分析和可视化scvelo.用于基于RNA速度的数据分析和可视化。
笔记对于scRNA-seq数据分析和可视化,您需要在计算机上安装Python 3.7。如果您还没有在计算机上安装Python,您可以通过从https://www.python.org/downloads为你的电脑。我们只测试了Python 3.7,因此建议您使用3.7来实现这些特性。但是,您不需要从ReactomeFIViz独立安装我们的独立Python应用程序。当需要时,ReactomeFIViz将自动下载和更新应用程序,只要你指向正确的Python应用程序路径(即目录和应用程序文件)。

标准分析通过Scanpy

  1. 建立分析:Python包,scanpy,为SCRNA-SEQ数据提供一组强大的分析和可视化功能。ReactomeFiviz为用户提供了这些功能,以利用Cytoscape提供的途径和网络分析和可视化设施,并特别是FRETMEFIVIZ。要使用Scanpy进行SCRNA-SEQ分析,请选择菜单应用/反垃圾(FI /单单元分析/分析以获取配置窗口,如下所示:
    scRNA-seq分析配置
    scRNA-seq分析配置
    ReactomeFIViz支持小鼠和人类生成的scRNA-seq数据。您应该为您的数据选择种类和格式。如果您的数据是10x-Genomics-mtx格式的,您应该选择包含该格式文件的目录。你可以检验一种归罪方法。目前,ReactomeFIViz支持魔法方法。你也可以检查total_counts和/或pct_counts_mt退出控制不需要的变化。
    笔记:所有分析步骤及其参数都已登录到Cytoscape配置/ReactomeFIViz/ReactomeFIViz.{date}。请登录您的用户文件夹以供查看。
  2. 为ReactomeFIViz配置Python:如果您尚未这样做,则会要求您使用以下配置对话框设置用于ReactOmeFiviz的Python,当ReactomeFiviz下载Factome Python应用程序以进行SCRNA-SEQ数据分析和可视化时,请使用以下配置对话框设置Python。
    设置Python
    设置Python
    笔记当前只支持Python 3.7。
    ReactomeFiviz使用SCANPY提供的功能进行预处理,归一化,UMAP分析,单元格聚类和除普通之外的所有其他SCRNA-SEQ分析,由其处理魔法,如果检查过。请参阅Scanpy文档中的详细信息:https://scanpy.readthedocs.io/en/stable/api/index.html.对于这些函数使用的参数,请打开ReactomeFIViz.{data}.log文件(见上面)。
  3. visuzlize细胞网络:根据样本量和计算能力的不同,可能需要几分钟才能完成分析。之后,两个网络,一个用于细胞集群,另一个用于单个细胞,显示在Cytoscape中,并分别列在左侧Network选项卡的“SingleCellClusterNetwork”和“SingleCellNetwork”下。
    ScRNA-seq集群网络
    ScRNA-seq集群网络
    SCRNA-SEQ单元网络
    SCRNA-SEQ单元网络
    笔记:您可以使用内置的Cytoscape样式功能和其他配置属性来调整这两个网络的渲染。单击菜单帮助/用户手册,请参阅Cytoscape的用户手册。要在网络中显示或隐藏边缘,请使用弹出菜单垃圾文件FI / SHOW边缘(见下面的屏幕截图)。小区群集网络中的群集基于由群集中的单元格号排序的单元格群集的等级命名。例如,Cluster0具有最多的单元格。
  4. 分析scRNA序列数据要探索加载的scRNA-seq数据并进行进一步的分析,您可以使用cell cluster或single cell network视图中提供的弹出菜单,如下所示:
    ScRNA-seq标准分析弹出菜单
    ScRNA-seq标准分析弹出菜单
    • 负载基因表达:将基因覆盖在网络上的表达式值。单击此菜单后,您可以从“输入”对话框中输入基因名称。
      笔记:细胞集群使用集群中细胞的中位数为基因表达和细胞特征着色(下图)。
    • 负载细胞特性:通过选择子菜单覆盖细胞特征,例如,n_genes(总基因),n_genes_by_counts(总基因有计数),total_counts, total_count_mt(线粒体基因),pct_counts_mt(线粒体基因百分比),和leiden(基于莱顿算法)。
      笔记:Cell Cluster Network和单个单元网络都基于在分析后呈现时的leiden聚类结果而着色。要返回orignal颜色,请选择Load Cell Feature / Leiden。
    • CytoTrace分析:根据每个细胞检测到的表达基因数量,进行细胞trace分析,预测细胞的差异状态。ReactomeFIViz提供了基于发布于https://cytotrace.stanford.edu.关于CytoTrace的详细信息,见论文原文:单细胞转录多样性是发育潜力的标志.你可以在CytoTrace的网站上找到更多信息:https://cytotrace.stanford.edu
      笔记:分析可能需要几分钟。分析之后,将根据预测的在0和1之间的差异状态值对单元格着色:0表示分化程度最高(黄色),1表示分化程度最低(蓝色)。分析结果缓存在ReactomeFIViz中,并在底部节点表中名为“cytotrace”的新列中列出。当您在分析之后再次选择此菜单时,结果将被覆盖,而不需要执行另一个分析。一个名为“细胞追踪”的新菜单项将被添加到“加载单元格功能”弹出菜单中,这样你就可以直接加载这些结果。
      笔记:在分析之后,您可能不会看到这个菜单项。尝试切换到另一个网络视图,然后返回来刷新菜单项。
    • 扩散伪时间分析(DPT):基于网络扩散进行细胞轨迹推断。具体算法请参见scanpy.tl.dpt及原始论文:PAGA:图抽象通过单个单元的拓扑保持图来协调聚类和轨迹推断.为了进行这种分析,需要一个细胞的id,它应该被视为轨迹的根。如果你知道这个单元格是什么,你可以直接在下面的对话框中输入它。如果您不知道根是什么,但知道根可能驻留在哪个集群或集群中,则可以在第二个文本字段中输入集群。ReactomeFIViz将尝试根据您指定的集群为您推断一个可能的单元根网页排名.有关小区根推理算法的详细信息,请参阅infer_cell_root
      为DPT配置单元根
      为DPT配置单元根
      笔记:如果你不知道细胞根是什么,你可以尝试几种方法。如果您已经进行了CytoTrace分析,您可以选择具有最大的CytoTrace值的单元格作为单元格根。你也可以尝试有最大数量的检测基因作为根进行探索数据分析。要选择用于推断细胞根的细胞簇,应该选择具有最大的CytoTrace值或基因数的细胞簇。如果您在上面对话框中的两个文本字段中都输入了值,那么第一个文本字段中的值将被用作单元格的根。
      DPT分析后,将根据DPT值(范围从0到1)对单元格进行着色,其中0为轨迹中最早的单元格(黄色),1为最晚的单元格(蓝色)。一个名为“dpt_伪时间”的新列将添加到底部的节点表中,“dpt_伪时间”将注册为“称重传感器功能”弹出菜单下的新项目,以便加载,而无需重复分析。
      笔记:在分析之后,您可能不会看到这个菜单项。尝试切换到另一个网络视图,然后返回来刷新菜单项。
    • 差异表达分析:在一个细胞簇(组)和另一个细胞簇或所有其他细胞簇之间进行差异基因表达分析t-test_overestim_var. 要进行此分析,首先需要选择两组单元格:基于聚类结果进行分析的单元格组和作为参考的另一组。您可以选择其他单元格群集或所有其他单元格作为参考。
      选择细胞组进行差异表达分析
      选择细胞组进行差异表达分析
      差分表达式分析结果如下表所示。你可以通过点击“添加”按钮选择一个或多个筛选器来筛选表中显示的基因。点击“Build FI network”按钮,为表格中显示的筛选基因创建一个FI网络。要进行途径富集分析,可以选择Binomial_test或GSEA.Binomial_test将使用筛选后的表中显示的基因,而GSEA分析将使用按分数排序的基因,包括表中没有显示的基因。
      差异表达分析结果
      差异表达分析结果
      笔记:由所选基因构成的固定网络中的基因基于基因分数着色。有关如何使用FI网络功能的详细信息,请参阅基因/突变分析.当显示网络视图时,您可以打开路径图。要回到以前的网络视图,请关闭所有显示的路径图,然后在左侧控制面板的“网络”选项卡中选择网络。根据黑豹的同源映射文件,从人类路径预测小鼠路径。更多细节,请参阅:在Reactome中的推断事件.利用所提供的映射文件,从人体功能交互网络中预测出鼠标人体功能交互网络MGI,请使用此链接下载:http://www.informatics.jax.org/downloads/reports/HOM_MouseHumanSequence.rpt.可以将一种人类基因映射到多个小鼠基因。因此,鼠标FI网络可以显示用多个鼠标基因注释的节点。例如,请参见下文:原始人为KLK3映射到KLK1B9,KLK1B21和许多其他人,它们都列在底部的节点表中,并在网络视图中作为该节点的标签。目前在FI网络点中链接到人类基因(例如Genecard)中的这些节点。
      一个人类基因映射到多个小鼠基因
      一个人类基因映射到多个小鼠基因
    • 建立监管网络:推断一个或多个细胞簇的转录因子(tf)和它们的靶标之间的潜在基因调控网络。这种方法受到邱等人的启发利用Scribe从耦合单细胞表达动力学推断因果基因调控网络.然而,目前ReactomeFIViz提供的实现使用时滞基因共表达来推断转录因子与其靶标之间潜在的因果关系,而不是“限制性定向信息(restricted directed information, RDI)”,并限制了基于TF/target相互作用的转录因子与其靶标之间的因果关系搜索多萝西娅.要执行此分析,请在以下对话框中设置参数:
      基因监管网络Infernece设置
      基因调控网络推断装置
      笔记:您可以选择Spearman、Pearson或Kendal进行基因表达相关性计算。细胞时间类型为latent_time, velocity_pseudotime, cytotrace或dpt_pseudotime,这些都是在轨迹推断过程中计算的细胞属性。前两种类型是在RNA速度分析期间生成的(见下文)。如果ReactomeFIViz找不到任何这些变量,您将被要求首先执行dpt_pseudotime分析。利用时滞进行延迟基因共表达计算。例如,一个TF的表达为[1,2,3,4,5,6,7,8,9,10],其中一个靶点的表达为[11,12,13,14,15,16,17,18,19,20]。当时延= 4时,计算[1,2,3,4,5,6]与[15,16,17,18,19,20]之间的相关性。以上对话框中的时间延迟为最大时间延迟。因此,如果输入时间延迟7,则实际用于相关计算的时间延迟值为[1,2,3,4,5,6,7]。相关性计算7次,并使用计算出的相关值的最大值。 For the cell groups, you may choose all, one of cell clusters, or multiple cell clusters (hold the command key under Mac or the control key under Windows).
      计算所有TF /目标交互的相关性可能需要几分钟,然后构建监管网络。以下是显示最终基因监管网络的样子:
      部分基因调控网络
      部分基因调控网络
      笔记:为渲染生成的基因监管网络创建一个称为“监管网络样式”的样式。有了这种风格,TFS呈现为钻石,而他们的目标是圆圈。原本的多萝西娅相互作用提供注释:->激活和-|抑制。红色为正相关,蓝色为负相关。计算的相关性可能与多萝西娅的原始注释不匹配。例如,在上图中,一个TF和它的一个靶标Scg3之间的相互作用被注释为抑制。然而,实际计算的斯皮尔曼相关性是正的。边宽与绝对相关值成正比。您可以在Cytoscape中调查这种样式以获得更多信息。
    • 项目新数据:将另一个数据集投影到显示的网络上。该特性使用摄取函数在scanpy中集成一个新的数据集到用于生成网络的数据集上,显示新数据集中的单元格可以映射到显示的网络。要执行此分析,请在以下对话框中输入数据文件:
      项目新数据配置
      项目新数据配置
      笔记:您无法在此对话框中选择此方法。预计应该使用相同的方法将新的数据集投射到现有网络上。投影之后,在“Project new Data”菜单下添加了一个名为“Toggle projection Data”的新弹出菜单,用于切换投影单元格的显示。下面两幅图显示了一个新数据集投影之前(左)和之后(右)的单元网络。如图所示,新数据集中的大部分细胞被投影到细胞簇上,在中间和右上区域以绿色、鲑鱼色和玫瑰色显示。
      之前的预测 后将
    • 保存分析结果:将所有的分析结果保存到本地文件中h5ad格式。保存的文件可以使用主菜单,Apps/Reactome FI/Single Cell Analysis/Open打开。

通过scVelo进行RNA速度分析

RNA速度分析是一种强大的方法,基于未剪接和剪接mRNA形式之间的计数比率定量模型的基因mRNA转录的动态行为(La Manno等人2018年).scvelo.提供了Python中原始方法的增强实现。ReactomeFIViz包了scVelo,您可以使用图形用户界面在Cytoscape中进行分析,而无需使用脚本。有关RNA速度和scVelo的更多信息,请参阅scVelo的原始文档:https://scvelo.readthedocs.io

  1. 建立分析:在下面的scRNA-seq分析动作对话框中,选择“RNA速度分析通过scVelo”作为方法,并选择一种RNA速度模式。要了解对话框中列出的三种模式之间的差异,请参阅scVelo原始纸,通过动态建模将RNA速度推广到瞬时细胞状态.违约是“随机的”。然而,如果你想获得更多的动态信息,选择“dynamic”。关于动态模型可以做什么,请参见用scVelo进行动态建模.该分析所需的数据文件应通过使用Velocyto或Loompy / Kallisto管道进行预处理,并包含两个矩阵,用于更换和拼接丰富。有关如何开始的更多信息,请参阅此Scvelo教程:入门
    RNA速度分析配置
    RNA速度分析配置
  2. 可视化RNA速度分析结果:根据你选择的模式,可能需要一段时间来进行RNA速度分析。结果与使用scanpy的标准分析结果相同,但单细胞簇网络显示为有向的、加权的网络,其方向与基于的推断轨迹中的时间相对应PAGA单元群之间连接的方法和权重。下图展示了这种加权的、有向的小区集群网络的示例。
    RNA速度簇网络
    RNA速度簇网络
    笔记预期你会从RNA速度分析中看到不同于标准分析的结果。
  3. 分析RNA速度结果: RNA速度分析生成的显示网络的大部分分析特征与scanpy标准分析的相同。然而,RNA速度分析提供了比标准分析更多的细胞特征,如下所示的弹出菜单:
    RNA速度细胞特征
    RNA速度细胞功能弹出菜单
    笔记:要了解这些RNA velocity特定细胞功能的含义,请参阅原始scVelo教程:scVelo教程.除了上述RNA速度特定的小区特征外,还会为您添加新的弹出菜单组,以进行一些RNA速度特定的数据分析和可视化,如下所示:
    RNA速度弹出菜单
    RNA速度弹出菜单
    笔记参考scVelo教程的嵌入,嵌入网格,嵌入流和基因速度:RNA速度基本知识.ReactomeFIViz利用scVelo的可视化特性为这些图形生成图像文件,然后自动打开它们。为了保存这些文件,您可能需要将它们保存到指定的文件中。否则,当您关闭Cytoscape时,它们将被自动删除。
    • 排名速度基因:使用scVelo的rank_velocity_genes功能,基于差异表达分析对单个细胞簇中的基因进行排序:rank_velocity_genes..从这个分析中返回的个体集群的前250个基因如下图所示。您可以使用二项测试进行途径富集分析,或为选定的细胞簇构建FI网络。
      RNA速度秩基因表
      RNA速度秩基因表
      笔记:您可以过滤表格中显示的基因。然而,在进行通路富集分析或构建FI网络时,需要使用选定细胞簇的所有250个基因。
    • 等级动态基因:如果您选择RNA速度分析的动态模式,您还可以进行“动态基因排名”。此功能基于scVelo功能,rank_dynamical_genes.其输出和功能与“秩速度基因”相同。

FI网络相关的其他特性

查询FI源

选择一条边,右击它,得到弹出菜单的边。选择一个名为“还原FI/查询FI源”的菜单。如果FI是从经过策划的途径或反应中提取出来的,则会显示原始数据源的对话框。双击显示表格中的一行,显示FI来源的详细网页。如果所选的FI是预测的FI,则应显示该FI的证据。

查询FI源
ReactomeFIViz应用程序菜单

获取节点的FIS

可以查询一个节点的所有FI。在“网络”面板中选择一个节点,然后右键单击它以获得节点的弹出菜单。选择名为“Reactome FI/Fetch FIs”的菜单。选定节点的FI合作伙伴将分两部分显示:合作伙伴已显示在网络中,合作伙伴未显示在网络中。您可以从第二部分中选择合作伙伴以展开显示的网络。

查询节点FIs
显示节点FIs

显示路径图

路径图可以显示路径命中。在“网络中的路径”或“模块中的路径”选项卡中选择一条路径,然后右击就会弹出路径菜单。从弹出菜单中选择“显示路径图”

显示路径图

.如果从kegg导入路径,则Kegg路线图页面将在浏览器中显示,其中“节点”列中列出的节点基因(以红色突出显示(用于文本和路径图中的边界)。如果途径来自反应组或其他非KEGG数据库,则应在分离的窗口中显示路径图。如果通过反应项目策划途径,则应显示人为布局图。否则,应显示自动化图。来自显示的网络的基因或蛋白质应以蓝色突出显示。可以使用名为“View Instance”的弹出菜单查看图窗口中显示的节点和反应的详细注释。使用窗口底部的缩放滑块可以放大/输出显示的图表。可以通过右上角的概述窗口进行图表。

Kegg侧重粘附
PDGF的反应体信号转导

负载癌症基因索引注释

Reactome FI插件可装载NCI癌基因注释索引用于网络中显示的基因/蛋白。有两种方法可以展示这些注释:在没有选择对象时使用称为“Load Cancer Gene索引”的弹出菜单(左图),并为所选节点(右图)使用另一个弹出菜单“获取癌症基因索引”。

负载基因指数
负载节点癌症基因指数


通过使用第一种方法,用户可以加载NCI疾病的树,并在左侧面板中显示树。用户可以在树中选择疾病术语,所有基因或蛋白质已经注释为选定的疾病,其子项将被选中。

癌症基因指数覆盖

通过使用第二种方法,用户可以查看所选基因或蛋白质的详细注释。用户可以根据PubMedID、Cancer类型和注释状态对这些注释进行排序,还可以根据几个标准过滤注释。

节点的癌症基因索引注释

生存分析

生存分析是基于服务器端R脚本进行coxph或Kaplan-Meier生存分析。要进行生存分析,应该提供一个至少包含三列的以制表符分隔的文本文件。三列的名称应该是:Samples、OSDURATION和OSEVENT。例如,请查看下载的生存信息文件van de Vijver等人的研究nejm_clin_simple.txt.txt.,为了便于分析,它已经被简化了。要进行生存分析,请使用弹出菜单“分析模块功能/生存分析…”(见下文)

生存分析菜单

在生存分析对话框(下图)中,双击文本字段,选择包含用于构建所显示的FI子网络的样本生存信息的文件(注意:如果仅使用基因集文件构建所显示的FI子网络,则无法进行生存分析)。你可以选择coxph或Kaplan-Meier模型进行生存分析。如果选择Kaplan-Meier模型,则必须选择一个模块进行分析。在kaplan meier分析中,所有样品将被分为两组:样品没有突变基因在选定的模块(组1)和样品在模块突变基因(组2)。建议先运行coxph模块没有选择任何模块为了看哪个模块最重要相关生存时间。之后,您可以专注于生存分析的一些特定模块。

生存分析对话框

生存分析的结果将显示在右侧的结果面板中,标签为“生存分析”(左下)。你可以做多个生存分析。服务器端R脚本返回的所有结果将显示在这个面板中,并根据生存分析对话框中的参数选择显示标签。最后一个结果将被选择为默认结果。对于每个分析,结果面板中最多显示三个部分:Output、Error和Plot。如果分析没有返回警告或错误,则错误部分可能不会显示。coxph(所有模块)分析中p值小于0.05的模块的行以蓝色显示,并带有下划线。您可以单击这些模块来进行快速的基于单模块的生存分析,而不需要执行上述步骤。基于单模块的Kaplan-Meier分析将显示一个plot文件。您可以单击该文件以查看实际的图(右下)。 You may need to save the plot file for your future use.

生存分析结果

kaplan meier生存情节

引用我们!