探“云”指南 | 科学与美观:花瓣图操作指南_分组_文件_基因

对于集合的可视化,大家可能首先想到的是veen图,在集合不超过5个的时候,可视化效果不错,但是一旦数据集增加,就很难从图中解读出想要的信息了。当表示超过5个数据集之间的包含关系时,我们常用UpSet图或者花瓣图,花瓣图的外形美观,展示信息又很直观,所以常用它来进行数据分析和可视化。下面就请跟随我一起学习使用欧易云平台新上线的花瓣图小工具吧!

功能介绍

当我们想看数据集之间的包含关系且数据集超过5组时,常需要绘制花瓣图,我们能够在花瓣图中看到两种信息:一是所有样本共有的信息;二是每个样本独有的信息。

文件要求

01

基因表达文件

第一列为基因或特征名称,随后为样本名称,样本名称各列对应值为表达量。(支持txt、xls、xlsx、csv 格式)。

图1 | 基因表达文件格式示例图

02

基因筛选文件

第一行为样本名称,样本名称各列对应值为筛选出的基因名。(支持txt、xls、xlsx、csv 格式)。

展开全文

图2 | 基因筛选文件格式示例图

03

样本分组文件

第一列为样本名称,第二列为样本所在的分组名称。(支持txt、xls、xlsx、csv 格式)。

图3 | 样本分组文件格式示例图

参数调整

01

主要参数

图4 | 主要参数

02

常用参数

图5 | 常用参数

作图步骤

01

上传文件

1.基因表达文件

①请于主要参数中的数据文件处上传您所要进行分析的基因表达文件,如果此处未上传文件,您将无法得出结果。上传成功后,将会于“选择文件”后显示您上传的文件名;

此处为上传成功示例:

图6 | 基因表达文件上传成功示例

②文件类型处请选择“基因表达文件”;

③如果您要进行分组分析,请于常用参数中的分组文件处上传对应的分组文件。上传成功后,将会于“选择文件”后显示您上传的文件名。如果您不需要进行分组分析,未上传分组文件,小工具将默认每个样本各为一组进行花瓣图的绘制;

此处为上传成功示例:

图7 | 分组文件上传成功示例

2.基因筛选文件

①请于主要参数中的数据文件处上传您所要进行分析的基因筛选文件,如果此处未上传文件,您将无法得出结果。上传成功后,将会于“选择文件”后显示您上传的文件名;

此处为上传成功示例:

图8 | 基因筛选文件上传成功示例

②文件类型处请选择“基因筛选文件”;

③如果您要进行分组分析,请于常用参数中的分组文件处上传对应的分组文件。上传成功后,将会于“选择文件”后显示您上传的文件名。如果您不需要进行分组分析,未上传分组文件,小工具将默认每个样本各为一组进行花瓣图的绘制;

此处为上传成功示例:

图9 | 分组文件上传成功示例

*说明:基因筛选文件可直接用于UpSet图

02

调整其他参数

常用参数中的其他参数均为默认数值,您可根据自己的需求进行修改,点击“重置”则包括文件在内的所有参数全部清空。

①图片格式:默认为pdf类型,其他类型有png,可接受默认设置或在下拉菜单中选择png格式。如果您选择png格式,点击“结果下载”,所得文件仅有一张png格式的图片;如果您选择pdf格式,点击“结果下载”,所得文件包含pdf、png两种格式的图片。不论您选择何种图片格式,都会有png格式的图片直接显示在右侧工作区;

②配色方案:平台共提供8种配色方案,包括多种期刊配色供您挑选,其中默认配色1是原DNA业务线花瓣图配色方案,默认配色2是原RNA业务线花瓣图配色方案,只有8种颜色,超过则重复配色;

③字体类型:默认为Arial,其他类型有Times、Verdana,可接受默认设置或在下拉菜单中选择其他格式;

④是否显示图例:默认为“是”,可接受默认设置或在下拉菜单中选择“否”;

⑤是否显示标签:即花瓣外围样本标签,默认为“是”,可接受默认设置或在下拉菜单中选择“否”;

⑥字体大小:大于0,按倍率调整,可接受默认设置或自定义输入。

03

最终提交

所有参数设置成功后点击“提交”,在主要参数界面或常用参数界面点击等效,您只需在任意界面点击一次即可,右侧工作区将提示您所需时间。

如图所示区域:

图10 | 工具预估耗时提示处

结果分析

01

结果展示及下载

分析结果图将会在此处展示,您可以点击左上角的“结果下载”将结果保存至本地。

图11 | 结果展示处

结果下载成功示例:点击“结果下载”您将会得到如下压缩包,您所得压缩包名称与下面示例名称不同为正常现象。

图12 | 结果下载成功示例

解压缩后得到以下文件:

图13 | 结果文件夹内容示例

02

结果说明

①基因表达文件结果:

每一片花瓣表示一个样本,标签为样本名,花瓣图中心数字为所有样本共有的基因数,花瓣上数字为各样本独有的基因数。

图例显示分组信息,颜色按照分组进行分配,此处展示图片为已上传分组文件时的情况,同一分组颜色相同,每组各为一种颜色。

图14 | 基因表达文件进行分组分析结果示例

此处展示图片为没有上传分组文件时的情况,默认每个样本各为一组,每组各为一种颜色。

图15 | 基因表达文件不进行分组分析结果示例

②基因筛选文件结果:

每一片花瓣表示一个样本,标签为样本名,花瓣图中心数字为所有样本共有的基因数,花瓣上数字为各样本独有的基因数。

图例显示分组信息,颜色按照分组进行分配,此处展示图片为已上传分组文件时的情况,同一分组颜色相同,每组各为一种颜色。

图16 | 基因筛选文件进行分组分析结果示例

此处展示图片为没有上传分组文件时的情况,默认每个样本各为一组,每组各为一种颜色。

图17 | 基因筛选文件不进行分组分析结果示例

历史记录

点击欧易集团云平台界面右上角的“登录”,您可以进行免费注册,用您注册的账号登录欧易云平台个人中心,在此之后使用云平台所有的小工具将会存有记录。您可以点击下图中的“历史记录”查看使用花瓣图小工具的使用记录,或点击右上角“个人中心”查看所有小工具任务记录。

图16 | 历史记录示例

常见FAQ

请问数据集少于5个时可以使用花瓣图吗?

您好,首先感谢您的咨询。当数据集少于5个时不可以绘制花瓣图,您可以绘制veen图或UpSet图就能得到很好的效果。

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文