二维码

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

525 人阅读 | 时间:2023年02月08日 11:35

GEOexplorer数据库

基于GEO数据库的基因表达分析及可视化功能数据库

嗨,小伙伴们大家好!你是否曾有因为没有GEO2R不会R而面对海量数据无从下手的尴尬?你是否曾因为不是肿瘤领域无可用数据库而郁郁寡欢?时常听到小小伙伴们叹气说“曾经有一份真香的数据摆在我面前但我不会分析,等我意识到不会R的痛的时候才后悔莫及,尘世间最痛苦的事情莫过于此,如果上天能够给我一个再来一次的机会,我一定会对自己说: 学好R!学好R!学好R!”哈哈~!不过大家也不要太过沮丧了,新的一周带大家学习一款基于GEO数据库的基因表达分析及可视化功能数据库,GEOexplorer,顾名思义,帮你解决那些年因学R偷的懒而错过的美好数据集,一起来看看吧~!

期刊信息

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

数据库概览

GEOexplorer数据库(https://geoexplorer.rosalind.kcl.ac.uk/)于2022年5月份发布在Nucleic Acids Research杂志,基于GEO数据库芯片和RNA-seq数据或者上传个人数据集,提供探索性数据集分析、基因表达差异分析和功能注释及可视化等功能,产生丰富的交互式可视化结果,无需要编程即可产出发表级图表,为生命领域研究人员尤其是缺乏生物信息学技能的研究者高效利用公共数据集挖掘重要信息提供极大便利。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

菜单栏Tutorial部分提供数据库介绍及详细的数据库使用指南。其中Introduction部分可见数据库提供以下功能: 数据集检索、数据集探索性分析、多个数据集整合及批间差校正、基因表达差异分析、差异基因功能富集和可视化等。除在线网站之外,用户还可以选择安装GEOexplorer R包进行基因表达差异及功能注释相关分析。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

数据库核心功能及操作演示

1

GEO Search功能

GEO Search功能模块支持以关键词检索感兴趣的数据集或样本,以哮喘(Asthma)为例,结果显示相关数据集或样本有14464个,结果界面不大方便进行数据集筛选,因此这个功能略显鸡肋,大家仍旧可以在GEO检索到感兴趣的数据集之后,再来借助GEOexplorer数据库进行后续系列分析。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

2

据分析功能

借助GEOexplorer数据库进行数据分析有四步:(1)Dataset Information,查看数据集基本信息;(2)Exploratory Data Analysis,探索性数据分析;(3)Differential Gene Expression Analysis,基因表达差异分析;(4)Gene Enrichment Analysis,基因富集分析。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

单个数据集分析

首先,检索并加载目标数据集。在GEO Search检索目标数据集并点击load加载,或直接在数据分析功能页面选择单个数据集、选择芯片或测序数据、输入目标数据集及平台号,以GSE4302为例,点击Analyse提交分析任务。注意如果是RNA-seq数据需要判断是否需要log转换,简单的办法就是看基因表达谱是否有小数,如果有则已经过log转化,则不建议用GEOexlporer继续分析。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

1)Dataset Information:数据集基本信息

Experiment Information提供GSE4302数据集基本信息,我们看一下Abstract可以了解作者做了什么工作;Experimental Conditions Information提供样本及其分组信息;Gene Expression Dataset为基因表达谱。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

2)Exploratory Data Analysis:探索性数据分析

事实上就是数据预处理和质控环节,重点关注Box-and-Whisker Plot、PCA Variables Plot和Heatmap Plot图,查看数据质量。箱图展示各样本均数不在同一水平,大概率是数据集尚未进行标准化处理;若PCA图分的比较开、热图按组别聚类,基本上数据质量可以,而本例样本太多导致PCA和热图很难辨别聚类情况。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

3)Differential Gene Expression Analysis:基因表达差异分析

点击Set Parameters设置参数:选择Group1与Group2纳入的样本进行比较,以基线哮喘和健康对照为例;再选择P值校正方法、是否强制标准化、是否应用limma vooma,及显著性水平截断值。在Tutorial部分有说明:对原始RNA-seq数据需要强制标准化和limma vooma处理,对芯片数据如果在前述箱图展示样本均线不齐、组间差异比较大或是密度图密度曲线不呈正态分布时,建议强制标准化和进行limma vooma处理。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

点击Analyse获得表达差异分析结果:Top Differentially Expressed Genes表格展示Top表达差异基因信息;提供表达差异基因Volcano Plot和Heatmap Plot。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

4)Gene Enrichment Analysis表达差异基因富集分析

点击Set Parameters设置参数:选择Gene symbol列,双击空白处手动填补;选择需要分析的数据库。点击Ananlyse获得分析结果。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

查看富集分析结果,以表格和柱状图形式展示,鼠标悬停在柱子上可以查看具体基因、通路信息和P值。可以选择上调、下调或全部基因。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

两个数据集分析

同样的方法,检索并加载目标数据集。直接在数据分析功能页面选择多个数据集、选择芯片或测序数据、输入目标数据集及平台号,以GSE4302和GSE4302,其他参数默认,批间差校正的方法选择贝叶斯,点击Analyse。结果基本类似。

重点来看Exploratory Data Analysis,其中Expression Density Plot图、Box-and-Whisker Plot图、聚类热图和PCA图均显示出明显批次效应,即样本是按照批次进行聚类的而不是按照实验分组来聚类。因此上一步选择贝叶斯方法进行批次效应校正是有必要的。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

接下来的Differential Gene Expression Analysis和Gene Enrichment Analysis分析基本与前述类似,不再赘述。

3

上传数据准备

有些GEO数据集无法检索加载到数据分析功能模块,需要手动下载和整理。菜单栏处点击Example Datasets下载示例基因表达谱文件,Excel打开,即基因探针列+样本列,打开GSE4302表达谱,复制红框部分数据到示例文件中即可。

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

GEO多数据集联合,傻瓜式一站式分析~零代码也能搞定!

总结

GEOexplorer提供基于GEO数据集或上传个人数据集的探索性数据分析、基因表达差异分析和功能注释及可视化等功能,产生丰富的交互式可视化结果,无需要编程即可产出发表级图表,为生命领域研究人员尤其是缺乏生物信息学技能的研究者高效利用公告数据集挖掘重要信息提供极大便利。

以上就是GEOexplorer数据库全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下文献哦~!

生信分析全代码系列

multiMiR一 包搞定miRNA与靶基因预测问题

90%以上的审稿人比问!多个数据集怎么联合分析?看完就懂了!

90%生信返修都避不开的问题!小心你的SCI也有这个坑!

So easy!搞定数据质控,这三张图学会就够了!

Nucleic Acids Res 精选系列

1. 诺奖级表型数据库!申请国自然,你一定不能错过这个数据库!

2. 国自然没思路?这个表型数据库拯救你!凑前期的不二选择!

3. 多组学!还自带动物和临床实验!这个数据库可以封神了!做科研不可错过!来掘金了!

4. 热点中的热点!这个数据库能做好多高大上的分析!助你国自然开挂!

5. 嘘~才不只是灵光一现~国自然热点,我有这个检索秘籍!

6. 燃到炸!分子对接,分子间精细化调控,这个数据库都有!一个数据库搞定你国自然 !省你很多功夫!

7. 直接赞爆!这个热点表型+细胞交互数据库,让你国自然的Taste,直接秒杀同行!

8. 16+SCI力推!要说宝藏表型数据库,还得是它!

9. 今年国自然全靠它!单细胞一站式分析网站,懂得都懂!用就完了!

10. 高级感√ 17+SCI力推的数据库,轻松搞定国自然的分子调控部分!小白也能轻松掌握!

11. 今年被问最多的生信数据库!简单实用,国自然派的上用场!

12. 最新16+期刊力荐!只要一刻钟,你想要的 肿瘤miRNA分析都在这里!

13. 反复催的国自然设计加分亮点!我的这个宝藏数据库奉上了!

14. 17+SCI力荐!国自然不知道加分项怎么设计?先试试这个转录因子宝藏数据库再说~

15. 兼顾组织/细胞分析!还有网络和功能注释分析!这个数据库是宝藏!巨实用!

16. 绝了!药物应答和耐药两大分析刚需,这个数据库点点点就能解决!17+核酸杂志力荐!

17. 送你份情人节礼物!今年发高分就靠这个宝藏单细胞组学数据库了!建议收藏!

18. 巨好用!想研究铁死亡,这个数据库你不得不借鉴!

19. 百搭新玩法!超实用的肠道菌群数据库,你注定能用上!

20. 肠道菌群研究的不要错过!这个数据库,让你轻松补上实验数据!任何疾病都适用!

21. 微生物和免疫两大热点联合分析!这个数据库绝了!都给我收藏起来!

22. 史上最牛的肠道菌群和代谢数据库!教到你会为止!

23. 真香预警!肠道菌群与疾病数据库,有事没事给文章加点料!

24. 告别土味分析!这个肠道微生物数据库超级实用!好用不难!研究药物、食物的看过来!

25. 炒鸡实用!小儿肿瘤研究的福音!用这个数据库就够了!应有尽有!

26. 一网打尽!400余种动物肠道微生物,用这个数据库就够了!

27. 单细胞多组学联合分析转录因子?百搭的宝藏数据库推荐给你!

LncRNA/CircRNA系列

lnRNA生信一站式分析神器!差异表达,临床分析,ceRNA网络都有了,还要啥自行车!

这个数据库能发Science! 这个翻译后修饰数据库悄悄推荐给你,低调使用!

单基因SCI套路必备必备!多组学,临床统计,掌握这一个数据库就够了!

临床研究必备!TCGA的兄弟数据库,一站式出图,还学啥R语言???!!!

肿瘤基因突变Biomarkers的药物研究神器—OncoKB数据库

肿瘤药敏及多组学研究好帮手-GDSC数据库,真香!好用到停不下来!

这里有瓜吃!LncRNA这么热,临床医生该怎么找课题~

小白实战课堂开课啦!手把手教你转录因子与靶基因预测操作~!

Harmonizonme和hTFtarget数据库:获取转录因子的候选靶基因

快上车!综合数据库footprintDB同时搞定转录因子与靶基因查询

KnockTF数据库,同时搞定靶基因预测、表达差异分析与可视化,不要太爽哦~!

外泌体这么热,与miRNA怎么搭讪呢?EVmiRNA帮你搞定前戏哦~

exoRBase数据库,miRNA/circRNA/lncRNA三美兼备,肿瘤和非肿瘤玩家这里都有哦~!

外泌体实验不会做,高质量文献不会找,EV-TRACK帮你搞定哦~!

像字典一样的分子功能注释查询,Vesiclepedia数据库给你不一样的体验

牵手外泌体和循环非编码RNA功能注释,这么神奇的miRandola不来了解一下嘛~!

儿科生信研究神器,这个儿童肿瘤样本数据库你一定能用上!

点到就是赚到,这款单细胞测序数据注释工具新鲜出炉,等你来挖掘呦~!

单细胞测序可视化神器,简单又高级,SCI和课题show起来!

躺赢玩法!这个数据库给单细胞分析开了外挂,瞬间让SCI高大上!

单细胞标志物一键式查询,CellMarker带你体验轻松科研新姿势!

好用到极致!这个单细胞可视化数据库,我一口气复现了三篇SCI文章美图!不费劲!

CNS级别SCI必备!这两款人、鼠单细胞图谱数据库,太硬核了!

太实用了!Nature级别单细胞数据库给你的SCI加个分!我被惊艳到了!

excuse me? 原来这个高大上的肿瘤微环境热点这么好蹭?10+SCI都爱它!也太太 太太酷了吧!

不是每个人都需要了解这个数据库,除非...

引药生变数据库系列传送门(完结)

1.厉害了!疾病和药物基因哪里找?这个数据库是你的课题思路之源!也太太太太太太实用了吧!

2.一站式搞定中药数据挖掘,生信分析里的万金油!靶点,基因,机制,疾病都有了!

3.药物和基因搞对象的全流程,全靠这个数据库?高分SCI的套路,1分钟搞定!

4.这次不挑疾病,真的!!!

5.夸到词穷!网药研究一条龙分析都有了!简单又实用!

6.研究药物的有福了!这个网药数据库还有这么强大的分析功能!堪称神器!

7.一刻钟内,最大限度提升SCI创新性!小白都能学会!

8.研究药的都能能用上!这个数据库太实用,比想象中更牛!

9.一站式搞定网药分析?发3+SCI就靠这个数据库了!

10.惊喜!10+SCI用这个数据库添彩,靶基因-药物预测,就靠它了!

11.超实用!比你还专业,用这个药物数据库,让你的基金和SCI瞬间开挂!

12.没想到吧?NCBI旗下的药物综合数据库,竟然还有这么多实用功能!给你的科研加个buff!

甲基化数据库系列传送门(完结)

1. 没想到这个数据库这么好用!国自然、SCI都能用得上!导师不明觉厉,直呼内行!

2. 今天文章重点:实用!(6-11分SCI都偏爱这个Style)

3. 有一说一,这个数据库太太太太惊艳了!值得安利!

4. 用上这个数据库,至少给你的SCI涨1分!屡试不爽,大神最爱!

5. 听说国自然评议专家都爱这个美图?16+SCI里频频出现?送你个必杀神器,助力你的科研!

6. 首发12+纯生信!这个数据库,我一用就爱上了!

7. 想给国自然加点料?不多说,用这个数据库来降维打击!

8. 甲基化+临床分析,你以为只能用R做吗?高分文章的图,你也可以跟着无脑复现!

9. 听说用这个数据库保底5+SCI?5篇文章复现给你看!进来捡宝贝啦!

10. 没想到吧?这些分子修饰的图,零代码就可以搞定!搭配10+SCI,那叫一个和谐!

11. 绝对有创新性!帮老板审了20份标书,发现这个热点研究,居然这个数据库就搞定了!?

12. 自从学会了这个数据库,分子修饰联合临床分析,这样高大上的图都用的飞起了!

13. 多组学+表观遗传+临床联合分析大杀器!用这个数据库就够了!绝对让你爱不释手!

14. 国自然标书里这个亮点设计你想到了没?用上这些美图的8成都中了!


©著作权归作者所有:来自ZhiKuGroup博客作者没文化的原创作品,如需转载,请注明出处,否则将追究法律责任 来源:ZhiKuGroup博客,欢迎分享。

评论专区
  • 昵 称必填
  • 邮 箱选填
  • 网 址选填
◎已有 6 人评论
×
×
本站会员尊享VIP特权,现在就加入我们吧!登录注册×
»
会员登录
新用户注册
×
会员注册
已有账号登录
×