做好 3 步!轻松利用免费公共数据发表自己的 SCI !
非原创 公号:丁香园神经时间 发布时间:2023-06-13 20:02 发表于浙江
原文地址:做好 3 步!轻松利用免费公共数据发表自己的 SCI !
🤔️想发一篇临床研究 SCI 需要付出多少时间呢?
看下图,一切顺利的话至少需要 10 个月,但科研不顺才是常规操作。
图片来源:根据丁香科研调研结果自己做的
但完全没有数据, 还需要做科研发文章,怎么办呢?
公共大数据挖掘
满足没数据还可以高效发文的愿望!教你如何 3 步搞定临床数据挖掘文章——
第一步 确定有没有适合自己的公共数据
目前比较热门的数据库有这些:NHANES、MIMIC、TCGA、GEO、SEER、Dryad 等,如何确定某数据库有没有适合自己挖的数据呢?
有个最简单的办法,去 PubMed 数据库检索「xx 疾病」AND「数据库」,例如:我想知道 NHANES 数据库能不能做认知功能障碍相关的文章,就搜「Cognitive impairment AND NHANES」。可以看到已经有 426 篇相关文献发表,这说明我肯定也能用这个数据库,只是得抓紧时间,毕竟大家都在挖!
图片来源:PubMed 官网检索截图
第二步 进行数据下载和整理
不同的数据库原始数据的存储和编码方式都有较大的区别,但好在这些数据库都会有详细的官方使用说明书,可以先详细研读后,再进行数据下载和清洗。
这里给大家提供一些数据库的说明地址。
-
NHANES 数据库:https://www.cdc.gov/nchs/nhanes/about_nhanes.htm
-
MIMIC 数据库:https://physionet.org/content/mimiciv/2.2/
-
SEER 数据库https://www.cdc.gov/cancer/uscs/technical_notes/contributors/seer.htm
只要找准数据库官网就一定有数据库使用说明,大家可以自行检索自己感兴趣的数据库哦~
第三步 进行数据分析与作图
研究的设计和统计分析方法与普通临床研究并无不同,可以做病列对照、队列研究以及横断面研究,只不过研究所用的原始数据来源于公共数据库。
因此拿到数据后,也是按照以下临床研究数据通用分析流程来处理:
单因素分析(可做 PSM)-多因素分析(可做交互作用)-模型构建
——广告
🔥丁香科研 618 特惠学
公共数据库挖掘课程全线优惠中
我知道对于新手小白来说以上三步看起来容易,但实操起来困难重重,那就需要良师引路,才能更快掌握方法,尽快投入到数据挖掘工作中来;公共数据库的数据就像一座金矿,挖得越早,越容易挖到宝!
NHANES 数据挖掘专场
NHANES 作为近期最火的数据库,收集有关饮食、营养状况和慢性病的全面数据。几乎可以满足 90% 以上临床科室的原始数据需求;目前涵盖 264 个不同主题的数据模块,拥有近 1,4000+ 分析量,可以覆盖大部分临床科室的选题。
由小木老师主讲的《NHANES 数据库挖掘从入门到精通》课程,带你一一攻克 NHANES 数据库挖掘的 4 大难关:选题-数据检索-数据清洗-数据统计分析。
但本课程的学习需要具备一定的 R 语言以及临床统计知识基础,纯新手的话学起来门槛较高。
为了帮零基础同学在最短时间内高效掌握 NHANES 数据挖掘与 SCI 发表的技能,我们还推出了《NHANES 数据库挖掘私教班》课程!
无需使用 R 软件,全程手把手带教,指导选题,实操每周直播答疑,2 对 1 初稿预审修改指导,帮助纯新手发表一篇 NHANES 数据挖掘 SCI!7 月底开营,仅收 40 人,人满即止!
MIMIC 数据挖掘专场
MIMIC 数据库包含了麻省理工贝斯以色列迪康医学中心重症监护室十几年来的真实医疗数据,共含成年患者(年龄>=16岁)53423 人。
包括人口统计学、生命体征数据、实验室测试、影像数据和药物、社保数据等,记录了患者的随访时间和预后结局。
急重症相关科室的医生朋友千万不要错过这个数据库!由浙江医院的沈延飞老师为大家带来《MIMIC 数据库挖掘私教班》,全程亲自指导学员完成 MIMIC 数据库的注册与原始数据下载、数据整合与清洗(stata 软件)、数据分析与作图(stata 软件),最后还会指导写作与返修。
本期私教班将于 8 月底开营,全程直播授课,40 人招满即停!
GEO、TCGA 数据库挖掘
做大数据挖掘自然不能忘记老牌生信公共数据库 GEO 与 TCGA 等数据库。
TCGA 数据库做了大规模的基因组测序,样本量过万,包含了三十多种癌症,其中尤其宝贵的是这些样本都有很详细的预后随访信息。
GEO 数据库是一个国际公共存储库,收录并整理了全球范围内研究工作者上传的微阵列芯片、二代测序以及其他形式的高通量基因组数据,并提供免费下载。
一般来说以上数据库的挖掘需要较好的 R 语言编程基础,但由沃林老师主讲的《零基础数据挖掘》课程,将拯救编程小白于水火。本课程学习中的大部分分析结果,都可以使用在线工具生成。少量分析我们直接提供 R 包,手把手跟着操作,R 语言零基础也可以直接出图。
如果想更加深入的学习生信分析个性化作图,还可以学习沃林老师的升级课程《R 语言入门与数据挖掘实战》哦,本课程会从 R 语言基础知识开始教学,掌握基本原理后,再教你利用各种 R 包进行生信数据的作图分析!
丁香科研 618 活动开启,公共数据挖掘专场来袭,总有一门课程适合你