发布日期:2019-04-28浏览次数:
2019 年 4 月 27 日,由上海生物信息中心、上海生物信息学会、上海药物转化工程技术研究中心共同主办,由「基因智汇圈」微信公众平台、洛兮医疗科技有限公司承办的「生物医学大数据建设交流会」在浙江大学医学院附属邵逸夫医院顺利进行。
21世纪,生命科学和医学进入大数据驱动的颠覆性变革时代,由基础研究、系统生物学与合成生物学、比较医学药病模型、转化型研究、个人/自然人群健康/临床等数据构成了具有多尺度、高维度、异质性、复杂体系等特点的生物医学大数据。
当下,拥抱数据密集型科学时代是关键科学问题和前沿发展方向。而大数据基础设施建设则是提升国家竞争力的关键。
生物医学大数据基础设施做什么?
与美国NCBI、欧盟EMBL和日本DDBJ以递交为基础的数据存储、以主题为基础的数据共享、以传统信息技术为基础的数据挖掘不同,我国生物医学大数据基础设施的数据存储以整合为导向、数据共享以交互为导向、数据挖掘以前沿信息技术为导向,形成了生物医学大数据颠覆性技术创新场景。
数据收集与标准质控系统、存储与整合共享系统、分析挖掘系统以及硬件系统共同构成了国家生物医学大数据基础设施。整合物理系统与数据管理应用系统的技术体系,以成熟的先进技术为基础,结合重要创新技术的研发与集成,成为汇聚研究时代国家重大科技基础设施建设的新模态。
生物医学大数据基础设施怎么做?
为了实现以形成服务为导向的科学技术综合体、实现从技术革新到能力提升的“会聚研究”革命的科学目标,实现服务于健康中国、健康保障、大数据等战略目标的功能定位,生物医学大数据基础设施以形成数据标准质控能力、存储整合共享能力、数据分析挖掘能力、数据专业计算能力四个方面的研发服务能力为设施工程目标。
为此,我国由中国科学院上海生命科学研究院、中国科学院-马普学会计算生物学伙伴研究所、生物医学大数据中心共同设立了NODE(The National Omics Data Encyclopedia,国家组学数据百科全书)。
国家组学数据百科全书(NODE)
NODE介绍
NODE以方便、安全、免费为特点,以基因、基因组、蛋白质、核苷酸、肽构成其主要数据,拥有数据安全传输、系统功能模块分离、多系统用户融合、系统应用拓展四大关键技术,以DNA测序数据标准分析流程、单细胞测序数据标准分析流程、16S扩增子测序数据标准分析流程、转录组测序数据标准分析流程、宏基因组测序数据标准分析流程、数据标准分析流程共同构建形成NODE分析流程。
用户服务
NODE是新一代生物组学数据的汇交管理平台,为用户提供便捷的各类组学数据存储及发布途径,用户也可以通过NODE搜索感兴趣的数据及样本信息进行研究。
NODE为用户提供了数据分层与分级的数据管理与共享机制和技术体系,保证用户数据共享的安全性。
NODE在为用户提供服务时注重满足公众用户、数据所有人、基础设施三方面需求。
为了提高用户数据传输效率,NODE为用户提供了线下数据传输功能。
数据发布流程
NODE数据发布分为线上上传与线下上传两种方式:
线上发布流程为:创建元数据 → 上传原始数据 → 归档 → 数据发布。
线下发布流程为:填写信息表,邮寄数据 → 与工作人员沟通上传数据 → 数据发布。
NODE数据概况
NODE拥有元数据信息完成性校验、元数据字段内容校验的数据质量评估体系;现已拥有23个国家和地区、52.6万人次的访问量;已为166个研究项目、21家出版社提供数据。
中国科学院神经科学研究所孙强研究员、蒲慕明所长领导的科研团队,在国际上首次实现了非人灵长类动物的体细胞克隆。国际生物学顶尖学术期刊《细胞》(Cell)以封面文章在线发表了此项成果。NODE帮助研究团队上传并发表了“中中”与“华华”的SNPs与STR分析数据。
中国科学院分子植物科学卓越创新中心/植物生理生态研究所覃重军研究员研究组成功构建了“单条染色体的酿酒酵母”,并在线发表于国际顶尖学术期刊《Nature》上。NODE帮助科研团队上传并发表了所有论文数据。
中国科学院上海营养与健康研究院潘巍峻研究员带领其研究团队,在国际上首次高清晰解析了体内造血干细胞归巢的完整动态过程。该研究成果于2018年11月20日在线发表于国际知名学术期刊Nature(《自然》)。该科研成果在NODE上公开发表了三维重构模型和活体成像视频数据,其中三维重构模型数据为NODE独家发布,展示了生物体内活体、内源造血干细胞归巢停留的“热点区域”。
NODE已建立国际资源协作网络3个、协议建立5个,国内资源协作网络已建立10个、协议建立2个。
NODE与国际人类表型组计划、精准医学计划已建立合作,计划与医疗大数据应用技术国家工程实验室(上海)、脑计划(南方)、类脑计划(南方)、区域医疗(申康发展中心)、超级计算机(E级机)等已有设施建立合作,计划与合成生物学计划、微生物组学计划等学术界正在论证的研究达成未来合作方向。
拥抱数据密集型科学时代,大力发展大数据基础设施建设,提升国家竞争力,我们在努力!