基因数据共享(GDC)项目,是一个可以增进科研人员之间分享基因组和临床数据的统一的数据系统,该项目美国副总统Joe Biden访问芝加哥大学运营中心时候开始着手建立的。在美国国立癌症研究院(NCI)的倡导下,GDC将会成为国立癌症研究院和奥巴马总体提出的关于精准医疗倡议(PMI)的核心组成部分。GDC将会从分配给NCI的7千万美元资金当中获得研发基金支持,NCI将会致力于癌症基因组学的研究,这也是为肿瘤学研究所建立的PMI项目中最为关键的一步。GDC项目的建立就是为了让NCI的癌症基因组图谱(TCGA)这样的大规模研究项目中所获得的数据进行集中化管理,并将这些数据进行标准化建设,同时让更多科研人员可以获得并使用数据。
Biden Designates NCI’s Genomic Data Commons As “Foundational Element” of Cancer Moonshot
TCGA和TARGET代表着当今世界上最大且综合性最强的癌症基因组学数据库,这些数据库容量超过2千万亿字节(1千万亿字节等同于223,000张DVD光盘的储存能力)。同时GDC也会为全世界有志于分享个人科研数据的研究人员设立了癌症基因组学和临床数据的提交入口。这种做法,可以让研究人员能够使用GDC最先进的分析技术,并可以将个人的研究成果与GDC当中的其他数据进行比对。
GDC中的数据代表了成千上万名癌症患者和肿瘤的信息,使用标准化的算法可以对这些数据进行统一处理,这样就可以让数据得到任何一名癌症研究人员的使用。当计算方式和基因组注释改进的同时,GDC中的原始基因组数据可以实现重新分析的功能。值得我们关注的是,在这个注重个人数据隐私和授权获取数据使用权限的年代,GDC在数据的储存和下载方面建立了相当严苛的安防机制。
“有了GDC,NCI已经开始承担长期维护癌症基因组学数据及为科研人员提供免费使用入口的责任,”NCI的代理主任,医学博士Douglas Lowy说。“随着时间的推移,来自更多的癌症患者的数据将会不断增强GDC数据对于病情研究的解释能力,最后,GDC将会加速我们精准医疗的进展。”
GDC项目目前正在建设,并由芝加哥大学数据密集型科学中心管理,并与加拿大安大略癌症研究所合作。
“特别重要的是,GDC也将会储存NCI新的临床试验患者基因测序数据,”NCI的 Louis M. Staudt,医学博士说。“这些数据库可以帮助我们更好理解到底哪种诊疗方式会更适合我们的癌症患者。当更新的数据和研究成果加进来的时候,GDC将会变得更加智能,更加完善,会促进我们获得有关癌症研究的更多发现,提高癌症患者治疗的成功几率。”
对GDC,人们寄予很高的期望,因为GDC将会从根本上成为癌症研究和治疗的综合知识系统。GDC科研人员可以把基因和临床数据(比如郭癌症扫描图像和组织切片数据)与肿瘤的分子轮廓分析以及治疗反应整合。
本文为专栏文章,来自:化学数据联盟,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/19087.html 。