AWS全新公共数据集助力癌症研究

亚马逊AWS中文技术社区2015年2月宣布,作为AWS公共数据集项目的一部分,合格的研究者现在可以在AWS上免费访问两个世界上最大的癌症基因组数据集了。在AWS 上将这些拍字节规模的基因组数据作为共享资源,提供对它们的访问权降低了访问障碍,因此扩展了研究团体,在为癌症患者开发新的治疗方案的进程中加速了研究和探索的步伐。

TCGA(癌症基因组地图集)语料库囊括了从数以千计的癌症患者处收集来的原始和加工过的基因组,转录基因组,和表观基因组数据,现在在AWS S3上对 Cancer Genomics Cloud(CGC)的用户免费开放。 Cancer Genomics Cloud是一个试点云项目,由美国国家癌症研究所资助,在 Seven Bridges Genomics平台上运行。

ICGC(国际肿瘤基因组协作组)泛癌症数据集因PCAWG(全基因组泛癌症分析)研究产生,现在在AWS上也可用,使癌症研究者可以访问2400多组被持续分析的基因组,这些基因组对应于1100多位独特的ICGC捐赠者。这些数据也将在AWS S3上对那些符合ICGC数据共享策略,受到信任的研究者免费开放。

这两个数据集代表第一批受控访问的基因组数据,它们已在云中被重新传播到更加广泛的研究受众中。以前,研究人员在可以开始实验前需要下载和存储自己 的数据副本。现在,有了为这一团体在AWS中托管的数据,研究人员可以马上开始他们的研究了。他们也可以访问该团体在AWS中托管和共享的更加广泛的工具 集。这意味着一个低的多的访问障碍和更多的研究时间。

使这些数据和工具在云中可用,也可以实现更高水平的跨研究团体合作,因为他们将有一个共同的数据访问和共享的场所。最后,研究人员也将能够安全地将 自己的数据和工具带入到AWS中,将它们与现存的公共数据结合,进行更强健的分析。无成本数据访问,更加广泛的可用数据集,和增强的协作能力将使研究人员 能够聚焦于他们的科学研究而不是基础设施,允许他们在更短的时间内取得更多的成果,最终加快癌症研究领域的研究和探索步伐。

在AWS中访问TCGA和ICGC

TCGA和ICGC与之前发布的AWS公共数据集,如NIH(国立卫生研究院) 千人基因组计划,GIAB(瓶中基因组),和3000水稻基因组,之间的差异决定了需要限制那些为了使用这些数据已经经历了审查过程的研究者的访问权限。由于这个要求的限制,在AWS中访问TCGA和ICGC也将分别由第三方合作伙伴, Seven Bridges GenomicsOntario Institute for Cancer Research管理。这些合作伙伴有权代表源数据提供者重新分布数据。它们也将随时间的推移管理和更新数据,扩展用户团体,使他们可以分享基于云的工具和最优实践,以加快数据的使用,促进我们对癌症的了解。

你可以在 TCGA on AWSICGC on AWS页面了解更多关于数据集的信息和访问细节。

使用数据所需的工具和资源

TCGA数据将会对CGC用户开放。研究人员可以在这里申请提早访问。一旦申请被接受,用户将能够通过CGC Web入口访问数据或使用CGC的API对数据进行程序性地访问。CGC已将一组数据分析管道与平台集成以便用户现在就可以使用最普通的工具开始工作。

用户将可以使用一个可下载的命令行工具普遍性地访问ICGC数据。用户可以使用 ICGC Data Portal(ICGC数据入口)搜索文件,通过 ICGC Storage Client(ICGC存储客户端)访问单独的或相关的校准和变体文件集。校准文件和Sanger体细胞变体调用现在在亚马逊S3中已可用。更多的变体调用将跟随附加的质量检查,确认,和分析被发布。想要了解更多信息,参见 ICGC on the Cloud页面和ICGC存储客户端文档。

一如既往地,当在AWS上使用敏感的基因组数据时,你应该注意保护你的存储和计算资源的安全。如果你不熟悉安全地使用数据所必需的业务特性和工具,AWS白皮书中的 Architecting for Genomic Data Security and Compliance(基因组数据安全和合规性架构)是一个很好的起点。基因组平台,如CGC,注意满足这些种类的要求,以其作为它们的价值主题。例如,DNAnexus在这里已提供了关于如何在平台内利用ICGC存储客户端的用户文档。

认识到以这种规模使用数据并不是简单的任务,PCAWG团体也正在发布 PanCancer Launcher(泛癌症启动器)。这是一个开源系统,用来创建EC2实例,对分析项目进行排队,触发基于Docker的分析管道,在计算任务完成时清理已启动的资源。

目前,PanCancer Launcher支持基于BWA-MEM的校准管道和它关联的质量控制步骤。将来的发布版本将会支持项目创建的变体调用管道。这些管道包括了来自四大学术 组织的最优实践变体调用管道:DKFZ(德国癌症研究中心),位于海德尔堡的EMBL(欧洲分子生物学实验室),韦尔科姆基金会桑格研究所,和布罗德研究 所。你可以在Launcher HOWTO Guide中了解更多关于如何利用PanCancer Launcher的信息。

云计算时代的基因组学

在过去的十年中见证基因组学和云计算的平行演进一直是非常有趣的。二者都由利用规模经济的新技术所驱动。它们都已从根本上改变了可能被问到的问题的类型,仅仅是因为我们现在能够在同一个地方收集和分析数据了。

在新的化学工具发布时,基因组学研究团体已见证了它们的存储和计算需求一夜之间翻番。它们在很久以前就意识到,与必须提前规划,并在三到五年内摊销 的大量资本购买相比,可伸缩的云计算模型是一个更适合的选择。现在,习惯做法是,使用达到成百上千太字节的数据集和达到拍字节的一些重要的数据集,如 TCGA和ICGC。对基因组学而言,云已经成为如何进行科学研究的新标准。

你可以在下面的这个新视频中了解基因组学思想领袖们是如何使用云在基因组学领域进行创新的:

请访问 Scientific Computing on AWSGenomics on AWS页面了解更多的用户故事和工具。

源于《AWS中文技术社区》2015-12-04

 

扩展阅读:Nature:“10,000个癌症基因组计划”宣告完成

旨在绘制出1万个肿瘤基因组景观图谱的美国重大科研项目——“癌症基因组图集”(The Cancer Genome Atlas,TCGA)计划已正式宣告结束。这一于2006年启动,耗资1亿美元的研究项目现在是国际肿瘤基因组协作组(International Cancer Genome Consortium, ICGC)研究计划最大的组成部分,来自16个国家的科学家们相互协作已发现了近1000万个癌症相关突变。

现在最大的问题是下一步要做什么。一些研究人员希望继续将焦点放在测序上;另一些研究人员则更愿意扩展他们的研究工作,来探索发现的一些突变影响癌症形成与发展的机制。

这项计划的早期倡导者、冷泉港实验室负责人Bruce Stillman说:“TCGA应该告竣并宣布取得胜利。但总是会有一些新的突变被发现与某种特定的癌症相关。问题是:成本收益比率如何?”

这一最初预期三年的计划,延长了5年多的时间。2009年,它获得了来自美国国立卫生研究院追加的1亿美元以及来自联邦刺激基金的1.75亿美元资金资助。这一计划一开始便面对着重重困难。在当时,测序技术只适用于快速冷冻的新鲜组织。病理学家对大多数的临床活组织标本都是采用石蜡包埋及染色方法进行检测。美国国家癌症研究所(NCI)办公室主任Louis Staudt说,寻找及购买新鲜组织样本成为这一项目最大的经费支出。

数据的复杂性也是一个问题。尽管有一些“驱动突变”被视作为有可能是癌症形成的贡献者,大多数的突变形成了令人困惑的遗传异常大杂烩,肿瘤之间少有共同点。对靶向这些驱动突变的药物进行测试很快揭示出了另一个问题:癌症往往会通过激活不同的基因来绕过治疗阻断的细胞过程,由此很快产生耐药。

约翰霍普金斯大学癌症遗传学家Bert Vogelstein说,尽管存在这些困难,TCGA仍使得癌症研究的几乎各个方面都得以受益。这些数据提供了一些新的方法进行肿瘤分类,并指出了从前未知的一些药物靶点和致癌物。某些研究人员认为测序仍然可以提供许多的东西。2014年1月,针对来自21种癌症的突变数据进行统计分析的一项里程碑研究表明,测序有潜力找到一些临床上有用的突变。

12月2日,Staudt宣布在TCGA完成后,美国国家癌症研究所将继续集中测序三种癌症:卵巢癌、大肠癌和肺腺癌的肿瘤。并计划在评估完这一额外研究工作的成果之后,再决定是否增加更多的癌症。

扩大范围

而这一次,这些研究将会整合患者健康、治疗史以及对治疗反应等详细的相关临床信息。由于研究人员现在可以利用石蜡包埋的样品,他们可以挖掘来自以往一些临床实验的数据,并研究某些突变影响患者预后以及对治疗反应的机制。Staudt说,美国国家癌症研究所将发起号召,建议采用TCGA建立的一些方法和分析流程来测序某些临床实验中取得的样本。

加拿大安大略癌症研究所所长Tom Hudson说,国际肿瘤基因组协作组的其他人士,预计会在二月发布第二波项目的早期计划,有可能会采取相似的做法。几个国家中迫切希望能够控制住医疗保健费用的政府资助者已普遍接受,集中力量寻找使得肿瘤对治疗产生反应的序列。“癌症治疗非常的昂贵。我们的当务之急是要知道哪些患者将对一种昂贵的药物产生反应。”
美国国家癌症研究所还支持建立一个数据储存库,不仅收集来自它自身研究项目的数据,还可汇集来自国际研究工作的数据。Staudt说,其目的是为让更广泛的研究人员能够存取数据及获得一些分析工具。目前,癌症基因组学数据占据大约20千万亿字节(petabytes),其太过庞大及难于处理,只有一些具有卓越计算能力的研究机构能够访问它们。即便这样,只是下载它们都需要四个月的时间。

Staudt承认,无法指望联邦刺激资金来推动这些计划,但更廉价的测序以及能够利用生物银行活组织标本将降低成本。他说:“基因组学是我们大多数癌症研究工作的中心。现在我们可以更直接的方式来提出一些问题。”

源于《生物通》2015年1月7日

扩展阅读:四个癌症与一个联盟

基因测序技术的进步,加深了科学家对癌症的了解。有理由相信,人类正处在攻克这一顽症的前夜。

癌症与人类基因组

“截至目前,现代医学在抗癌领域的表现是相当令人失望的。”来自加拿大卑诗省癌症研究中心(BC Cancer Agency)的约瑟夫·康纳斯(Joseph Connors)博士开门见山地说,“就拿医学水平相对很高的美国来说,1950到2000这50年里,每年死于心脏病的人占总人口比例从0.59%降到了0.21%,死于脑血管病的比例从0.18%降到了0.047%,死于流感和肺炎的比例从0.048%降到了0.020%,可死于癌症的比例只从0.19%降到了0.18%,可以说几乎没有变化。”

“即便是这0.01%的下降也是有水分的。”康纳斯博士继续说,“分类统计数据显示,死于癌症的美国人比例下降的主要原因是男性吸烟人数剧减,导致肺癌发病率的大幅下降。如果单看癌症治愈率,最近这几十年里几乎没有进步,绝大部分癌症一旦发生转移都无药可治,病人只能期待奇迹发生。”

康纳斯博士是在美国科学促进会(AAAS)年会上说这番话的。康纳斯博士是“癌症与人类基因组”专题讲座的主持人,据他介绍,去年全球新增癌症病人1300万,死亡750万,癌症排名发达国家死亡原因的第一位,在发展中国家虽然暂列第二,落后于传染病,但两者的差距正在迅速缩小。毫无疑问,癌症是公共卫生领域的头号敌人。

癌症的外部诱因千奇百怪,但本质是一样的,都是因为某些基因发生突变导致细胞生长失去控制,这就是为什么当2001年人类基因组计划宣告完成时,很多人认为癌症必将很快被攻克的原因。但是,11年过去了,这个愿望一直没有实现,这是为什么呢?

也许,我们应该换个角度,看看科学家们在这11年里到底都做了些什么。本次专题讲座的主讲人,来自著名的维康信托基金会桑格研究所(Wellcome Trust Sanger Institute)的迈克尔·斯特拉腾(Michael Stratton)教授认为,生物学界在这11年里所取得的重大成就之一就是将基因测序的效率提升了好几个数量级。“人类基因组计划开始于1990年,最终花了11年才宣告完成,因为90年代基因测序用的是凝胶法,跑一次胶只能测几百个字母。”斯特拉腾教授说,“后来科学家发明了自动测序仪,到2001年这种机器每台每天就可以测量100万个字母了,而现在每台每天可以测1000亿个字母,其工作效率在这11年里提高了10万倍!”

众所周知,基因是由两条DNA长链按照双螺旋的方式组成的,每条长链由四种核苷酸按照一定顺序排列而成,分别用A、T、C、G这四个字母来代表。人类基因组大约由30亿个这样的字母组成,如果每页印1000个字母,每本书有1000页的话,需要3000多本书才能将人类基因组序列印完。但如果将其储存在光盘中,那么一张CD就差不多了。事实上,这个对比很能说明问题,随着技术水平的飞速提高,过去曾经被认为不可能完成的任务,在将来很有可能变成家常便饭。

基因测序就是这方面的一个经典案例。

接下来,斯特拉腾教授用四个故事为大家介绍了新的基因测序技术在癌症研究领域的应用。随着基因测序效率的增加和成本的下降,科学家们对癌症的认识达到了前所未有的高度。

肾透明细胞癌的故事

肾透明细胞癌(Clear Cell Renal Cancer)是肾癌中最常见的一种,仅在美国每年就会新增3万个左右的新病例。这种癌细胞在显微镜下呈透明状,故此得名。

科学家们迫切想要回答的问题是:到底是哪(几)种基因突变导致了肾透明细胞癌?

在回答这个问题前,先来介绍一下致癌基因的知识。早在几十年前科学家们就知道,基因突变并不平等,而是有高低贵贱之分。具体说,有的基因突变能够直接导致细胞发生癌变,这种突变被叫做驱动突变(Driver Mutation);另外一些突变则要么对细胞无影响,要么直接导致细胞死亡,不会发生癌变,这样的突变叫做伴随突变(Passenger Mutation)

在过去的30年里,通过对驱动突变的收集整理,科学家们发现了430个基因与癌症直接相关,如果这些基因在适当场合发生了“适当”的突变,就会让该细胞变成癌细胞。已知人类基因组中包含大约2.1万个基因,也就是说,大约有2%的人类基因可以被称为致癌基因。

再回到开头的问题:到底哪些突变会导致肾透明细胞癌呢?科学家们找来101个肾透明细胞癌患者,把每个人癌细胞中的2.1万个基因序列通通测了一遍,从中寻找驱动突变的踪迹。显然,这个办法在10年前几乎是不可想象的,但因为测序技术水平的飞速发展,这个看似很“笨”的办法摇身一变,成了最合理的手段。

结果显示,在这101名患者中,VHL突变出现了56次,PBRM1突变出现了44次,这两个驱动突变显然是肾透明细胞癌的主因。除此之外,还发现了11个驱动突变,但出现的次数较少,最多的只有7次,少的只出现了一次。虽然次数少,但它们的存在本身就说明肾透明细胞癌的发病机理可以是多种多样的。

从分布情况看,有将近一半的患者有不止一个驱动突变,最多的同时出现了三个!对于这样的患者,如果只服用针对某一种致癌基因的药物,就不管用了。

除此之外,另有22名肾透明细胞癌患者的癌细胞内没有发现任何一个已知的驱动突变,说明还有很多未知的致癌基因等待科学家们去发现。

有了这样一张驱动突变分布表,科学家就知道,应该先把精力放在VHL和PBRM1这两个致癌基因上,找出对付它们的手段,这就等于成功了一半。更重要的是,这项研究再一次证明,同样一种癌症(肾透明细胞癌)可能有着完全不同的病因(致癌基因),以原发地为分类标准的癌症命名法(比如肺癌、肾癌等)已经过时了,未来的癌症一定是以基因突变的类型而划分的,癌症的治疗也一定是从基因着手,先测出患者究竟哪(几)个致癌基因发生了变异,再对症下药。

接下来一个很自然的问题就是:驱动突变究竟是怎么发生的?请看下一个故事。

恶性黑色素瘤的故事

恶性黑色素瘤(Malignant Melanoma)是皮肤或者其他器官的黑色素细胞发生癌变而产生的恶性肿瘤,仅在美国每年就有5万新增病例,约7000人死亡。已知有四类人容易得这种病,分别是痣多的人、常晒太阳的人、有家族遗传史的人以及肤色较浅的人。所以白人当中得这个病的较多,中国人则相对较少。

欧美国家对此病很重视,早在30多年前,就从一名45岁的白人男性患者身上取下一些癌细胞,在实验室条件下培养成功,使之成为研究恶性黑色素瘤的实验材料,这就是癌症实验室常用的COLO-829细胞系。虽然这名患者在取样一年后因化疗失败而去世,但他的细胞后代已经遍布全世界,继续为科研做贡献,这也算是另一种形式的不朽吧。

当科学家们终于有能力测出人类基因组全部顺序后,首先想到的就是对常用的癌细胞系进行测序研究,COLO-829是最先完成基因全测序的细胞系之一。当科学家们把测序结果和正常细胞进行对比后发现,这株癌细胞的基因组全乱套了,一共有66个插入/缺失型突变,以及37个基因重组型突变。更引人注意的是,这株癌细胞的基因组内一共发生了3.3345万个单核苷酸突变,这种突变俗称点突变,就是基因序列中的一个字母被另一个字母所代替。点突变的发生频率较高,但大部分点突变都是中性的,对细胞的生活没有影响。话虽如此,这个细胞系居然有3万多个点突变,总数还是很惊人的。

那么,这些突变都是如何造成的呢?科学家们按照点突变发生的种类和位置进行了统计,发现其中有将近2万个突变是由C变成了T。更有趣的是,这个位点的上游、紧挨着的那个核苷酸几乎全都是T,也就是说,原基因组的TC被改成了TT。

这个发现就好比是福尔摩斯在破译“跳舞小人密码”时找到的那个只有5个字母的单词,整个密码系统从此便迎刃而解了。原来,科学家早就知道,晒太阳之所以能导致基因变异,原因就在于太阳光中的紫外线能够让DNA长链中的T和C发生化学反应,生成一个新的化学键。这个额外的化学键改变了DNA长链的三维结构,在DNA双螺旋上形成一个鼓包。在细胞分裂时,DNA合成酶遇到这个鼓包便过不去了,它的解决办法就是把后面那个C替换成T,也就是说,TC变为TT是紫外线诱导基因变异的一个标志性结果。

故事讲到这里,真相大白了。COLO-829细胞系有超过一半的点突变都很可能是由于紫外线照射而引起的,说明这位男性患者生前一定非常爱晒日光浴,而这个习惯很可能最终导致了他的死亡。当然上面这个结论并不难得出,只要去查一下他的生活史就可以了。这个例子只是证明科学家有能力仅仅通过基因组测序分析,便从源头上搞清整个癌症的发病过程。如果将来再遇到比这个病例更难的情况,完全可以照此办理。

在这个故事里,基因测序就像是考古学家手里的那把小铲子,借助它可以考证出癌细胞的全部生活史。那么,科学家知道这个有什么用呢?请看下一个故事。

原发性胰腺导管癌的故事

我们常说的胰腺癌主要指的就是原发性胰腺导管癌(Primary Ductal Carcinoma of the Pancreas),这种癌和已故苹果公司总裁乔布斯得的那种胰腺癌不一样,非常厉害,恶性程度很高。

胰腺癌之所以厉害,一个原因是早期很难发现,另一个原因就是极易转移。民间有个说法,不怕得癌,就怕扩散,这话是有道理的。很多癌症本身是可治的,一旦发生转移,基本上就没治了。

斯特拉腾教授为我们展示了一张患病肝脏的照片,上面布满了一团团像菜花一样的白斑,它们都是转移至此的胰腺导管癌细胞。那么,这些癌细胞团是如何转移至此的呢?这个问题无外乎有两种答案:第一,它们是由一个个转移至此的癌细胞单独形成的;第二,先有一个癌细胞转移至此安营扎寨,再慢慢扩散开来。

要想回答这个问题,任何常规手段均无法做到,必须通过基因分析法。过去基因测序能力有限,科学家们只能分析点突变,结果仍然说不清。现在有了更为强大的测序方法,科学家们便选择其中8个面积较大的“菜花”,分别提取其中的癌细胞进行全基因组测序,终于搞清了胰腺导管癌的整个扩散路径。

分析表明,这位病人肝脏上面的这8个癌细胞团经历了38个比较重大的基因重组,也就是染色体被打断,然后再重新拼接起来。而这38个基因重组全都是一样的,说明前文所说的第二个假说是正确的,即先是有一个胰腺导管癌细胞转移至肝脏,然后再扩散开来。

事实上,这位病人的胰腺导管癌细胞已经转移到肺部了,于是科学家又从病人的肺部取出一批癌细胞,进行了同样的分析,发现它们全都一样,但和肝脏上的“菜花”有少许不同,这个结果说明癌细胞先是转移到了肝脏,再从这里转移到了肺部。换句话说,用这种方法可以弄清癌细胞的全部转移路径。

这样刨根问底式的分析,必须以强大的基因测序技术为后盾,否则是不可想象的。这个技术不但为我们描绘了癌细胞的转移路径,也为我们揭示了恶性肿瘤的成长史。科学家们从同一个癌症患者身上收集到若干个位于不同部位的癌细胞进行基因分析,发现癌细胞不是一下子就“变坏”的,而是有个渐进的过程。先是一个基因发生突变,导致细胞生长失去了控制,然后在此基础上又有一个基因发生突变,导致细胞具备了扩散到肝脏的能力,再发生一个基因突变,使它又具备了扩散到肺部的能力……如此类推,最终这个癌细胞依靠一个个基因突变,逐渐扩散到了病人全身。

整个过程和生物进化非常相似,都是突变加上选择,最终导致更加适应环境的新物种的产生。我们都知道,进化的力量是无比强大的,这就是为什么癌细胞的生命力如此顽强的真正原因。

那么,我们该如何去面对这样一个凶恶的敌人呢?请看下一个故事。

威罗菲尼的故事

除了动手术外,对付癌症曾经只有两个办法:化疗和放射性疗法。两种疗法的基本思路都是一样的,简而言之就是“宁可错杀一千也不放过一个”。事实证明,这个办法效果有限,而且副作用太强,很多病人承受不了。

本文的前三个故事为我们描述了科学家是如何利用强大的基因测序工具研究癌症的,这个研究过程如今已经结出一颗硕果,这就是去年10月刚刚被美国FDA批准的新一代抗癌药威罗菲尼(Vemurafenib)。这个药和过去那种广谱的化疗药物完全不同,而是一种专门对付某一特定类型癌症的“窄谱”抗癌药。

此药的发明正是基因分析的结果。原来,科学家们经过10多年的研究,发现了一个强致癌基因BRAF,大约70%的恶性黑色素瘤、30%的甲状腺癌和10%的直肠结肠癌是由于这个基因发生了突变而造成的。进一步研究显示,BRAF基因的正常功能就是将外来的生长信号传递到细胞内部,指导细胞开始分裂。一旦发生驱动突变,该基因便永久性地处于“开”的状态,于是这个细胞便一直以为自己收到了生长信号,开始了无休止的细胞分裂。

一旦搞清了机理,下一步就容易多了。科学家通过药物筛查,找到了一种化合物,能够把BRAF基因重新“关”上。临床试验表明,如果病人的恶性黑色素瘤确实是由BRAF突变所引起的,那么这种药的疗效非常显著,用药几周后大部分黑色素瘤就会自行消失。

显然,病人在用药前必须先测DNA,确定是BRAF突变才能用药。事实上,这就是最近炒得沸沸扬扬的“个体化治疗”的一个典型案例,也是人类基因组计划带给广大癌症患者最大的福音。可惜的是,威罗菲尼尚不完善,绝大部分病人体内的恶性黑色素瘤最终都会发生基因变异,对威罗菲尼产生抗性。要想彻底解决这个问题,也只有依靠基因测序技术。科学家们正在进行一项大规模研究,希望能找出癌细胞产生抗性的原因,然后改进威罗菲尼,阻止或者延缓抗性的出现。

这样的研究无论是难度还是规模都是史无前例的,这就要求科学家们必须团结起来,加强国际间的合作,于是就有了国际癌症基因组联盟。

国际癌症基因组联盟

基因测序技术的进步为癌症研究领域提供了超大量的数据,这些数据需要整合起来进行研究。于是,2008年4月29日,国际癌症基因组联盟(The International Cancer Genome Consortium,简称ICGC)在英国伦敦正式成立了。该组织计划投资10亿美元,用10年的时间把最常见的50种癌症的致癌基因及其突变类型全部找出来,绘制成一张详尽的癌症变异基因全图谱。

目前该联盟一共有12名成员,分别负责一种或几种癌症的研究。中国也加入了该联盟,被分到的任务是研究胃癌。

据斯特拉腾教授介绍,该联盟定下的目标是在余下的7年时间里把目前已知的2.5万种癌细胞的基因组全部测出来。如果这一宏大目标最终得以实现的话,科学家就掌握了绝大部分癌症的生活史,这将极大地提升科学家对癌症的认识,为抗癌药物的研发打下基础。

癌症是一种复杂的疾病,攻克癌症没有捷径可走,只有从源头做起,脚踏实地一步一步来。让我们耐心等待。

源自《三联生活周刊 》2012年11期 袁越

 

Tags: 

推荐阅读