原标题:近500个科研安排协作研讨了21万人 发现191个乳腺癌相关基因
乳腺癌(breast cancer)是一类因乳腺上皮细胞增殖失控而导致的恶性肿瘤,其发病率终年位居女人恶性肿瘤首位,因而它也被称为“粉红杀手”!
在我国,乳腺癌的发病率呈逐年上升趋势,每年有30余万女人被确诊出乳腺癌,在东部沿海地区及经济兴旺的大城市,乳腺癌发病率上升特别显着。
到现在,乳腺癌因异质性等要素,其具体病因没有彻底清楚。
所幸,跟着基因组大数据剖析的开展,人类对乳腺癌等恶性肿瘤相关基因骤变的认知愈渐增多。
全基因组相关研讨(GWAS)已在150多个基因组区域发现与乳腺癌危险相关的基因变异。
但是,这150多个基因区域里仅有不到20个区域被具体研讨,驱动这些相关的大多数变异和基因仍然是不知道的。
近来,《Nature Genetics》刊发了一篇有关乳腺癌靶基因精准定位的研讨论文。
该研讨规划空前,由剑桥大学、哈佛大学领衔,458家科研单位的近500位科研人工共同完成。
研讨人员运用密布基因型数据对一切已知的乳腺癌危险区域进行精密制作,数据触及超越217000名参与者——基因型数据来自乳腺癌协会联合会(BCAC)和BRCA1/2润饰子研讨者联盟(CIMBA)。
经过人群大数据剖析以及基因芯片剖析,在150个乳腺癌高危险区域精准定位了191个或许的靶基因。
这些新发现的乳腺癌基因将协助咱们更具体地了解乳腺癌是怎么发作和开展的,但现在已知的起作用的基因数量之多,恰恰突显了乳腺癌的复杂性!
https://doi.org/10.1038/s41588-019-0537-1
一切样本均运用OncoArray或iCOGS芯片进行基因分型,并选用逐渐多元逻辑回归办法辨认各区域的独立相关信号,并在每个信号中界说可信因果变量(CCVs)。
研讨者发现基因组特征与CCVs有显着堆叠,紧接着,他们运用贝叶斯办法,整合基因组特征和遗传相关然后精简或许的因果变量集,并核算它们的后验概率。
最终,研讨人员整合了遗传、表观遗传表达以及染色质构象数据,以揣度每个信号的或许靶基因。
研讨流程图:
1、确认每个危险区域的可信因果变量(CCVs)
研讨者对GWASs发现的150个乳腺癌危险区域进行了屡次互补剖析,发现了362个独立的危险信号,其间205个具有较高的可信度。
他们观察到,大多数危险区域包括多个独立信号,ESR1(雌激素受体)及其共调控基因周围区域的数量最多(9个)。
研讨者运用了两种互补的办法来确认每个乳腺癌危险区域内的CCVs:
PAINTOR(一种贝斯叶办法)和传统的多项式回归办法。
CCVs支撑由多项式回归发现的大多数相关,而且还确认了额定的变体。
具体来说,贝叶斯办法强调了15个很或许是因果关系的变量(HPP≥80%)。
从这些办法中,咱们在每34个信号中别离辨认出一个或许是因果关系的单一变量。
在其他信号中,咱们也发现了四个之前被以为有害的编码改变:
无义骤变rs11571833(BRCA2);
两个CHEK2编码变体(移码骤变);
和剪接变异体(TERT中的rs10069690,导致端粒酶活性下降、端粒缩短和DNA损害反响添加等)。
2、提醒CCVs在DNA水平上的功用,并猜测它们的方针基因
有必要留意一下的是,在150个乳腺癌危险区域中,许多与ER阳性(乳腺癌ER阳性率在50%~80%左右)乳腺癌危险相关的CCVs存在于标记为敞开和活泼的ER阳性乳腺细胞的基因调控区域,而不存在于其他类型的细胞中。
此外,适当一部分潜在的CCVs与转录因子蛋白的结合位点以及协同调理因子彼此堆叠。
9种蛋白(CREBBP、EP300、ESR1、FOXI1、GATA3、MEF2B、MYC、NRIP1和TCF7L2)也出现在高可信度靶基因列表中。
这些基因编码的大多数蛋白质在雌激素信号传导通路中发挥作用。
CREBBP、EP300、ESR1、GATA3和MYC也是已知的在乳腺肿瘤中常常发作体细胞骤变的癌症驱动基因。
3、与ER阳性信号比较,ER阴性信号丰厚的基因组特征更少
研讨者们发现相较于ER阳性信号,ER阴性信号乳腺癌相关基因更少。
BCAC和CIMBA安排的ER阴性肿瘤患者中,不到20%的基因组信号意味着更大的er阴性乳腺癌危险。
除此之外,ER阴性乳腺癌细胞系的ChIP-Seq揭露数据很少和ER阴性肿瘤的异质性等要素也约束了这方面研讨的打开。
尽管如此,本研讨仍是找寻到35个ER阴性乳腺癌或许的靶基因。
其间一些已经有功用依据支撑:CASP8和MDM4。
但是,现在大多数靶点在ER阴性乳腺癌的发作开展中没有报导。
4、研讨靶基因最常存在的基因本体通路
免疫、炎症和肿瘤发作之间的联络已被广泛研讨,而有必要留意一下的是,14%(25/180)的高可信度靶基因和19%的ER阴性靶基因被猜测定坐落免疫系统途径中,如T细胞活化、Toll样受体级联复合物以及I-κB/ NF-κB等信号通路。
5个ER阴性高置信度靶基因(ALK, CASP8, CFLAR, ESR1 和 TNFSF10)坐落I-κB/ NF-κB信号通路中,风趣的是,与ER阳性细胞比较,ER阴性细胞具有更高水平的NF-kB活性。
此外,最近对乳腺癌肿瘤安排的表达甲基化剖析也发现了两个与DNA甲基化水平相关的基因簇:
一个富集于ER信号基因,另一个富集于免疫通路基因。
本研讨的领导者,剑桥大学Alison Dunning博士以为,这些令人难以置信的新发现的乳腺癌基由于咱们供给了更多的基因进行研讨,这将协助咱们更具体地了解乳腺癌是怎么发作和开展的,但现在已知的起作用的基因数量之多,恰恰突显了乳腺癌的复杂性!
总的来说,本论文的研讨剖析为200多个独立的乳腺癌危险信号供给了强有力的依据,确认了许多高可信度的乳腺癌靶基因。
尽管每一种基因变异只会使患乳腺癌的危险添加十分小的一部分,但归纳起来,这些基因变异将让女人更清楚地了解自己的患病危险,这也将使医师和临床医师可以就下降乳腺癌危险供给最佳战略。
参考资料:
[1] Fine-mapping of 150 breast cancer risk regions identifies 191 likely target genes
责任编辑: