您好,请问有什么可以帮到您的。 点击这里给我发消息
武汉新启迪生物科技有限公司
新启迪-您的生物科研好伙伴!2008-2021
Wuhan Xinqidi Biotech Co.Ltd
本企业通过iso9001质量体系认证

以染色质为基础,顺式和反式多发性骨髓瘤中调节性重新布线支持独特的致癌转录

 二维码
发表时间:2021-09-18 15:14作者:武汉新启迪Xinqidibio

摘要

多发性骨髓瘤是骨髓浆细胞(PC)的一种遗传异质性癌。不同的骨髓瘤转录组主要由骨髓瘤起始事件(Mie)驱动,并汇聚成相互排斥的过表达。CCND 1CCND 2癌基因。在这里,参考他们的正常同行,我们发现骨髓瘤PC增强染色质可及性,结合配对转录组分析可以分类mie定义的遗传亚组。在不同的MM基因亚群中,我们将骨髓瘤生物学的关键基因和通路的调控归因于独特的或共享的、发育激活的或新形成的候选增强子。这些增强剂参与了现有转录因子的招募,尽管这些转录因子本身并不是转录放松的,但它们组织了异常的基因调控网络,帮助识别对预后有影响的骨髓瘤细胞依赖关系。最后,我们识别并验证了调控异位表达的关键超级增强子。CCND 2在MM和慢性淋巴细胞白血病患者的子集中。

导言

多发性骨髓瘤(MM)是骨髓浆细胞(Pc)的一种常见的、遗传异质性和不可救药的癌症。1、终末分化、分泌免疫球蛋白的B系细胞。MM的第一级遗传异质性是由明确定义的骨髓瘤起始事件(MIE)传递的,这些事件与不同的转录组谱有关。在近一半的MM病例中,mie包括癌基因的过度表达。CCND 1, MAFMMSET它们与免疫球蛋白重链并列IgH)增强子,从而分别定义了t(11;14),t(14;16)和t(4;14)细胞遗传学亚基。超二倍体(HD)是MM病例中的mie,它是一个功能异质的亚组,其特征是附加的奇数染色体。2。次级事件包括拷贝数异常、单核苷酸变异和indels,会产生额外的遗传异质性,进一步形成mie对致癌转录的显著影响。3。在大多数情况下,这种异质性汇聚成细胞周期调控器ccnd 1和ccnd 2功能上的二分体、相互排斥的过度表达,而骨髓瘤pc则不受原发或继发性遗传事件的影响。4,5。导致CCND 2在近50%的MM病例中,除t(11;14)外,几乎50%的MM病例都存在过高表达,且分布于所有的遗传亚组。先前对单个骨髓瘤细胞系的一项研究确认了一种超增强子,该增强子跨越CCND 2,留下了远端增强子/超级增强子调节转录的可能性。CCND 2未探索6.

染色质可达性分析已被用于描述数百种不同的实体肿瘤和血液癌症,如慢性淋巴细胞白血病(Cll)的调节情况。7,8。此外,通过转录因子(TF)足迹,ATAC-seq允许推断TF结合的轮廓.这结合成对的转录组特征,使基因调控网络的构建成为可能。8,9。这类网络可能识别在特定癌症生物学中以前未被确认的肿瘤因子。

在以前的研究中10,11在染色质调控基因表达变化的基础上,骨髓瘤被视为一种同质癌.然而,异质性如何将染色质的可及性和调节状态与不同的致癌基因表达谱联系起来还没有被阐明,而全球对两者之间相互作用的洞察还没有阐明。顺式反式MM基因转录调控因子是有限的。

在此,通过整合骨髓瘤PC的染色质可及性动力学及其各自的转录组谱和其他表观遗传学数据集,我们解决了调节不同致癌转录和生物学途径的染色质变化。通过这个过程我们发现顺式-转-骨髓瘤生物学的调节因子,包括那些参与调节和异常表达骨髓瘤生物学的调节因子CCND 2在嗯。

结果

远端染色质元件的可及性增强与骨髓瘤浆细胞基因过表达有关

我们分离出新鲜的,高度纯化的BM(CD 19)。+/−3例正常供体(ND)的PC和30例MM患者的骨髓瘤PC,包括荧光原位杂交确定的主要MIE亚组。1A,补充图。1A和补充数据1)并跨越疾病的诊断和复发阶段。对每个样品,我们分别用ATAC-seq和RNA-seq获得配对的染色质可达性和转录组分。

图1:过度可接近的远端染色质分类骨髓瘤遗传亚组.
figure1

a研究病人的人数和设计。应用RNA-seq和ATAC-seq分别对30例MM骨髓瘤患者和3例健康供者的PC进行转录组和染色质可及性评价。对于两个对照组,我们获得了两个CD 19的样本。+ 和CD 19个人电脑。b正常对数表达的全骨髓瘤(左)和亚组(右)的平均atac-seq信号的变化2骨髓瘤/正常PC读计数。在泛多发性骨髓瘤图(左)的显着变化显示在一个更深的颜色。c基因500 kb内差异可达区(DAR)数目的Logistic回归x-轴),一个基因在骨髓瘤中是否有一个更开放的启动子(红色-是的,黑色-NO),这个基因在骨髓瘤中被不同程度地上调的可能性。点代表在500 kb和TSS状态下,在给定的DAR数范围内上调的基因片段,而直线代表模型拟合,灰色带95%置信区间。有10个或10个以上DAR的基因汇集在一起。d在同一拓扑关联域(TAD)中差异可达ATAC-seq区域信号与差异表达基因的相关性。e用多组学因子分析(MOFA)计算的前17个潜在因子(LF)解释每个RNA-seq和ATAC-seq信号的方差。f, g在MOFA模型的前五个潜在因素中,每个样本的LF得分。每个样本的子类型以颜色表示,如下所示(a)。LF1和LF2区分正常和MM样本,LF5区分MAF和CCND 1样本和其他样本。h区域和基因子集的LF评分,通过MOFA分析和先前被确定为MM-子组分类器作为预测因子。12。主要驱动癌基因MAF,CCND 1,CCND 2NSD 2在这里突出显示。

Atac-seq分析从所有样品中生成295,238个染色质可达峰(补充图)。1B)。这些峰是非随机分布在启动子,编码和基因间区域,并被发现是独特的或共享的两个或更多的遗传亚组(补充图)。1B和C)。在每一个基因亚组和总体上,与NDPC相比,骨髓瘤PC的染色质可及性增强(图1)。1B和补充数据2).

转录组谱分析发现骨髓瘤与NDPC之间存在3036个差异表达基因(DEG),包括已知mie驱动的癌基因在骨髓瘤PC中的过度表达(附图)。1D和补充数据3)。此外,对于每一个骨髓瘤遗传亚组和相应的mie,使用先前作为分类器的基因集。12在MMRFCommpass研究中,我们将我们的样本和892份骨髓瘤PC样本的转录组分聚在一起(补充图)。1E)。这一分析证实了用FISH对我们的队列样本进行遗传亚组注释的准确性,并有助于对未知细胞遗传学状态的样本进行分类。

恶性与正常状态分析表明,高表达基因与非TSS峰值显著相关,且可达性高于未过表达基因(补充图)。1F),高表达基因到最近的峰值的距离更短(附图)。1g)。多因素Logistic回归分析显示,较易接近的非tss区域数对过度表达有预测作用(p < 2 × 10−16)但更开放的发起人不是(p=0.5;图1。1C),尽管忽略远端峰(TSS可达性增益大于1.3)时,TSS可达性增加的预测值较小,p=0.01)。

GM12878B细胞三维基因组结构研究13,我们发现在同一拓扑关联区域(TAD)中,与DEG相关的差异可达区域(DARs)有显著的富集。14与非公开的副秘书长-DAR协会相比(p < 0.001, see Fig. 1D)。我们还发现,相关系数的强度,即平均DAR-DEG相关系数和Dar-DEG的百分比(%)具有显著的相关性。p < 0.05), is higher when DEG-DAR pairs are in the same TAD compared to distance matched controls not in the same TAD (p=0.003,补充图。1H和I).

因此,髓鞘发育不全导致染色质可达性的总体增加,在TADS的空间范围内,染色质在远端区域而不是启动子上的去致密作用与癌症状态下的基因过度表达有关。

骨髓瘤pc中的过度可及染色质可根据mie部分区分不同的骨髓瘤转录体。

接下来,我们试图通过多组学因子分析(MOFA),以一种无监督的方式探索和解决MM患者的异质性。15(无花果)1E和F,补充图。2A)。我们发现,在ATAC-seq/RNA-seq联合模型中,染色质可达性比表达的差异更大(如图所示)。1E)。在前5位已鉴定的MOFA潜伏因子(LF)中,主要是染色质可及性驱动的LF1和主要转录体驱动的LF2将ND与骨髓瘤PC区分开来;接下来的3个因素,LF3-5将不同的MM患者区分开来。为了研究这种异质性的可能来源,我们叠加了每个样本的mie定义的遗传亚组特征。这揭示了ND,MAF和CCND 1亚组分离清楚,联合LF2,3和5的HD和MMSET较少(图5)。1F和g).

通过进一步询问作为观察到的分离的基础的MOFA预测因子,我们发现先前被确定为mie定义的基因亚群分类器,以及它们在同一tad中划分的连锁染色质的变化,在这三个LF上显示出相同的亚组-分离特征(图1)。)。我们使用两个MAF-,两个CCND 1-和一个MMSET易位骨髓瘤细胞系作为不用于训练模型的测试集来验证这一点,并证实了在LF2-LF3-LF5 MOFA空间中根据MIE分离样本(补充图1)。2B-d).

为了进一步探讨MOFA聚类的性质,我们应用了轮廓宽度(即簇内聚类和聚类分离的度量)和判别比(即组方差与组内方差的比值;见“方法”)。剪影宽度表明,LF1-5的可及性和转录组信息的结合提供了Nd,MAF和CCND 1的清晰分离,但HD和MMSET亚基分离不明显,这种分离比单独建立的RNA-seq模型更清晰(补充图)。2E).

当判别比用于衡量每个LF亚组的识别能力时,LF5的识别率最高,为22.7。为了了解ATAC-seq数据在这个模型中增加了多少歧视性的能量,我们只使用转录组数据训练了第二个模型。该模型中最优的判别因子为LF4,判别率为11.3,说明染色质可达性数据的加入几乎是最歧视因子对子群分离能力的两倍。对每个模型进行线性判别分析(附图)。2F在ATAC-RNA组合模型中,除1个MMSET样本与HD样本、1个HD样本与CCND 1样本外,其余亚型均有很好的分离。相反,对于只有RNA的样品,虽然MAF和ND样品分离得很好,但HD、MMSET和CCND 1样本基本上是重叠的。

因为CD 19之间没有差别+ 和CD 19NDPC细胞,合并后进行分析。

鉴于这些发现,我们得出结论,基于表观基因组转录组的MM分类可以将骨髓瘤PC与正常PC区分开来,而在主要MM基因亚组中,它清楚地描述了MAF和CCND 1亚组,而HD和MMSET亚组则较少。

骨髓瘤增强体与已知的新的mie相关基因和生物通路有关。

为了扩大我们描述异质性的能力,并考虑到远侧遗传元素在MM转录调控中的重要性,我们接下来试图通过基因亚组监督的方法来确定共同构成骨髓瘤特异性增强体的变化。我们确定了遗传亚组(MAF/MMSET/CCND 1/HD/ND)对可及性/表达有重要解释作用的区域和基因。p-数值<0.05和>2倍变化之间至少一米和钕,补充数据3)。这两组数据(4635个区域和3,096个基因)的整合给出了4199对dar-deg对,它们在1 mb之内(补充数据)。4),包括2581个独特的DAR和1354个独特的DEG。DAR可达性信号的分层聚类清楚地将不同的骨髓瘤MIE亚组相互分离(图1)。2A)。虽然这显示了一组变化与MIE相关的区域,但它也强调了不同骨髓瘤亚组之间共享的可及性变化。以MAF组为例,远端DAR的数量最高,与ND有2倍以上的差异,其中有些是MAF特有的,而另一些则是其他遗传亚组中的2倍以上。为了进一步验证这一点,我们将骨髓瘤PC(n=26)以前的一项研究11使用这些相同的2581个区域,并证实这些样本大多与本研究中携带相同MIE的样本聚在一起(补充图)。3A).

图2:骨髓瘤增强体调控的发育起源和致癌途径。
figure2

a热图显示ATAC-seq信号的所有峰被发现是差异开放和在一个显着的差异调节基因的1毫巴之内。数据是按行缩放的。样本使用Pearson的相关距离进行聚类,列上方的栏显示样本的子类型,如图所示。1A,即MAF:橙色,CCND 1:浅蓝,MMSET:绿色,HD:蓝色,其他:粉红色和ND PC:黑色/灰色。垂直条到右边的高亮区域,其中信号大于2倍,与NDPC不同.b示例区域HGF显示:每个亚型的平均atac-seq信号;h3k27ac信号MAF-转移细胞系(橙色)或CCND 1-易位细胞系(蓝色);FP密度:每个ATAC-seq信号中脚印的密度。c, d利用MSigDB数据库的“致癌标记”、“特征”或“管理基因集”中的基因集,对1 Mb内可达性增加的上调基因进行富集分析。e利用ChromHMM(NB朴素B细胞、GCB生发中心B细胞、MB记忆B细胞、TPC扁桃体PC、MM骨髓瘤PC)的蓝图表观基因组学研究表明,不同开放的泛MM细胞的染色质状态跨越B细胞的发育范围。提示在骨髓瘤(254)中有新的峰形成的增强剂。强联合H3K27ac和H3K4me1信号的染色质态被认为是活性增强子,并以星号表示。f荷马模体分析的径向图显示新骨髓瘤促进剂中前50位过度表达的TF基序。

值得注意的是,在2581个DAR中,977个(38%)接近一个以上DEG,1354个DEG中962个(71%)在一个以上DAR的1Mb范围内(补充数据)。4),而且常常存在于多个遗传亚组中。这些发现表明,不同的mie功能收敛到异常调节相同的染色质区域,这一过程与基于染色质可达性的收敛进化相一致。

至少有14例与远端DAR相关的DEG与骨髓瘤的发病机制有关,包括HGF16, Dkk 117UCHL 118(无花果)2B,补充图。3B和c和补充数据4)。在所研究的两个骨髓瘤细胞系中,这些区域被H3K27ac标记为活性促进剂的组蛋白标记,因此就染色质状态而言,它们可以被认为是一个真正的促进剂。

与2581个独特DAR相关的1354个独特的DEGS显示了对先前定义的骨髓瘤转录特征的总体富集(补充图)。4A),在其他途径中,在40%的MM患者中,致癌RAS通路也明显富集。3,19(无花果)2C和补充数据5A)。此外,还富集了刺猬路径,这之前曾涉及到对Hedgehog通路的调控。CCND 1CCND 220(无花果)2C)以H3K27me3和多梳抑制性复杂成分标记的基因在几种细胞类型中的过度表达(附图)。4B,补充数据5B)和有选择地表达在神经细胞类型中的基因的富集,特别是在HD和MMSET亚组中(补充图)。4B和c,补充数据5C).

最后,先前验证的mie基因分类器在其相应的遗传亚组中的富集程度最高(图1)。二维空间).

这些发现表明,具有调控潜力的DAR在很大程度上是由MIE形成的,尽管次级遗传事件也有可能造成这种情况。

在MM中发育性‘再委托’和‘新’形成促进剂。

接下来,我们试图深入了解与DEG相关的MM过度获取候选促进剂的发育起源.为此,我们跟踪了组蛋白标记组合富集(ChromHMM状态)所定义的候选增强子染色质状态。21),跨越不同的成熟B系细胞。22(无花果)2E和补充数据6).

考虑到活性增强剂需要对H3K27ac和H3K4me1联合富集23我们鉴定了254(在832)DAR预测的调节活性超过201 DEG在同一TAD仅存在于骨髓瘤而不是正常的PC(图一)。2E和补充数据6),即它们是新形成的(例如,预计会调节的增强子)。HGFUCHL 1(如上文所示)。对这254个DAR进行TF基序富集分析,发现TF的IRF和MEF家族可能是其活性的主要转录调节因子(图一)。2F)。此外,少数DAR在骨髓瘤pc中被“重新委托”,即在一个或多个B系细胞中活动,但在ND pc(补充数据)中不起作用。6).

因此,生化注释的远端不能接近的染色质剖面识别增强剂是骨髓瘤PC独特或发育遗传。

TF‘重新布线’显示骨髓瘤依赖性对预后有影响

接下来,我们使用了atac-seq足迹。24目的:探讨DNA结合因子与染色质在骨髓瘤和ND PC中的预测联系。在254人中,共有138人表达TF(图1)。3A和补充数据7A-c与NDPC相比,至少有一个骨髓瘤亚组的预测结合频率较高或相似,其中包括已知可调控骨髓瘤转录的TF,如XBP 1、IRF 4和PRDM 1,以及以前未与骨髓瘤生物学相关的TF(如Cbfb和ZNF 384)。3A、b和c)。另外116个TFs在至少一个MM亚群中与染色质结合,但在ND PC中不结合,包括已建立的、特定于亚群的致癌驱动因子(例如MAF)。在这116个TF中,几乎有三分之一被预测完全活跃在单个的子群中,ISL 2是一种神经TF。25以前没有链接到MM,只显示在HD分组中的活动(无花果。3A-c,以及补充数据7b).

图3:转录因子的“重新布线”支持MM中异常的调控基因网络。
figure3

a不同MM遗传亚组TF足迹相对频率的热图表征。TF是根据它们在正常供体和骨髓瘤PC(TOP)或仅在骨髓瘤PC(底部)中的存在而聚在一起的。灰色值表示缺乏TF表达和/或预测的结合。b用ATAC-seq法测定HD骨髓瘤PC中所显示的TFs的脚印。c不同骨髓瘤亚组与正常供体PC活性TFs的相对足迹频率差异。dTF依赖性分析使用高通量CRISPR从DepMap数据库筛选数据(代表CCND 1、MAF和MMSET遗传亚组的20个骨髓瘤细胞系;颜色编码)。在显示的247 TF中,137被预测将产生依赖性,其中前100位如下所示。指出了已建立的和新的(粗体)依赖关系的例子。在此分析中,依赖性被定义为至少4/20骨髓瘤细胞系的CERES评分<−0.2(水平虚线)。e)NDPC与骨髓瘤遗传亚组PC间差异表达的TF。

从DepMap数据库中检索到的CRISPR/Cas9筛选显示,至少有4/20骨髓瘤细胞系在CERES评分<−0.2的情况下对55%(137/247)TF依赖骨髓瘤细胞。三维空间和补充数据7D),并确认MM信元依赖于TF。CbfbZNF 384ATAC-seq足迹鉴定(图1)。3C和D)。有趣的是,与NDPC相比,只有13%(18/137)的TF在一个或多个骨髓瘤亚组中有不同程度的表达。3E)。这与骨髓瘤PC中TF活动“重新布线”的模式是一致的,这种模式不一定需要TF本身的转录去管制。

为了进一步定义TF的这种“重新布线”,我们为每个MM亚群和NDPC建立了基于结合加权频率和表达水平的TF调控基因网络。4A)。总的来说,与NDPC相比,我们在所有骨髓瘤亚组中观察到更多的活动TF。这些与其他TF形成了更高密度的调节连接,并显示了自动调节回路(补充图)。5A和补充数据7E),与每个骨髓瘤组>90%的TF结合频率增加相称(补充图)。5B)。例如,已建立的骨髓瘤细胞依赖性和PC谱系定义的TF IRF 4、XBP 1和PRDM 1,在HD、MMSET和CCND 1亚组中与其他TF的连接率也高于ND PC,而MEF家族的TF以前未与骨髓瘤生物学相关联,并预计将调控新形成的骨髓瘤增强剂(图1)。2F)显示更高的连接性和中间性(中心性)。DepMap CRISPR/Cas9屏幕上高度依赖MEF2C的骨髓瘤细胞系(图1)。三维空间),强调了该TF在MM生物学中的重要作用,至少是因为它在激活TF转录(例如IRF 4、XBP 1和PRDM 1(补充数据)方面发挥了推断的作用。7F).

图4:TF调控基因网络提供了MM疾病的生物学和临床见解。
figure4

a从脚印分析推断,每个骨髓瘤亚组和正常供体PC的TF调节基因网络。TF以相对TF结合频率(颜色)和表达式(节点大小)来衡量。b等级表的热图CXXC 1, BPTF, 马兹, KLF 13,CbfbRFX 5超过1000个人癌细胞株(CCLE数据集)。多发性骨髓瘤细胞系突出显示红色。条形图描述了每个癌症组的细胞株数。cMM患者分层CXXC 1, BPTF, 马兹, KLF 13,CbfbRFX 5表达(红、高、蓝、低)并用阿肯色州多发性骨髓瘤(n=414)和MMRF指南针数据集(n=745)。人力资源风险比

以MAF易位亚群为研究对象,对MAF易位骨髓瘤细胞系MM.1S(附图1)进行芯片seq,获得致癌MAF。5C)。MAF结合主要富集在TSS/启动子和基因间区域(附图)。5D)。对MAF结合位点进行的基序分析确定了MAF基序的显著富集(补充图)。5E)和IRF1-4、NRF 2/NFE2L2、ATF 3、BACH 1 TFs(补充图1)的基序。5F),也被预测在MAF亚组基因调控网络(补充数据)中是活跃的。9B).

6个TFs(CXXC 1、BPTF、Maz、KLF 13、Cbfb和RFX 5)显示,与ND PC相比,所有骨髓瘤亚组的连接性更高。7E这些TF以前没有与MM连接过,它们有另外三个值得注意的特性:(A)它们显示依赖于CRISPR/Cas9和siRNA屏幕上的DepMap(图9)。三维空间和补充图。5G),(B)在多发性骨髓瘤细胞株中的表达高于其他1000种癌细胞株;(C)它们的高表达对两个独立的骨髓瘤患者队列数据集的生存有显著的不利影响(图1)。4B和c)。此外,骨髓瘤细胞依赖于CXXC 1通过独立的shRNA敲除实验进一步验证(补充图)。5H)。综合起来,这一多层方法揭示了MM中TF依赖关系和预测变量。

的识别和特征CCND 2超增强剂

此外,我们亦设法找出及说明其规管机制。CCND 2在MM中过度表达。

MOFA分析的LF5完全分离MAF-从CCND 1-易位样本(图1)。1F和g),将极端相反的权重放在CCND 2CCND 1,分别(图1.5A)。Lf5还高度重视一系列开放染色质区域。CCND 2,将它们链接到增强的CCND 2的上游,而不是下游CCND 2(无花果)5B)。该区域的可及性与CCND 2的活动相关,而不考虑MIE(图1)。5C)。此外,使用h3k27ac和med1染色质标记的超级增强子调用MAF-转移的MM.1S骨髓瘤细胞通过两种标记物确定感兴趣的区域为真正的超级增强子(如图所示)。5D和补充图。6A).

图5:超增强子调节CCND 2骨髓瘤。
figure5

a.的表达之间的负相关关系CCND 1CCND 2所有MM和普通PC样本。最佳线性回归拟合为一条带灰色标准误差的蓝线。b1 mb内5个区域和6个基因的外显子分析结果CCND 2选择的区域和基因均按class 5‘>3’>方向排列.c的上游区域的平均染色质可达性CCND 2CCND 2基因在所有样本中的表达。d基因组轨迹可视化CCND 2区域。自上而下:用于交互的hi-c信号CCND 2GM12878 B细胞启动子;为CRISPRi实验设计的sgRNAs的目标位置;MAF-易位(橙色)和MMSET-易位(绿色)样品中MAF TF的预测脚印;MM.1S细胞中针对MAF、H3K27ac和MED 1的芯片seq信号;每种亚型中的正规化ATAC-信号,按平均顺序排列。CCND 2表情。e CCND 2Rna-seq在不同MM亚组和正常供体PC中的表达。在邻近轨道上被起诉的分组(d)。每个子组的所有值都显示为点、须盒(最小到最大)和平均表达式。f CCND 2大鼠CRISPRI后第4天的qPCR检测CCND 2超增强子和启动子区域。两个sgRNAs分别针对启动子(P)和四个主要峰(1-4)。CCND 2超增强剂,如(d),并与非目标控制(Gal4)进行了比较。误差条表示三个独立实验的均值+扫描电镜。统计分析:单因素方差分析与Dunnett后多项比较校正。*p < 0.05, ***p < 0.001, ****p < 0.0001. gTf基序的热图图显着地丰富了CCDN 2对决CCND 2低层HD样本,经差异足迹分析鉴定。在第3和第4峰中发现了不同的脚印(见图1)。5D).

与之一致的是,它是一种“重新委托”的增强剂。CCND 2在GCB和PC中被抑制,而在天真和记忆B细胞中活跃(补充图)。6B);因此,CCND 2在天真和记忆B细胞中表达,但不表达GCB细胞或PC(补充图)。6C).

利用GM 12878 B细胞Hi-C基因组数据13,我们确定了独占的、远距离的交互作用。CCND 2启动子与上游可访问簇的假定增强子(图。5D和补充图。6d)。在一种互补的方法中,我们使用KRAB-dCAS 9 CRISPRI在MAF-易位骨髓瘤细胞中抑制四个显著成分峰1-4的活性(图1-4)。5D)与CCND 2启动子。正如预期的那样,针对促进者的可访问性高峰导致CCND 2表达式中的CCND 2增强子,最显著的效果,类似于启动子峰,是由目标近端峰4和远中峰1可达区。(无花果。5F)。值得注意的是,可到达的峰1和4,但不是介于两者之间的其它峰,是在GCB和PC中被抑制的,但活跃于天真和记忆B细胞中(补充图1)。6B)。因此,峰1和峰4的相对重要性也从发展角度得到验证。

解剖了顺式.的调节机制CCND 2表达,我们接着描述了反式参与这一过程的因素。

以前的工作表明MAF绑定到CCND 2体外启动子26,提供了一些关于CCND 2是由MAF基因亚组调控的。重要的是,我们对MM.1S骨髓瘤细胞的芯片seq分析表明,mf与CCND 2在体内(如图所示)。5D),从而巩固其作为CCND 2过度表达MAF-转移的MM细胞。这一发现也提供了对CCND 2MMSET基因亚群的调控CCND 2MAF在较低级别表示26(无花果)5E和补充图。6E)。由于染色质可达性信号在MMSET中也低于MAF子群(图1)。5D和补充图。6E),这些发现与以下观点一致:CCND 2MAF组和MMSET组中的增强剂是MAF剂量依赖性的.

识别其他可能调节的TFCCND 2增强子活性CCND 2-表达HD MM(缺乏MAF表达),我们在CCND 2中进行了差异足迹分析。VS CCND 2低层HD骨髓瘤PC。5G和补充图。6f和g)。除了已知与MM有牵连的TF外(IRF 4、PRDM 1、FLI 1)11,27,我们还确定了TF的一种可能的调节作用,它以前与MM没有联系(例如CXXC 1、ZNF 394和IRF 3)。

最后,我们探讨了CCND 2超增强剂在B细胞慢性淋巴细胞白血病(CLL)中最常见的血癌(补充图)。7A和b)。CCND 2在位于增殖中心的CLL B细胞中有高表达。28,次级淋巴器官的结构,其中恶性B细胞接受生存和增殖信号28。CLL恶性B细胞表达显著增高CCND 2CCND 1水平(补充图。7b)CCND 2骨髓瘤PC,我们发现CCND 2超增强剂在CLL B细胞中具有活性(补充图)。7A)。这个观察扩展了CCND 2增强剂在更广泛的B细胞系恶性肿瘤。

讨论

我们对互补数据类型的分析有助于深入了解调控基因组的变化,特别是MM特异性增强体的变化,如何形成不同的髓鞘细胞转录子和下游生物通路。

增加所有骨髓瘤遗传亚组的染色质可及性,参照正常骨髓细胞,骨髓瘤PC正常,是我们的第一个基本观察。与以前的研究不同,我们在这里讨论了MM中染色质和基因表达的异质性。令人惊讶的是,我们发现染色质可达性解释了更多的变异,而不是基因表达。变异主轴与ND/MM和MIE分类有着惊人的相关性,并将子群定义为聚类,组合模型提供了比单独数据类型更好的分离效果。这对于三个IgH易位亚组中的两个是可能的,而对于HD MM则不那么可能,可能是因为后者代表了一个天生的生物异质群。虽然每个分组中的少量样本都认为在解释这一点时要谨慎,但我们能够用来自细胞株的独立数据来验证这些轴,而这些数据不是用来训练模型的。虽然利用原始样本中发现的峰值来评估细胞株可能会过分强调细胞株和原始样本的相似性,但它不应使特定的细胞系亚型看起来更像它们的主要同类。更大的未来数据集无疑将有助于进一步提高我们对与不同MIE相关的程序之间的差异的信心。我们发现以前被证明是由mie调控的标记基因和基因集也与骨髓瘤PC染色质的远端DAR相关。这表明这种染色质的变化在很大程度上直接或间接地依赖于mie。尽管如此,一些已鉴定的增强子被预测将调控由二次功能增益激活的致癌ras通路下游的基因。不-K-RAS40~50%MM患者的体细胞突变3,19因此,我们的方法也揭示了次级驱动基因事件的染色质痕迹的能力。未来的研究,专门针对预定义的、高频的二次遗传事件的影响(例如,RAS突变和MYC结构变异),将揭示这类次级事件在多大程度上影响染色质及其调节活动。另一个值得注意的特征,主要局限于HD和MMSET MM,是认为增强子与神经发生相关基因的邻近性以及TF的异位表达。ISL 2在HD中,MM就是一个很好的例子。虽然这一观察的功能意义还需要进一步的研究,但我们注意到最近的工作证明了神经基因在不同癌症中的异位激活,这些基因与中枢神经系统和外周神经系统有功能交叉。29,30.

利用B系细胞全谱中一组完整的染色质标记,我们验证了H3K27ac在骨髓瘤PC中832个易达的候选增强子区的存在。候选促进剂HGFUCHL 1示例新形成的增强子,即不存在于任何后期B族的发展阶段,而CCND 2增强子提供了一个“再委托”超级增强子的例子,即在骨髓瘤中活动,但在正常PC中不活跃。如属CCND 2在GCB细胞和正常PC细胞中,“重新激活”意味着在多发性梳状细胞的骨髓瘤PC中激活“平稳的”转录状态。

以及发现批判性顺式调节元素,ATAC-seq也提供了通过脚印和母题分析推断TF与染色质结合的机会。一个值得注意的发现是反式预测显示与染色质结合频率增加的因素在ndpc中已经很活跃,并且在mm中它们的表达并没有解除管制。这类tf与其他tf的频率相互作用比在ndpc中更高,并且更有可能自我调节,这些特性与增强的调节潜力有关。31。这些特性,如TF调控基因网络的构建所揭示的,导致了对功能和预后有影响的洞见。在MEF2C的情况下,它的预测目标TF包括典型的骨髓瘤PC依赖性,即IRF 4,PRDM 1,部分地解释了高度依赖于MEF2C的骨髓瘤细胞。同样,骨髓瘤细胞似乎对Cbfb和ZNF 384上瘾,这些细胞至今尚未与骨髓瘤PC生物学相关联。此外,CXXC 1,BPTF,MAZ,KLF 13,Cbfb和RFX 5,在MM中功能未知的六个TF的情况,也突出了我们的功能表观基因组学方法的优势。这些TF在MM中均无差异表达,但它们在所有骨髓瘤亚组中显示出更高的预测调节潜能,这可能反映了它们在骨髓瘤细胞中的高表达水平。此外,所有6个TF表现出明显的骨髓瘤细胞依赖性,并被发现强烈地预测预后。对于cxc 1来说,这符合它作为罗盘激活复合物的一部分对h3k4me3进行调控的已知功能,以及通过它与cpg岛的结合以及与组蛋白甲基转移酶SETD1A/B的相互作用。32,33。虽然对CXXC 1在胃癌中的作用知之甚少,但据报道,CXXC 1的过度表达预示着胃癌各个阶段的不良预后。34。因此,推测的TF网络为今后的研究提供了坚实的基础,这将进一步验证和确定TF在骨髓瘤生物学中的作用。

MM的广泛遗传异质性和多样性带来了巨大的治疗挑战。骨髓瘤生物学的显著特征之一是早期观察到细胞周期调节因子的二重过度表达。CCND 1CCND 2过度拱形遗传多样化4。而在大多数MM案例中,CCND 1可以用体细胞结构变异来解释,例如,与IgH增强子并置或chr11q25增益。31,这种做法并不能解释过度表达的原因。CCND 2。我们的识别和功能验证是通过远端的互补途径来实现的。顺式反式调整器CCND 2表达解决了MM生物学上的这一空白,并进一步了解了该增强子的活性如何在不同的骨髓瘤基因亚群中被调控。同时表达MAF在MAF子群中是最高的,因为它与强者并列。IgH增强子,在MMSET MM中的表达MAF是较低的,以前证明是由tf fos对活化的MAPK通路作出反应而调节的。35。MAF剂量上的这些差异很可能是mf结合时染色质可达性最强的原因之一。CCND 2增强剂和更高水平的CCND 2在MAF-易位MM中的表达,同样的增强子具有相同的发育染色质特征,调节着CCND 2在CLL细胞中,一种与CLL起源于天真或记忆而非gcb细胞的概念相吻合的发现。36.

总之,我们对MM调控基因组的剖析为进一步的生物学探索提供了洞察力和资源。临界性的发现及后续功能剖析CCND 2增强器是我们的多层综合计算方法的一个主要例子,并为基于增强子的治疗方法提供了机会。


武汉新启迪生物科技有限公司联系邮箱:
service@qidibio.com  techsupport@qidibio.com  
武汉新启迪生物科技有限公司咨询客服:周一至周五8:30-17:30
联系我们
服务保障                        支付方式
武汉新启迪生物科技有限公司联系电话:
027-87610298
027-87610297