离体基因表达亚型整合了黑色素瘤谱系 我们对68个早期传代黑色素瘤细胞系(“MDACC细胞系”)进行了基因表达谱分析,以表征特异性来源于黑色素瘤细胞的转录组特征,没有伴随的基质和免疫成分。总共对来自62名患者的不同转移性肿瘤的68个细胞系进行了RNA测序(RNA-Seq ),广泛调查了不同亚型和临床背景的黑色素瘤(补充数据 1 ).使用前1500个最大变异基因的非负矩阵因子分解(NMF ),通过无监督一致性聚类鉴定了三种不同的转录组亚型(补充图。 1a–c ).差异基因表达分析鉴定了聚类1中上调的98个基因(补充数据 2 ,图。 1a ),我们称之为黑素细胞样(MEL)集,因为存在经典的黑素细胞标记物(例如 小眼畸形相关转录因子 , 黑色素A , 战神蒂尔 , 离散余弦变换 , 银币 , 奥卡2 , SOX10 ),以及黑色素生物合成过程、黑色素细胞分化(假发现率(FDR) < 0.005)的显著基因本体(GO)富集,以及黑色素生成KEGG途径的富集(FDR < 0.10)(补充数据 3 ).类似地,在聚类3中有149个基因上调,我们称之为间充质样(MES)集(补充数据 2 )由于包含了经典的EMT相关基因(例如 ZEB1 , 腋下淋巴结闪烁法 , ADAM12 , COL1A1 /5A1 /6A2 ),富含细胞外基质组织、细胞粘附和细胞迁移的GO(FDR < 0.00001),富含病灶粘附和PI3K-AKT信号KEGG途径(FDR < 0.0005),与更易运动/侵袭的表型一致(补充数据 3 ).
图MEL和MES簇之间差异表达的基因。 差异表达的基因( p < 0.05) between MEL and MES samples. a 早期传代黑色素瘤MDACC细胞系( n = 53,另见补充图。 2b,d ). b 高纯度转移性TCGA黑色素瘤样品( n = 77,绝对和/或CPE纯度= 0.85),通过基于MEL和MES基因表达的cNMF聚类进行聚类分配(一个MEL基因在TCGA数据中不可用)。在两个图中,通过降低MEL-MES分数(参见“方法”)在每个聚类内对样品进行排序(从左到右)。源数据作为源数据文件提供。
混合的神经和可塑性特征定义了非MEL/非MES状态 MEL或MES基因高表达的黑色素瘤细胞系分别被称为处于MEL或MES状态。第三组聚类样本(聚类2)的存在表面上与其他人先前提出的黑色素瘤表型转换模型中的过渡状态一致 1 ,2 ,37 ,38 。与MEL和MES状态样品相比,聚类2样品显著富集了78个基因的表达,并降低了6个基因的表达(补充数据 2 ),具有针对鞘脂代谢、轴突导向、JAK-STAT信号传导途径、VEGF信号传导途径、BCR信号传导途径、粘着斑、凋亡、胰腺癌、小细胞肺癌(所有 q = 0.061),以及TCR信号通路( q = 0.085)(补充数据) 3 ).
为了进一步描述聚类2的特征,我们使用了SubMap算法 39 比较我们的细胞系和先前的黑色素瘤转录组分析之间的聚类分配;MEL状态与Tsoi等人描述的“黑素细胞”状态高度且特异性相关。 38 ,而MES状态与“未分化”状态高度相关,与“神经嵴样”状态弱相关。聚类2与Tsoi的“神经嵴样”和“暂时性”状态高度相关(补充图。 1d ),第2组富集的基因显示出至少5%的重叠,仅与“暂时的”、“暂时的神经嵴细胞”和“神经嵴细胞”信号重叠。在簇2样品中下调的基因仅与“黑素细胞”标记有少量但显著的重叠(补充图。 1e ).总的来说,这些发现支持将具有神经嵴特征的混合过渡状态分配给我们的组2,因此我们称之为“神经可塑性”(NPLAS)状态。这还得到了基因集合富集分析的支持,基因集合富集分析是用Rambow等人提出的信号在我们的三簇模型中特异性富集/缺失的。 40 基于黑色素瘤异种移植物的单细胞测序分析。MEL基因集合富含Rambow MITF、有丝分裂、色素沉着和免疫信号( q < 0.001), and the hypometabolic signature (q < 0.005), consistent with the interpretation of the MEL state samples as being more melanocytic/differentiated and proliferative. Differentially expressed genes in NPLAS samples were enriched for the Rambow neuro signature (q < 0.001), supporting our designation of these samples. Finally, the MES state samples were enriched for the Rambow invasion signature (q < 0.001), also consistent with the known invasive/motile potential of EMT-shifted cell states.
普通生物学支撑着已公布的基因组 我们还评估了我们的MEL和MES基因组与来自黑色素瘤微阵列分析的几个已发表的转录组特征的相似性(Hoek等人。 2 )、测序(Verfaillie等。 41 )和单细胞研究(Tirosh等人。 6 )(补充图。 1f ).与Tirosh组的重叠主要由MEL基因驱动;MEL和MES表达与Hoek基因组的重叠相当平衡,这与两种基因组发现策略一致,考虑了表型的极端情况,以达到差异表达的目的。MEL和MES基因与Verfaillie基因组的重叠也是平衡的,尽管由于它们的大尺寸和非编码RNA种类的含量,绝大多数Verfaillie签名基因与任何其他签名缺乏重叠。我们的黑色素瘤细胞系组的重新聚类基于所有这些基因组的表达,排除了非编码基因、不赞成使用的基因或假基因的含量,证明了总体良好的一致性(补充图。 2a ),这与驱动样本聚类的共同基础生物学一致,而不是基因签名冗余,因为这些签名中包含的特定基因的重叠相对最小。
一般来说,来自同一患者的黑色素瘤细胞(来自5名患者的11个样品)紧密聚集在一起,少数较低纯度的样品始终处于MES状态(补充图。 2b ).为了能够将我们的细胞系组中定义的MCS应用于其他数据集,我们使用cNMF聚类分配作为分类输入,在我们的黑素瘤细胞系上训练了随机森林MCS分类器算法(参见方法;根据可变重要性度量,前20个信息最丰富的基因显示在补充图。 2c ;补充数据中显示的最终模型中保留的基因 4 ).在去除较低纯度或非皮肤黑色素瘤亚型的样品后,对53个细胞系的精炼子集进行后续分析,并且每个个体来源患者仅保留一个不同的细胞系(图。1a 详情见补充图。 2b,d ).
MCS可以从大量肿瘤基因表达数据中推断出来 为了确定在高纯度黑色素瘤群体中体外定义MCS的基因组是否也能识别黑色素瘤中的簇,我们检测了它们在来自癌症基因组图谱皮肤黑色素瘤(SKCM)数据集(以下称为“TCGA黑色素瘤”)的转移性样品中的表达 42 。在高肿瘤纯度转移中(癌细胞分数≥ 0.85(细胞核比例),平均纯度= 0.91 (CPE,见“方法”); n = 77),分别有24个(31%)和15个(19%)样品主要显示MEL或MES基因表达,其余38个(49%)聚集在第三个较不特异的组中,类似于细胞系中的NPLAS组(图。 1b ).当考虑所有转移性肿瘤而不考虑肿瘤纯度时(%肿瘤细胞核≥ 0.50,平均纯度= 0.70 (CPE,见“方法”); n = 368),观察到相似的MEL或MES基因表达模式,尽管MEL和NPLAS基因表达模式之间的描述不太精确,正如在较低平均肿瘤纯度的样本群组中所预期的(补充图。 3a ).值得注意的是,与无监督的cNMF方法不同,当将样品分类为MES时,随机森林MCS分类器显得高度保守,很大程度上将主要表达MES基因的样品指定为NPLAS,这表明在大块(即多细胞)肿瘤的情况下,基因表达数据包含干扰分类器识别MES样品能力的信号。然而,尽管在对一些个体样本进行分类时存在这些明显的限制,MEL和MES基因集合可以广泛地用于推断包含在整个(大块)肿瘤中的黑色素瘤细胞的MCS。
MCS与肿瘤免疫含量有关 为了确定MCS是否影响肿瘤免疫成分,我们基于MEL和MES基因表达,使用cNMF聚类对所有转移性TCGA黑色素瘤样本进行分类。然后我们用MCP-counter算法从基因表达数据中估计主要免疫和基质细胞类型的含量 43 并观察到三个MCS组之间免疫组成的显著变化(图。 2a ).当免疫浸润时,MEL样品通常显示淋巴样/单核细胞含量,MES样品显示高基质(内皮、成纤维细胞)和/或髓样/单核细胞含量,而NPLAS样品往往具有最少的多谱系免疫表现(图。 2a–c ).然而,一些MEL样品显示出溶细胞标记物的显著富集,例如 PRF1 和 颗粒酶A (图。 2d ).大多数淋巴细胞标记基因的中值表达水平在不同的MCS组中有所不同,包括调节分子 FOXP3 , PDCD1 , CTLA4, 和 LAG3 ,在NPLAS样品中观察到最低的表达,(所有 q < 1e−03; Supplementary Fig. 3b ).MES样品显示出M2-巨噬细胞标记物的显著更高的表达 MRC1 (CD206), CD163 ,以及 IL10 与其他MCS相比(所有 q < 1e−10; Fig. 2e ),这种细胞群与多种癌症类型中促癌肿瘤微环境的形成有关 44 ,45 .
图2: MCS与肿瘤免疫含量的差异有关。 a 任何肿瘤纯度的转移性TCGA黑色素瘤样品中免疫和基质细胞类型组成的热图( n = 368)是使用MCP-反转录组解卷积得到的。还显示了TCGA黑色素瘤元数据中提供的来自组织学检查的肿瘤细胞纯度估计值(%肿瘤细胞核,范围60-100%),以及使用MEL和MES基因表达通过样品的cNMF聚类定义的MCS成员。给出了Benjamini-Hochberg校正后的统计显著性 q 值,来自双面Kruskal–Wallis测试,用于检测三个集群之间的差异。在相同的转移性TCGA黑色素瘤样品中( n = 368),( b )MCP-计数器内皮细胞标记分数,以及( c )MCP-计数器成纤维细胞信号分数,( d )细胞溶解标记 PRF1 和 颗粒酶A , (e )关键的M2-巨噬细胞标记基因 MRC1 , CD163 和 IL10 。在( b –e ),本杰明-霍赫伯格纠正 q 显示了所有三个样本类别的双边Kruskal–Wallis测试值。箱线图显示了中间值(粗条)、第一和第三个四分位数(分别为方框的下限和上限)、1.5倍四分位数范围内的最低和最高数据值(须的下限和上限),并显示了所有单独的数据点。源数据作为源数据文件提供。
基质信号混淆了MES样品中MCS的解释 在MCP-counter用来计数10个非癌细胞群的基因组中,只有成纤维细胞(8个基因中的3个共有; COL1A1 , COL6A1 , COL6A2 )和内皮(33个基因中的2个共享; ESM1 , HECW2 )基因组表现出与MES基因组的重叠,并且没有观察到与MEL基因组的重叠。此外,我们应用了四种广泛使用的免疫反卷积算法(EPIC 46 ,数量序列 47 ,MCP计数器 43 、和定时器 48 )与我们的细胞系数据(其中非肿瘤成分很少或不存在)进行比较,并证实对黑色素瘤样品中基质和骨髓信号的估计非常不准确,对MES群集黑色素瘤样品中癌症相关成纤维细胞评分的估计尤其不可靠(补充图。 4 ).TCGA黑色素瘤样本的MCS亚型之间的肿瘤纯度并不相同,尽管通过组织学评估更相似(组织学的肿瘤细胞百分比中位数;85% MEL,90% NPLAS,85% MES; p = 4.8e 05,Kruskal–Wallis检验)而非MES样本得分最低的基因组测量(CPE方法的中值纯度估计值;0.79 MEL,0.82 NPLAS,0.66 MES p = 2.2e–16,克鲁斯卡尔–沃利斯检验)。总之,这些数据表明,如果仅基于基因表达,MES状态黑色素瘤细胞和基质成分之间重叠的基因表达谱,以及潜在的在某些情况下较低的肿瘤纯度,混淆了黑色素瘤中基质去卷积的解释。
MCS基因表达模式表明复杂的潜在调控 MEL/MES基因在我们的黑色素瘤细胞系中的表达揭示了独特的模式,表明了多种调节输入的顶点,包括规范标记基因的分级(线性)关系,如 小眼畸形相关转录因子 (梅尔)还有 ZEB1 和 腋下淋巴结闪烁法 (MES)或开关样表达(突变和非重叠的“开”或“关”表达水平) SOX10 和 内皮素受体B抗体 (梅尔)还有 肾小球滤过率 (MES)(图 3a ).为了理解这些MCS定义的基因如何实现复杂的表达模式,我们接下来分析了相同的黑色素瘤细胞系的体细胞突变、CNA、DNA甲基化、蛋白质水平以及miR和lncRNA表达(补充数据 5 和 6 ).
图3:突变和DNA甲基化与MEL或MES基因表达的关系。 a Violin图比较了早期传代黑素瘤MDACC细胞系( n = 53)揭示了基因表达和样本聚类类型之间的几种不同类型的关系。这些包括:分级关系(跨MCS表达水平的逐渐转变,例如 小眼畸形相关转录因子 , 腋下淋巴结闪烁法 , SLC24A5 );切换(非重叠高/低)关系(例如 SOX10 , 内皮素受体B抗体 );或者几乎只在一个MCS中表达的基因(例如 肾小球滤过率 ).方框表示中间值(粗条)、第一个和第三个四分位数(分别为方框的下限和上限)。小提琴(核概率密度)延伸到最低和最高的数据值。显示了所有单独的数据点。b 影响黑色素瘤中常见突变或拷贝数改变的一组基因的基因组改变,cNMF衍生的MCS簇在上面基于RNA表达、miR表达、蛋白质表达(通过RPPA测量)或DNA甲基化模式的轨迹中显示。每个样品的突变类型(同义或非同义)和核苷酸变化的汇总数据如下所示。左边的直方图显示了影响每个基因的基因组事件的累积频率。 c 热图和分割图显示全基因组CNA,比较由cNMF定义的MCS分组的MDACC细胞系的结果。源数据作为源数据文件提供。
MCS不是由突变差异驱动的 在影响黑色素瘤中已知癌基因和肿瘤抑制基因的突变和CNA的多样性景观中49 (图。 3b ),最常改变的基因是 黑色素瘤 (73%), CDKN2A (71%), CDKN2B (57%), 抑癌基因 (55%),以及 TP53 (55%),患病率高 投资物业 该队列中的突变(41%)。复发改变的基因和MCS之间几乎没有联系;然而,我们确实观察到更高频率的 黑色素瘤 MEL示例中的热点事件( p = 0.016,费希尔精确检验)和 投资物业 MES示例中的热点事件( p = 0.03,Fisher精确检验),与这两个基因的典型互斥改变一致。在高纯度TCGA黑色素瘤样本中, 黑色素瘤 突变与MCS无关(补充图。 5 );因此,我们不能排除潜在的选择优势 黑色素瘤 体外培养时突变的MEL样品。在核苷酸水平,突变主要是由C>T转变引起的,这是黑色素瘤的典型紫外特征;三种MCS之间没有明显的突变特征差异(图。 3b ).
MCS显示出明显的CNA模式 与突变景观相反,在MCS之间观察到明显的CNA差异,MEL样品显示染色体1p、7q和15 (p + q)的相对增加,以及染色体9p、11 (p + q)、18p和19q的损失(图。 3c ).作为一个群体,MEL基因比MES基因更常受到基因水平CNA的影响(98个MEL基因中的32个(33%)对149个MES基因中的35个(23%),卡方检验 p = 0.15;补充数据 6 ).此外,影响MES基因的CNA通常是由MEL或NPLAS样品中基因水平的损失驱动的,而不是MES样品中的增加,这与主要发生在MEL细胞中的CNA事件(任一方向)一致。
三个MCS的不同的全局拷贝数分布图,特别影响染色体7q、8q、10和18(图中的红色星号)。 3c ),似乎与仅由MEL和MES分布图的组合组成的NPLAS状态不一致,正如位于MEL-MES谱中间的真正过渡或混合状态所预期的那样。然后,我们在癌细胞系百科全书(CCLE)的黑色素瘤细胞系中检测了这种关系,使用RNA-Seq数据和cNMF聚类来定义每个样品的MCS(补充图。 6a )接着比较每个聚类的全基因组分段CNA谱(补充图。 6b ).如同在我们自己的细胞系中一样,NPLAS样品的CNA谱显示明显不同的CNA区域(例如2p、5p、9q、12q、14p、18 ),与这些样品不一致,代表含有MEL和MES谱的细胞的混合物或替代表型状态,支持不同NPLAS状态的存在。重要的是,在CCLE样本中观察到的区域性CNA并不直接等同于我们早期传代细胞系中观察到的;以前的研究 50 已经证明了体外长期传代后样品中拷贝数分布的演变,这可以解释其中的一些差异。
DNA甲基化与MCS相关 接下来,我们确定了许多与MEL和MES基因表达密切相关的DNA甲基化,它们在典型的启动子/增强子或基因体位点上起着不同的作用。常规黑素细胞标记物的转录水平(例如 银币 , 黑色素A ,以及 战神蒂尔 )众所周知,它们主要受MITF的管制 4 ,51 ,和的 小眼畸形相关转录因子 本身与细胞系和TCGA黑色素瘤样品中的DNA甲基化显著负相关(图。 4a ,补充数据 6 –8 ).黑素细胞分化标记物的表达(例如 黑色素A , 战神蒂尔 , TRPM1,DCT )在NPLAS样本中变化很大,DNA甲基化经常与低表达相关,类似于在MES样本中发现的情况(补充数据 7 –8 ).尽管EMT上调基因的DNA低甲基化 腋下淋巴结闪烁法 和 KRT8/18 52 在MES样本中观察到,其他MES基因与DNA甲基化正相关,包括 EGFR,EPHB2,WNT5A ,以及 SERPINB7 (图。 4b ,补充数据 6 , 9 , 10 ).在某些情况下,同一基因不同区域的DNA甲基化与转录本丰度存在不一致的关联。例如,启动子甲基化 ZEB1 与低 ZEB1 表达(MEL样本)与基因体甲基化高度显著相关 ZEB1 表达式(MES示例)(图。 4b ,补充数据 6 , 9 , 10 ).在体外,与MES状态细胞系相比,MEL状态细胞系显示出对整体低甲基化剂地西他滨(5-氮杂-2′-脱氧胞苷)的敏感性增加,这表明MEL状态细胞中存在更特异的细胞毒性/细胞抑制作用(补充图。 7a ).这是否是由于MEL细胞中特定甲基化事件的更大依赖性,或者MCS之间低甲基化到高甲基化事件的不平衡,仍有待确定。
图4: DNA甲基化证明了与MEL和MES基因表达的位点和基因特异性关联。 a , b 具有统计学意义的DNA甲基化事件概述( a )3个MEL基因和( b )3个MES基因,与观察到的完全阴性(绿色条)、完全阳性(粉色条)以及单个甲基化探针和所示基因表达之间的混合相关模式形成对比。FDR修正的双边Spearman相关p 显示值。对于每个基因,MDACC细胞系中的DNA甲基化显示在左边,TCGA黑素瘤样品中的DNA甲基化显示在右边;注意,由于使用的处理管道,可用的数据集报告每个基因的重叠但不相同的探针组。
为了确定表观遗传老化的差异是否是MCS的特征,我们使用霍瓦特方法评估了黑色素瘤细胞系的DNA甲基化年龄(DNAmAge)估计值 53 。我们发现,在对源肿瘤取样时,患者的实际年龄与计算的DNA损伤之间的相关性非常差,与最初描述的多种肿瘤类型相似(补充图。 7b ).尽管数据离差很大,但线性回归显示MEL和MES组的趋势非常相似,无论年龄大小,DNAmAge几乎不变(斜率= 0.024 MEL,0.023 MES)。相比之下,NPLAS样本的表观遗传年龄与实足年龄呈正相关(斜率= 0.50)。与不同的CNA图谱一起,这些发现进一步支持了NPLAS和MEL或MES状态之间存在基本的分子差异。
差异表达的miRs表征了MCS MiRs对基因表达进行转录后调节。因此,我们使用小RNA测序进行了全miRNome分析,发现MEL中13个miRs和MES细胞系中9个miRs显著差异上调(图。 5a 和补充数据 6 ).在逐个基因的基础上,MEL相关的miRs和MES基因之间存在一致的负相关,在细胞系中反之亦然(补充图。 7c );这些关联在高纯度转移性TCGA黑色素瘤样本中基本保持(补充图。 7d 和补充数据 6 ).在受CNAs影响的基因和显示miRs调节证据的基因之间观察到最小的重叠(补充数据 6 ),表明添加剂的调节潜力。
图MEL和MES基因表达与细胞系中成熟链miRs之间的反向关联在黑素瘤肿瘤中得以保留。 a 描绘MEL和MES早期传代MDACC黑素瘤细胞系之间差异表达的miRs的表达的热图( n = 53). b 在早期传代细胞系中,MEL和MES样品之间差异表达的miRs的丰度与被至少一个实验验证的和/或至少两个计算机模拟的miR靶数据库确认为这些miRs的靶的mRNAs组之间的逆Pearson相关性。靶向MES基因的miRs比靶向MEL基因的miRs多;8个活性MES靶向miRs(在MEL样品中高表达)和4个活性MEL靶向miRs(在MES样品中高表达)。 c 在细胞系中鉴定的大多数miR-mRNA关联也在TCGA黑色素瘤组织样本中观察到。 d miR-211-5p在细胞株中过度表达的作用 ZEB1 mRNA表达。条形图描绘了在对照(白色条)或miR-211-5p模拟(灰色条)处理条件下三个生物重复的平均值+ SD。 e 细胞系中ZEB1蛋白表达的代表性蛋白质印迹显示了对照和miR-211-5p过表达条件的比较。源数据作为源数据文件提供。
根据验证和预测的miR靶数据库,22个差异表达的miR中的12个在其已知的调控靶中具有至少一个MEL或MES基因(参见“方法”);图。 5b,c ).这组中差异表达最高的miR是miR-211-5p,一种已知的黑色素瘤肿瘤抑制因子 54 位于的内含子内 TRPM1 基因,MEL基因集中的一员。的协调上调 TRPM1 并且miR-211-5p在MEL样品中与共享的转录调节一致,在miR-211-5p的情况下,由于miR靶向几个MES基因,其增强MEL基因组表达,包括 EPHB2 , THSD4 (包含4的凝血酶敏感蛋白I型结构域), NUAK1 (EMT的促癌驱动因素) 55 , KCNMA1 (癌症侵袭和转移) 56 ,以及 ZEB1 (黑色素瘤中EMT样过程的关键驱动因素) 7 .事实上,miR-211可以在黑色素瘤的不同细胞状态和微环境条件下发挥肿瘤抑制或促进作用,至少部分依赖于靶mRNA的表达。我们证实miR-211-5p靶向 ZEB1 并且在体外具有高内源水平的ZEB1的黑色素瘤细胞中,在转染介导的miR-211-5p过表达之后,证实了ZEB1蛋白的敲低(图。 5d,e ),支持我们的方法的有效性,以确定有意义的多模式监管关系。miR-31-5p的水平与其靶MEL基因的表达呈负相关 内皮素受体B抗体 已知在正常黑素细胞发育以及黑素瘤增殖、转移起始和BRAF抑制剂抗性中起重要作用 57 ,58 ,59 。此外,MEL基因的mRNA水平 IRF4 , IL16 ,以及 IL6R ,所有这些都具有影响淋巴细胞活化、趋化和分化的已知免疫调节作用,在表达MES相关的miR-125b-5p的细胞中减少,暗示miR-125b-5p作为黑色素瘤中的泛免疫修饰miR(图。 5b,c ).
长的非编码RNA在MCS之间差异表达 几种lncRNAs在MCS之间高度差异表达(补充图。 8a–d ).与MES相比,MEL样品富含 LINC00518 ,一种在基因签名分析中区分黑色素瘤和痣的标记 60 并且与葡萄膜黑色素瘤的预后相关 61 (补充图 8a ).相反,MEL样本中缺氧诱导因子水平较低 H19 这可能通过以下方式引发传播表型 蜗牛 上调 62 (补充图 8c ).尽管这些非编码RNA种类的绝对表达水平可能较低,但对靶基因表达的影响的显著信号放大可能是这种多步骤相互作用的特征。为了阐明促进特定MCS的分子机制,需要对lncRNA关联进行详细的实验评估。
对调节方式的综合评估表明MEL状态的固有可塑性较小 为了进一步使用MDACC细胞系比较MCS之间的多模式调节,我们产生了组合表示,并总结了MEL和MES基因组每个成员的CNA、DNA甲基化和miR的三种独立调节模式作为定向分类因子(1 =显著负相关,+1 =显著正相关,0 =无显著相关;见方法)并根据相似的多模式调节模式对基因进行聚类(图。 6a、b ;补充数据 6 ).一小组基因显示了所有3个调节特征:MEL基因 小眼畸形相关转录因子 , TBC1D16 , ENDRB , RAB27A , HPS4 , SLC16A6 , IL16 ,以及 SGK1 ;和MES基因 AFAP1 , ZEB1,GLIS3 , MICAL2 , ARNTL2 , AMOTL2 ,以及 平滑肌 (图。 6a、b ;补充数据 6 ).CNA通常与至少一种额外的监管模式同时出现,尽管偶尔与miR监管(67 CNA监管;48个(72%) DNA甲基化共调控,20个(30%) miRNA共调控)。DNA甲基化事件是孤立发生的最常见的调节方式(247个基因中的109个,44%;图。 6a、b ).总的来说,MEL基因比MES基因更频繁地发生拷贝数改变(98个MEL基因中的32个(33%)比149个MES基因中的35个(23%)并且更高比例的MES基因显示出由非CNA机制调节的证据(149个MES基因中的86个(58%)比98个MEL基因中的43个(44%)显示出非CNA调节; p = 0.045,卡方检验)。MEL基因受抑制性DNA甲基化模式(58个阴性对9个阳性mRNA甲基化相关)的影响明显大于强化性DNA甲基化模式占优势的MES基因(49个阴性对58个阳性相关;梅尔对梅斯 p = 1.8e–07,卡方检验)。此外,已知其表达增强分化状态的基因( SOX10 和 小眼畸形相关转录因子 )的拷贝数被扩增,而将细胞转变为去分化状态的基因( 腋下淋巴结闪烁法 和 ZEB1 )在熔化样品中等位基因拷贝数低(补充数据 7 , 9 ).单个NPLAS样本通常表示为腋下淋巴结闪烁法 或者 ZEB1 ,而MES样本表达了这两者 腋下淋巴结闪烁法 和 ZEB1 在高水平上,以高 肾小球滤过率 表达是这种MCS的一个决定性特征,这些基因中的每一个都受到多种调节方式的控制(图。 6c ).相反,高度调控的MEL基因 内皮素受体B抗体 表现出频繁的不一致 小眼畸形相关转录因子 和它的转录目标基因 TRPM1 63 作为具有NPLAS表型的细胞的定义特征(图。 6d ).值得注意的是, TRPM1 和包含在其内含子内的miR-211基因座,位于MEL样品中最显著差异的CNA区域之一(染色体15q13)(图。 3c )并且还受到抑制性DNA甲基化模式的影响(补充数据 7 ) 。因此,高度分化(MEL)状态与较高的固定结构异常负荷相关,增加了这种状态固有地不易受化学或其他微环境信号干扰的可能性,这可以解释MEL样品在已发表的细胞系和肿瘤样品队列中较高的流行率 1 ,64 。并非所有在肿瘤细胞(细胞系)中确定的调节关联在TCGA黑色素瘤样本中仍然是可识别的(补充数据 6 ),这可能是由于甚至在高纯度肿瘤样品中存在的细胞类型的多样性稀释了基因组信号,但是细胞系和TCGA黑素瘤队列之间起源的组织部位的差异可能影响了这些发现。然而,在聚类水平观察到的整体模式(例如,影响MEL基因的CNA优势)被保留。
图6:对MEL和MES基因表达的多模式调节影响。 监管协会与表达的( a )融化基因和( b )MES基因概述(从内到外):CNA、miR表达、基因启动子、基因体和任何位点的DNA甲基化。根据活性调节机制的相似性对基因进行分组,通过使用高尔距离的无监督聚类来确定,如方法中所述。DNA甲基化和基因表达之间的关联方向用颜色表示(橙色=反向,绿色=正向)。 c , d 在标志基因上活跃的关键分子调节影响( c ) 肾小球滤过率 以及( d ) 内皮素受体B抗体 ,指出影响的关键特征 ZEB1 /腋下淋巴结闪烁法 和 小眼畸形相关转录因子 /TRPM1 分别在MES和MEL基因中。自上而下,注释行表示:(上块)MCS组(“Type”)、基因表达(“mRNA_Expr”)、拷贝数(“CopyNum”)、拷贝数增益/损耗(“增益/损耗”);(中间部分)基因表达 小眼畸形相关转录因子 , SOX10 , TRPM1 , ZEB1 和 腋下淋巴结闪烁法 ;以及(在下面的方框中)所示的显著反相关的微小RNA成熟链(miRs)的表达。相关统计数据以图形方式显示在每个特征的右侧;单边(正)Spearman相关 p 值(mRNA-拷贝数)和FDR校正的双边皮尔逊相关 p 值(mRNA-miR)。样本按照EGFR的表达式从左到右排序( c )或EDNRB( d ).单个样本的缺失数据用白色表示。源数据作为源数据文件提供。
黑色素瘤样本供体的临床结果与MCS相关 许多研究探索了黑色素瘤基因表达特征和治疗结果之间的联系 12 ,23 ,65 ,66 但通常受限于肿瘤取样与研究中治疗开始的时间,或实验模型之间的差异。我们利用黑色素瘤细胞系队列来源患者的综合临床数据来评估MCS是否与供体患者接受下一步治疗的临床结果相关。我们的队列提供了一个系统治疗方案的广泛调查,包括细胞毒性,靶向和免疫治疗(最常见的类别;TIL疗法,MAPK靶向疗法,生物化疗,每一种 n = 7;图。 7a ,补充数据 1 ).这些组中的每一组都显示出在MES样本中临床获益持续时间(定义为从首次给药到开始另一疗程的时间)较短的趋势,尽管正式分层分析的样本数量有限(补充图。 9a ).当考虑所有接受后续治疗的患者时,无论治疗类型如何,MES样本的临床获益持续时间数值较低(MEL 172d [IQR 86-413d],NPLAS中位数121d [IQR 79-180d],MES中位数79d[IQR 34-97d];图。 7b ).有趣的是,在基于MEL/MES基因表达严格聚类为两类而细分为更类似MEL或更类似MES的亚组后,在NPLAS样品中也观察到这种趋势(图。7b ).不出所料,梅尔州的细胞系 黑色素瘤 V600E 与高度耐药的MES和NPLAS样品相比,突变对体外BRAF抑制剂vemurafenib治疗明显更敏感,在1微米时几乎完全丧失生存能力(补充图。 9b ).
图MCS的临床关联。 a 患者接受的系统性治疗( n = 53)后,从肿瘤收获物中产生早期传代细胞系,按治疗类别分组。每个类别中的患者总数显示在每个条形的上方,每个肿瘤衍生细胞系的MCS以彩色显示。 b 从收获产生细胞系的肿瘤后开始下一次全身性治疗,直到需要进一步改变治疗或最后一次随访的时间,以天为单位。箱线图表示中间值(粗条)、第一个和第三个四分位数(分别为方框的下限和上限)、1.5倍四分位数范围内的最低和最高数据值(须的下限和上限),以及所有单个数据点(n = 41)。 c Riaz队列中PD-1抑制剂治疗前样本的MEL和MES基因表达热图,按MEL-MES评分递减排序(见“方法”)。客观反应治疗(反应),采样时间点(时间点;显示了每个样本的所有预先分配的和随机森林模型分配的聚类(RFcluster)。 d Riaz PD-1抑制剂队列中的纵向取样患者显示了在模型分配的聚类类型中表现出MES-wise转变(即MEL至NPLAS,MEL至MES,或NPLAS至MES)的患者中较高比例的应答者的趋势( p = 0.069,双侧Fisher精确检验)。源数据作为源数据文件提供。
MEL状态与有利的肿瘤免疫微环境和CPI后的衰竭相关 PD-1 CPI现在形成了黑色素瘤治疗的主干,但在我们开发大多数细胞系时还没有广泛使用。因此,为了评估MCS和PD-1阻断反应之间的关系,我们利用了公开的PD-1前和PD-1上CPI黑色素瘤样本的基因表达谱数据集 67 。正如所料,基于MEL和MES基因表达,样品清楚地分成三个MCS(图。 7c ),不考虑治疗前或治疗中的时间点,推断出的每个聚类的免疫含量与在TCGA黑色素瘤样本中观察到的相似,值得注意的是,这些样本是未经治疗的(补充图。 10a,b ).我们使用在MDACC细胞系样本上训练的随机森林分类器模型(见方法)将MCS类别分配给个体样本,并发现整个队列中MCS亚组之间基于RECIST的客观反应(二元反应者/无反应者)有显著不同的趋势(p = 0.081,费希尔精确检验);然而,这是由在治疗时间点非MEL亚组中显著更高比例的应答者驱动的( p = 0.0055,Fisher精确检验),因为仅在预处理样品中MCS的反应没有显著差异( p = 0.61).当仅考虑皮肤型黑色素瘤和具有可用反应注释的样本时,MCS的差异反应的强烈趋势保持在治疗时间点( p = 0.051).
在42例具有纵向样本和已知缓解状态的患者中,当我们比较治疗中样本和治疗前样本时,9例显示出不一致的MCS类别。2名患者(1名MES变为NPLAS,1名NPLAS变为MEL)出现MEL-wise移位,均为无应答者。相比之下,在7名患者中发生了MES-wise转变(2名MEL至npla,5名npla至MES),包括3名无反应者和4名反应者( p = 0.069,费雪精确检验;图。 7d ).这些数据需要使用更大的队列进一步证实,但表明无论起始MCS如何,在PD-1 CPI治疗期间显示MCS向更MES表型转变的患者,对该疗法有反应的可能性更高。