我们从Coif小波变换图像中提取放射特征,经四分位间距过滤后,得到每位患者每个部位的444维放射向量。使用训练队列,我们使用单变量Cox比例风险模型计算了网膜和卵巢放射特征的风险比(HRs)和预后意义(补充表4)9。多重假设检验校正后,九个网膜特征(图。3b)并且没有一个卵巢特征表现出统计学上显著的HRs(图。3c).因此,接下来,我们只考虑网膜植入物。我们对9个网膜特征(算法1)的多变量显著性进行迭代拟合和修剪Cox模型,产生一个基于灰度共生矩阵自相关的单变量模型,该矩阵来自高-低-低(HLL) Coif小波变换29图像(图三维(three dimension的缩写)).该特征表现出1.68的对数(HR)(校正后P < 0.01; Fig. 3e)并且对于CT扫描仪制造商和分割放射科医师是不变的(扩展数据图。3).该模型对训练集和测试集中的患者进行了分层,一致性指数分别为0.55 (95%可信区间为0.549-0.554)和0.53 (95%可信区间为0.517-0.547)。3f).Kaplan-Meier对高风险组和低风险组(由推断风险决定)的分析显示,通过对数秩检验,总体生存率存在统计学差异(P < 0.01) in the training set (Fig. 3g),中位生存期分别为44和57个月,但不在测试组中,中位生存期分别为38和47个月(图。3h).
用于可解释特征的组织病理学组织类型分类器
接下来,我们使用弱监督方法从组织学图像中训练组织类型分类器。我们在60个H&E WSIs上标注了组织类型,产生了超过140万个部分重叠的图块,每个图块的尺寸为128 × 128像素(64 × 64 m ),包含4096m2组织(图4a).在ImageNet上预训练的ResNet-18卷积神经网络(图。4b)对标记为脂肪、基质、坏死和肿瘤的病理学家注释区域的组织类型进行分类,准确度为0.88(范围0.77-0.95)(图。4c)通过四次滑动式交叉验证。值得注意的是,该模型正确地识别了基质注释内的小脂肪区域和肿瘤内的坏死区域,支持弱监督深度学习对于该任务的适用性,并将注释细化为更细粒度的分类。
我们将组织类型分类器应用于来自治疗前标本的243个损伤的训练H & E WSIs(图。1c).我们将这些推断的组织类型图与检测到的细胞核结合,产生标记的细胞核(图。5a).随后,我们基于Diao等人的方法从这些细胞核中提取细胞类型特征,并从组织类型图中提取组织类型特征。20。这产生了216个特征的组织病理学向量。接下来,我们在训练队列中使用幻灯片上拟合的单变量Cox模型来确定特征的HR。几个组织类型特征,如肿瘤总面积,部分由样本大小决定,因此我们在选择时对此进行了控制。在95%置信水平下,发现log(HR)与0显著不同的24个特征中,20个与肿瘤细胞核直径或大小相关,较大的与较短的OS相关(扩展数据图。5和补充表格5).我们再次按照算法1迭代拟合和修剪Cox模型,得到一个具有两个特征的多变量模型:平均肿瘤细胞核面积和基质长轴长度(图。5b).这种组织病理学特征不受样本大小的影响(扩展数据图)。6).该模型对训练集和测试集进行了分层,一致性指数分别为0.56 (95%可信区间为0.559-0.564)和0.54 (95%可信区间为0.527-0.560)。5c).根据推断的风险评分建立的高风险组和低风险组在中位生存期分别为34个月和49个月的训练组中分离良好(图。5d; P < 0.01). For the test set, the risk groups trended toward (but did not attain) significantly different separation, with median survival of 37 and 50 months (Fig. 5e; P= 0.076).为了探索组织病理学特征的可解释性,我们研究了平均肿瘤细胞核面积;我们展示低的例子(图。5f)和高(图。5g)值,它们分别与较好和较差的预后相关。