返回知识库
人工智能医学

人工智能病理学:深度学习如何重塑肿瘤诊断与分子预测

CortexChem 研究团队
2026-03-06
14 min read

数字病理学(Digital Pathology)与人工智能(AI)的深度融合,正在以前所未有的速度重塑肿瘤病理诊断的范式。全玻片数字扫描(Whole Slide Imaging,WSI)将传统玻片转化为包含数十亿像素的高分辨率数字图像,配合深度卷积神经网络(CNN)和近年兴起的视觉Transformer(ViT)架构,使计算机能够从HE染色图像中提取病理学家肉眼难以察觉的微观特征,在肿瘤检测、分级、分子特征预测和预后评估等多个维度超越或媲美顶级病理学专家 [1]

计算病理学的技术架构

多实例学习(MIL)框架

WSI图像分辨率极高(20×扫描通常达 5 × 10⁸ 像素),直接端到端训练显存不可行。多实例学习(Multiple Instance Learning,MIL)将WSI切分为数百至数千个小图块(patches,通常 224 × 224 至 512 × 512 像素),提取每个patch的特征向量后通过聚合函数(注意力机制/平均/最大池化)获得全片级别的表征,最后映射到病理诊断/分子标签。

当前最先进的MIL框架包括:

  • ABMIL(Attention-Based MIL):引入注意力权重,可识别对诊断贡献最高的肿瘤区域,具备可解释性
  • TransMIL:将Transformer自注意力机制引入patch间交互建模,捕捉空间上下文依赖
  • HIPT(Hierarchical Image Pyramid Transformer):分层学习patch→region→slide三级表征,模拟病理阅片的"低倍→高倍"层级思维

基础模型(Foundation Models)

2023年以来,病理学领域的预训练基础模型(类比NLP中的GPT)迅速涌现:CONCH、UNI、Virchow(拜耳)、Prov-GigaPath(微软/Providence)等均基于数百万张WSI的自监督对比学习预训练,能以极少标注样本(few-shot)在多种下游任务上实现SOTA性能,大幅降低了计算病理学研究对大规模专家标注数据的依赖 [2]

里程碑研究:从辅助检测到分子预测

淋巴结转移检测

CAMELYON16竞赛(2016年)标志着AI病理学进入公众视野:基于CNN的乳腺癌淋巴结转移检测AUC达0.994,超越专业病理学家(AUC 0.966)。PatchCamelyon数据集随后成为计算病理学基准测试的"MNIST",推动了快速方法学迭代 [3]

分子特征预测:从形态到基因组的桥梁

MSI预测:Kather等(Nature Medicine, 2019)首次证明,仅凭HE染色图像,深度学习可预测结直肠癌MSI/dMMR状态(AUC 0.84),在胃癌(AUC 0.81)、卵巢癌(AUC 0.77)和子宫内膜癌(AUC 0.87)中同样有效。这一发现提示,MSI状态引起的肿瘤浸润淋巴细胞、黏液分化等形态学改变可被AI识别,理论上可实现基于HE图像的低成本MSI初筛 [4]

EGFR突变预测(NSCLC):多项研究证实AI可从肺腺癌HE图像中预测EGFR突变状态(AUC 0.70~0.76),但预测精度受肿瘤异质性和突变类型影响,目前尚不能替代NGS基因检测,更适合作为"低成本初筛→NGS确认"的两步策略 [5]

HER2状态预测:TCGA和多中心验证研究显示,AI对胃癌HER2 IHC 3+(vs. 0/1+/2+)的预测AUC达0.89,媲美初级病理科医生,在资源匮乏地区有望缓解HER2 IHC检测的可及性瓶颈 [6]

生存预后评估

Campanella等(Nature Medicine, 2019)分析了来自44405张WSI的泛癌种生存预测模型,在前列腺癌(c-index 0.72)、肾透明细胞癌(c-index 0.71)、肺腺癌(c-index 0.68)等多种癌种中实现了独立的预后分层,且AI预后分值与病理学家分期评分具有互补的独立预测价值 [7]

TCGA+GTEx的多中心研究(The Lancet Digital Health, 2022)验证了基于AI形态学特征评分与基因表达评分的整合模型,在乳腺癌(AUROC 0.89)、结直肠癌(AUROC 0.87)的治疗预测中优于单一组学模型 [8]

FDA批准与临床落地现状

截至2026年,已有多项AI辅助病理诊断工具通过FDA 510(k)或De Novo途径获批:

产品 公司 适应证 批准年份 监管路径
Paige Prostate Paige.AI 前列腺癌检测 2021 De Novo
Lunit SCOPE IO Lunit 肺癌PD-L1/TIL评估 2022 510(k)
Ibex Galen Prostate Ibex Medical 前列腺癌分级 2022 CE Mark
PathAI Breast PathAI 乳腺癌Ki-67评估 2024 510(k)
Tempus Predict Tempus 结直肠癌生存预测 2025 De Novo

AI病理学的局限与挑战

1. 数据集偏倚与外部验证:多数AI病理模型在单中心或地域同质性数据集上开发,外部验证时性能往往出现5%~15%的AUC下降,归因于扫描设备、染色流程、患者种族构成的系统性差异。

2. 可解释性(Explainability):深度学习模型的"黑箱"特性使病理学家难以信任AI辅助诊断的根据。注意力热图(attention heatmap)可视化部分解决了"AI关注哪里"的问题,但与形态学判读标准的对齐仍是开放问题。

3. 罕见肿瘤与长尾分布:AI在常见癌种表现优异,但在罕见肿瘤(如腺泡软组织肉瘤、透明细胞癌)中训练数据极度匮乏,模型泛化性差。

4. 监管与责任归属:AI辅助诊断的诊断责任归属(AI厂商/医院/病理医生)和赔偿机制在大多数国家尚无明确法规框架。

多模态AI:WSI+基因组+临床数据的整合

下一代计算病理学正在从单模态(仅WSI)走向多模态整合。MCAT(Multimodal Co-Attention Transformer,Nature Cancer, 2023)将WSI特征与基因组突变/表达特征通过跨模态注意力融合,在肺癌(c-index 0.78)和结直肠癌(c-index 0.73)生存预测上显著优于单模态模型 [9]

病理+放射组学整合:将WSI表征与CT/MRI放射组学特征联合,已在肝细胞癌的微血管侵犯预测(AUC 0.87)和NSCLC淋巴结分期(AUC 0.91)中展现出超越单模态的优势,预示着"数字双胞胎"驱动的全面肿瘤表征评估的到来 [10]

结论与展望

AI病理学已从"概念验证"阶段进入"临床落地与监管获批"阶段,其核心价值在于:①量化减少病理诊断的主观性与观察者间变异;②发现HE图像中隐含的分子信息,降低昂贵分子检测的使用门槛;③全局扫描识别容易被人眼遗漏的罕见组织学特征。随着基础模型的规模化预训练、多模态数据融合和监管框架的完善,AI病理学有望在5年内成为肿瘤诊断流程中不可或缺的"第二双眼睛"。


考特智药AI

立即体验考特智药,让AI帮你检索、阅读、解析文献。

免费使用

参考文献

  1. Srinidhi CL, Ciga O, Martel AL. Deep neural network models for computational histopathology: a survey. Med Image Anal. 2021;67:101813.
  2. Chen RJ, Ding T, Lu MY, et al. Towards a general-purpose foundation model for computational pathology. Nat Med. 2024;30(3):850–862.
  3. Litjens G, Bándi P, Ehteshami Bejnordi B, et al. 1399 H&E-stained sentinel lymph node sections of breast cancer patients: the CAMELYON dataset. Gigascience. 2018;7(6):giy065.
  4. Kather JN, Pearson AT, Halama N, et al. Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer. Nat Med. 2019;25(7):1054–1056.
  5. Coudray N, Ocampo PS, Sakellaropoulos T, et al. Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning. Nat Med. 2018;24(10):1559–1567.
  6. Farahmand S, Fernandez AI, Ahmed FS, et al. Deep learning trained on hematoxylin and eosin tumor region of Interest predicts HER2 status and trastuzumab treatment response in HER2+ breast cancer. Mod Pathol. 2022;35(1):44–51.
  7. Campanella G, Hanna MG, Geneslaw L, et al. Clinical-grade computational pathology using weakly supervised deep learning on whole slide images. Nat Med. 2019;25(8):1301–1309.
  8. Kather JN, Heij LR, Grabsch HI, et al. Pan-cancer image-based detection of clinically actionable genetic alterations. Nat Cancer. 2020;1(8):789–799.
  9. Chen RJ, Lu MY, Williamson DFK, et al. Pan-cancer integrative histology-genomic analysis via multimodal deep learning. Cancer Cell. 2022;40(8):865–878.
  10. Saillard C, Schmauch B, Laifa O, et al. Predicting survival after hepatocellular carcinoma resection using deep learning on histological slides. Hepatology. 2020;72(6):2000–2013.
分享文章: