本文介绍了机器学习在鼻咽癌预后中的应用。鼻咽癌在南中国和东南亚地区很常见,但在非地方性地区也有发生。鼻咽癌患者的TNM分期目前仍是预后评估和风险分层的基石。本文研究了五种不同的机器学习算法,并比较了它们的表现。结果表明,这些算法可以用于预后评估,为患者量身定制适当的治疗方案。
鼻咽癌是一种罕见的癌症,其流行病学和组织病理学与其他头颈癌不同。它在南中国和东南亚地区很常见,其中大量肿瘤是未分化和非角化癌。但在非地方性地区,鼻咽癌可以是角化或非角化的。需要注意的是,鼻咽癌起源于鼻咽上皮,因此起源于咽喉的上部。
最近,鼻咽癌因其显著增加的发病率和死亡率而受到全球关注。此外,无论地理位置(地方性或非地方性),鼻咽癌的死亡率都相当高,尽管早期诊断。这可能是由于不当的治疗计划导致治疗结果不佳。因此,对鼻咽癌患者预后的准确估计对于疾病的有效管理非常重要,因为预后不佳的癌症患者增加将增加社会的整体癌症负担。
目前,肿瘤-淋巴结-转移(TNM)分期方案仍是鼻咽癌患者预后评估和风险分层的基石。然而,对于同一分期的患者,他们可能会表现出显著的临床异质性和独特的肿瘤学结果。同样,据报道,血浆埃皮斯坦-巴尔病毒(EBV)DNA滴度对于鼻咽癌患者是一种有用的生物标志物。然而,检查EBV DNA和实验室间变异的财务和经济影响构成了阻碍将该生物标志物整合到日常临床实践中的重要因素。因此,目前正在讨论是否应该将非解剖学预后因素纳入考虑,以反映肿瘤的生物学行为,除了TNM参数以外,以改善风险分层。
机器学习是人工智能的一个子领域,是一种有见解的潜在方法,可以考虑除TNM分期方案以外的其他因素。本文研究了各种单个机器学习算法在鼻咽癌预后中的表现,目的是利用五种不同的单个算法(逻辑回归、朴素贝叶斯、k-最近邻、支持向量机和决策树算法)来生成一种称为堆叠算法(堆叠泛化)的单个独特的机器学习算法。此外,我们旨在比较堆叠算法与另一种名为极限梯度提升(XGBoost)的最先进算法在预测鼻咽癌患者总生存率方面的表现。选择极限梯度提升是因为它在许多临床应用中取得了有前途的结果。我们使用本文提出的局部可解释模型不可知解释(LIME)和SHapley Additive exPlanations(SHAP)技术解释和解释了XGBoost模型的预测。结果表明,这些算法可以用于预后评估,为患者量身定制适当的治疗方案。