通过深度学习优化血小板输注的个性化风险评估

中文标题:通过个性化深度学习风险评估系统优化血小板输注以进行需求管理

英文标题:Optimizing platelet transfusion through a personalized deep learning risk assessment system for demand management

发布平台:Blood

Blood

发布日期:2023-12-28

引用量(非实时):

DOI:10.1182/blood.2023021172

作者:Merlin Engelke, Cynthia Sabrina Schmidt, Giulia Baldini, Vicky Parmar, René Hosch, Katarzyna Borys, Sven Koitka, Amin T. Turki, Johannes Haubold, Peter A. Horn, Felix Nensa

关键字: #血小板 #个性化医疗

文章类型:journalArticle

品读时间:2024-11-13 10:06

1 文章萃取

1.1 核心观点

基于 LSTM 实现了不同科室患者的血小板输注个性化实时预测

最终模型能够在高 AUC-PR 下进行未来 24h 是否输注血小板的风险评估

1.2 综合评价

考虑的特征足够丰富,并围绕不同科室的特性进行单独建模

论文细节丰富,对模型的实用价值和局限性进行了充分讨论

在部分科室的预测性能较差,可能存在持续改善的空间

1.3 主观评分:⭐⭐⭐⭐⭐

2 精读笔记

2.1 数据说明

背景知识:

  • 血小板浓缩液(PCs)保质期短,需求波动大,因此存在库存管理问题
  • 10 年来血小板的需求峰值高于其他血液成分,需要策略管理其高峰需求

数据来源:

  • 德国三级护理学术转诊中心埃森大学医院的 5 年回顾性队列研究数据
  • 整个队列包括 262 638 名患者,其中有 34 809 名患者纳入本研究范围
  • 滑动时间窗口生成了 437791 个样本,分别作为训练集、验证集和测试集

滑动时间窗口的采样频率为 12h,即每个患者每天产生 2 条数据样本

窗口的最大长度为 60,即最多记录该患者过去 30 天内的特征时序信息

纳入标准分析:

  • 住院时间>1天:确保患者有足够长的医疗监测以产生数据
  • 最低血小板计数 < $150\times 10^3$:只考虑存在血小板减少风险的患者
  • 48h 内存在全血细胞计数:确保获得有效样本(核心参数不缺失)

预测目标:识别患者在接下来的 24h 内是否需要血小板浓缩液(PCs)

由于血小板计数的检验次数有限,因此会在两次检验之间进行线性插值以丰富数据

2.2 特征分析

患者数据分组分析:

  • 总体来说,训练集与测试集之间的数据分布均衡,但存在性别依赖的异质性
  • 血液和肿瘤科的血小板浓缩液(PCs)输注率为 57%,远高于其他科室
  • 31%的患者来自心胸外科,31%来自血液和肿瘤科,剩余科室占比为 37%

特征的处理和转换:

  • 数据预处理:文本特征(比如科室、病房和性别)进行编码,年龄和血小板计数需要进行标准化、分类数据(比如状态信息、医疗程序或药物使用)先进行 one-hot 编码,再转换为时序特征并编码
  • 考虑科室差异性,对血液肿瘤科和心胸外科进行单独的科室建模;其他科室则合并建模

2.3 建模总结

模型架构:

  • 分类特征有 16 种,包括过去的手术、诊断的情况和过去 30 天内给予的药物
  • 时序张量特征有 7 种(时序最大长度为 60),包括血小板计数、星期几(用余弦和正弦表示)、血小板计数的测量值或插值、是否使用 PCs、是否假期和是否周末
  • 位置特征有 2 种,包括唯一标识患者最后的科室(训练单科室模型时忽略)和病房

训练细节补充:

  • 输出层使用 sigmoid 作为激活函数,将输出映射到 0 和1 之间以实现二分类
  • 训练优化器使用Adam 和 AdamW;权重衰减正则化设置为学习速率的 1/10
  • 使用贝叶斯优化作为超参的搜索策略,目标是最大化 AUC-PR 得分
  • 确定最佳的模型超参后,使用 5 折交叉验证的模型构建集成模型(平均值)
  • 基于 F1 值最大化来寻找输出概率的最佳 cutoff(避免数据集不平衡的影响)

建模性能对比:

  • 综合来看,血液和肿瘤科的模型得分最好,而心胸外科的模型得分最差

模型的可解释性分析:

  • 血小板并不是最重要的模型特征之一,而最相关的时序特征是是否为工作日

讨论和补充:

  • 作者曾训练过 XGBoost 和 RF 模型用于 3 天内的血小板需求预测;但由于纳入的患者需要至少住院 9 天,因此极大限制了模型的性能和临床实用价值;而本文的 LSTM 改善了这一点
  • 训练后的模型表现出较高的特异性,但是灵敏度较低;这对临床决策提出了潜在的挑战,因为它可能导致假阴性并忽视可能从血小板输注中受益的患者
  • 局限性:事件缺少标准化;数据存在不一致或错误;出于隐私考虑未纳入医生信息;纳入标准可能给模型带来偏差,比如可能忽略了部分短期住院、或急性出血事件的患者;
  • 血小板插值对模型性能影响较小,但可能无法捕捉意外事件引起的突然变化

相关资源

往年同期文章