基于可解释性针对脓毒症幸存者二次ICU病死率的风险因子探索

中文标题：基于可解释性针对脓毒症幸存者二次ICU病死率的风险因子探索
英文标题：An explainable machine learning algorithm for risk factor analysis of in-hospital mortality in sepsis survivors with ICU readmission
发布平台：CMPB
发布日期：2021-06-01
引用量（非实时）：17
- 1 文章萃取
- 2 精读笔记
相关资源

中文标题：基于可解释性针对脓毒症幸存者二次ICU病死率的风险因子探索

英文标题：An explainable machine learning algorithm for risk factor analysis of in-hospital mortality in sepsis survivors with ICU readmission

发布平台：CMPB

Computer Methods and Programs in Biomedicine

发布日期：2021-06-01

引用量（非实时）：17

DOI：10.1016/j.cmpb.2021.106040

作者：Zhengyu Jiang, Lulong Bo, Zhenhua Xu, Yubing Song, Jiafeng Wang, Pingshan Wen, Xiaojian Wan, Tao Yang, Xiaoming Deng, Jinjun Bian

关键字： #sepsis #lightGBM #SHAP

文章类型：journalArticle

品读时间：2021-11-18 09:26

1 文章萃取

1.1 核心观点

背景与目的：在ICU中经历sepsis后的幸存者，会增加远期病死率和再次进入ICU的可能性。所以非常值得借助机器学习的方式进行风险因子的可视化探索与风险因子间的关系量化

方法：数据来自MIMIC-III中存在二次ICU情况的患者，并按照是否经历sepsis进行数据划分，纳入模型的具体字段主要包括二次ICU的病死率、二次ICU首日的各项数据指标。建模结果将通过SHAP值评估风险因子和因变量之间的关系

结论：数据覆盖2970位患者，其中经历过sepsis的患者有2228位，二次ICU病死率50.4%，未经历过sepsis的患者有742位，二次ICU病死率30.7%，二者存在显著差异。经过逐步回归法筛选得到了18个特征：BUN level（尿素氮水平）, age（年龄）, albumin level（白蛋白水平）, heart rate（心率）minimum chloride level（氯化物水平）, minimum diastolic BP（舒张期血压）, glucose count（血糖计数）, urine output（尿量）, maximum systolic pressure（收缩期血压）, weight, minimum platelet（血小板）, minimum lactate level（血中乳酸浓度）, average PaCO2（动脉血二氧化碳分压） level, maximum APTT（活化部分凝血活酶时间）, SpO2（脉搏血氧饱和度） count, minimum anion gap（阴离子间隙）, GCS optical（格拉斯哥昏迷指数/睁眼反应部分）, sex（性别）。通过LightGBM和SHAP计算出各因素对风险的定量贡献和值得注意的阈值，有助于sepsisi的风险控制和病理分析。

1.2 综合评价

排版整洁，行文逻辑清晰

与前人成果相应验，也不乏独有的创新点

最后对于结论的分析与使用思考很值得借鉴

1.3 主观评分：⭐⭐⭐⭐

2 精读笔记

2.1 简介

Sepsis是目前ICU致死率最高的几种原因之一，并且治愈后二次ICU和住院死亡率会更高，预期寿命和生活质量也都十分堪忧（体内平衡被打破，细胞长期受损，免疫紊乱，容易出现并发症，患病可能性高），所以解决与探索这类疾病的优先级高、必要性强
目前研究发现，抗生素和细致的支持性治疗（intensive supportive measures）能够一定程度上降低sepsis的病死率
补充（来自维基百科）：败血症的死亡率高达30%，而严重败血症的死亡率高达50%，败血症休克的死亡率为80%。2017年，败血症影响了约4900万人，造成1100万人死亡(当年全球死亡人数的五分之一)
传统机器学习方法，常聚焦于构建特征并实现更高精准度的预测，但是这种“黑箱”模型在临床场景下很难解释，也因此需要更严苛的条件限制；借助模型量化临床参数与预测结果之间的关系，能够更好地与医生沟通与解释，也容易得到信赖，可操作空间丰富

2.2 数据预处理与差异性分析

数据源来自 MIMIC-III，包含了迪肯尼斯医疗中心2001年-2012年共计56097名患者的脱敏数据，数据源可参考 MIMIC资料

数据筛选过程：

保留年龄大于18岁

保留两次ICU间隔小于1年

排除二次ICU首日死亡

排除非住院死亡

排除数据缺失率大于80%的特征（206-62=144）

按照是否经历sepsis进行数据划分

数据预处理过程

对时序性数据，保留最大值、最小值和均值

采用sklearn包中的impute类进行数据缺失的填充：以缺失值所在列为因变量，其他特征为自变量建立回归模型，并使用模型预测值进行缺失填充，由于存在多列同时缺失的情况，所以进行迭代填充，迭代次数为10

差异性分析

针对sepsis组和非sepsis组进行了差异性分析，并发现二者在年龄、SOFA评分最大值和二次ICU住院死亡率存在显著差异，而在性别、身高、体重、二次ICU入院时间差方面无显著差异

相比于非sepsis组，sepsis组的BUN（尿素氮）和 creatinine（肌酸酐）含量更高，PT（血浆凝血酶原时间）和APTT（活化部分凝血活酶时间）时间更长，而PaO2（动脉血氧分压）和SO2（血红蛋白氧饱和度）更低。

2.3 特征选择与建模

特征选择

针对全部的144个特征，采用逐步回归算法进行特征筛选，保留p值小于0.05的特征，最终sepsis组保留了18个特征，非sepsis组保留了6个特征。

其中二组共有的特征有4个：BUN level（尿素氮水平）, age（年龄）, albumin level（白蛋白水平） and heart rate（心率）；

非sepsis组独有的特征有2个：minimum chloride level（氯化物水平） and minimum diastolic BP（舒张期血压）；

sepsis组独有的特征有14个：glucose count（血糖计数）, urine output（尿量）, maximum systolic pressure（收缩期血压）, weight, minimum platelet（血小板）, minimum lactate level（血中乳酸浓度）, average PaCO2（动脉血二氧化碳分压） level, maximum APTT（活化部分凝血活酶时间）, SpO2（脉搏血氧饱和度） count, minimum anion gap（阴离子间隙）, GCS optical（格拉斯哥昏迷指数/睁眼反应部分） and sex（性别）

相关名词解释可参考常用医学指标

建模过程：按照8:2的比例划分训练集和测试集，通过LightGBM进行建模，并借助sklearn中的Hyperopt调参，sepsis组AUC值为0.732，非sepsis组AUC值为0.895

二个分组的共有特征（尿素氮、年龄、白蛋白）表现出一致性
血糖计数、尿量、收缩压是针对于败血症相对独立的显著风险因子

败血症组数据量更多、特征更丰富，但AUC值更低
说明了败血症独立于其他二次ICU住院死亡成因的复杂性

2.4 风险因子探索与可视化

借助SHAP库计算每个样本的每个特征的SHAP值量化特征对预测结果的影响并可视化

年龄过大体重偏低的男性所要面对的风险更大

部分风险因子在之前的研究中被证实过，如收缩压降低或乳酸盐升高

某些参数在正常范围内，但是依然在客观上增加了风险。比如血小板计数在$100-180\times 10^9/L$之间，尿量在每天$400ml-1500ml$之间都被认为是正常的。所以在特定场景下对参数范围调整是能够在客观上降低患者风险的。

针对风险因子，确定引起患者的风险突然变化的“阈值”或“触发点”是很重要的，如 PaCO2-avg（动脉血二氧化碳分压平均值）突破42mmHg时、Albu-min（白蛋白水平最小值）低于3g/dL时

2.5 总结

逐步回归剔除了大部分特征，避免过拟合，提高了模型的泛化能力和稳健性
通过SHAP法对因子进行定性定量分析，然后利用可视化的方式寻找因子的关键“触发点”，这对于风险控制和疾病预防具有很好的意义
自我反思：数据可能与实现存在客观差异；结论的参考与使用应该是审慎的；二次ICU间的患者状态是未知而不可控的；数据的排除和筛选过程可能导致某些偏见和概率的倾斜

2.6 思考

SHAP值能体现特征与风险之间的线性程度，是一种非线性模型中线性成分的剥离，可以用于非线性模型与线性模型的对比，可以单独抽取其中线性模型构建指标/简化模型，也可以配合复杂的非线性模型表达解释性，增强"黑盒"的透明度
了解数据的产生过程（脱敏过程），能避免很多歧途
建模产生的结果是复杂而多面的，伴生于预测值的其他成果也都具备着挖掘的潜力
疑问1：这种机器学习的方式挖掘风险因子所得结论是否容易被采纳，可信度与传统方式的各种指标相比如何？某些风险因子是否只是某个深因子在特定场景下的表现，这种情况一般能从业务的角度得到解答吗？
疑问2：在差异性分析中显著的SOFA（序贯器官衰竭）评分，却在后续的特征筛选中被淘汰？以二次ICU住院死亡率为因变量的风险因子探索，是败血症幸存者二次ICU场景下的风险因子，能否视作败血症的风险因子？

个人笔记

Digital Garden | 王半仙