仅搜集收录了部分个人感兴趣的文章,并进行简单记录
1 概念科普
1.1 DeepSeek 赋能专病库建设与运营
2025 年 04 月 03 日 文章链接
DeepSeek 通过三层赋能体系重构专病库价值:
非结构化数据智能解析
- 非结构化文本的精准解析,提取关键实体(如疾病名称、用药记录、手术操作)
- 通过跨模态对齐算法(如CLIP改进模型),实现影像特征与文本描述的自动关联
标准化治理与质量控制
- 内置 SNOMED CT、ICD-10 等标准术语库,自动识别并修正非标准表述
- 基于孤立森林(Isolation Forest)和规则引擎,实时检测异常数据
疾病风险预测与分层管理
- 基于 XGBoost、Transformer 时间序列模型,支持个性化风险预警
- 采用结构因果模型(SCM),揭示变量间因果关系
个性化诊疗决策支持
- 基于强化学习(RL)动态优化用药方案
- 开发“文本+影像+基因”多模态诊断模型
科研效率革命性提升
- 集成AutoML工具(如DeepSeek-AutoFE),自动筛选关键变量
- 基于生成对抗网络(CTGAN),合成符合真实分布的虚拟患者数据
联邦学习驱动的跨机构协作
- 采用 DeepSeek-FL 框架联合训练模型
- 数据使用记录上链,确保贡献方权益可追溯
动态随访与闭环管理
- 基于语音识别(Whisper)和意图理解模型,实现自动电话/短信随访
- 实时监测专病库数据,自动触发预警(比如不良反应)
1.2 荟萃分析:LLMs 诊断能力不及专业医生,部分超越非专业医生
2025 年 4 月 18 日 文章链接
对 83 篇研究论文进行了 Meta 分析,以评估生成式人工智能在医学领域的诊断能力
- 涉及GPT-4(最常用)、Llama3 70B、Gemini 1.5 Pro和Claude 3 Sonnet等多种AI模型
- 结果显示,AI模型的平均诊断准确率为52.1%,与非专家医生相当;但专家医生的表现优于AI,准确率差距为15.8%。;AI在皮肤科表现突出,但在泌尿科的结论普适性受限。
- 研究显示,生成式AI具有巨大潜力,但仍面临挑战研究强调AI在医学教育中的潜力,可用于病例模拟和技能评估,但同时也提出了透明度和偏见方面的担忧,并呼吁开发清晰、符合伦理且经过充分验证的AI应用
2 模型预测
2.1 预测急性低氧性呼吸衰竭患者高流量鼻插管治疗的结果
2025 年 04 月 05 日 文章链接
高流量鼻导管(HFNC)治疗失败:定义为 HFNC 治疗后24小时内需进行无创通气(NIV)、气管插管+机械通气,或死亡。
现有的临床指标:
- ROX = SpO₂ / (FiO₂ × 呼吸频率)
- MROX = PaO₂ / (FiO₂ × 呼吸频率)
- ROX-HR = 100 × SpO₂ / (FiO₂ × 呼吸频率 × 心率)
- MROX-HR = 100 × PaO₂ / (FiO₂ × 呼吸频率 × 心率)
- 以及 HACOR 评分、SOFA 评分、PaO₂/FiO₂、SpO₂/FiO₂ 和 HR/SpO₂ 比值。
数据说明:
- 2018年至2023年在意大利摩德纳大学医院呼吸ICU接受HFNC治疗的184例AHRF患者的治疗前2小时内的测量数据进行训练(其中37%为HFNC治疗失败)
- 外部验证数据集包括567例AHRF患者(22%失败率),其中510例来自巴西最近的RENOVATE试验,57例来自美国的MIMIC-IV和eICU数据库
主要结果:
- 支持向量机(SVM)模型在所有测试情境中,其内部与外部预测性能均优于所有临床指标
- 在对567例患者的外部验证中,SVM模型准确率为73%、灵敏度73%、特异度73%,AUC为0.79
- 当将动脉血气(ABG)数据纳入模型训练时,SVM模型在MIMIC-IV/eICU数据集中的外部验证表现为:准确率83%、灵敏度84%、特异度82%、AUC为0.82
基于SVM模型的决策支持工具,比现有临床指标更为准确的HFNC治疗早期结局预测
2.2 利用自然语言处理和机器学习改进过敏性休克的识别
2022 年 10 月 11 日 文章链接
数据说明:
- 2015-2019 年在美国西北部 2 家综合医疗机构的 516 名过敏性休克潜在事件
- 训练集:239 个潜在事件中有 154(64%)符合过敏性休克的裁决标准
- 验证集:277 个潜在事件中有 180(65%)符合过敏性休克的裁决标准
潜在事件的判定路径
- 路径 1:潜在过敏性休克事件包括急诊或住院期间被诊断为过敏性休克的遭遇
- 路径 2:门诊期间被诊断为过敏性休克,并在同一天从任何地点诊断出支气管痉挛、喘鸣或低血压,以及/或心肺复苏、肾上腺素或苯海拉明注射的程序代码
特征说明:
- 47 个结构化特征:人口统计学、符合资格的医疗接触环境、过敏性休克的潜在原因(食物、药物、血液制品或疫苗,或未指定)、近期免疫疗法或静脉对比剂成像、临床干预(例如,肾上腺素、血管加压素、心肺复苏、插管、胰蛋白酶实验室、免疫学随访)、过敏反应史以及竞争性诊断史,包括血管神经性水肿、慢性呼吸系统疾病和严重感染
- 100 个非结构化特征:先通过概念总结、知识库、NLP 实体识别等方式,构建了 468 个候选 NLP 协变量;然后根据频率分布和专家判断保留了 100 个 NLP 协变量
- 三种特征筛选策略:LASSO 正则化,基于中位数聚类(PAM),全部保留
建模结果:
- 结构化特征 Top5:1)既往过敏反应诊断的年数,2)前一年的过敏反应诊断,3)同一天接受任何影像学检查,以及 4)抗组胺药或 5)皮质类固醇的出院处方
- 非结构化特征 Top5:1)≥2 次低血压的肯定提及;2)在提及突然发作、肾上腺素注射或过敏性休克诊断时,任何关于呼吸衰竭和血压降低的描述或观察入组;3) ≥2 次皮肤/粘膜受累的肯定提及,以及与过敏性休克诊断提及相邻的呼吸衰竭或血压降低;4) ≥2 次喘鸣的肯定提及;以及 5) 皮肤/粘膜受累和血压降低的描述,与突然发作、肾上腺素给药、过敏性休克诊断或观察入组的提及相邻
2.3 注射药物过敏性休克的 AI 预测模型
2024 年 04 月 05 日 文章链接
数据说明:
- JADER 数据库,包括 2004 年 4 月至 2020 年 12 月的不良药物反应报告
- 筛选出 947 种相对更容易导致“过敏性休克”的不良反应药物进行分析
- 根据分析和给药途径分别排除了320 种和 400 种药物,最终保留 227 种
- 使用化学性质和结构相似性作为特征变量,采用主成分分析进行降维
建模方法:逻辑回归、LASSO、XGBoost、RF、SVM 和 NNW 等六种模型的集成
最终建模结果(多模型集成后的交叉验证 AUC=0.85)
2.4 基于机器学习的全身麻醉期间过敏性休克的危险预测分析
2022 年 12 月 文章链接
数据说明:
- 2017 年 1 月至 2019 年 1 月期间所有麻醉病例的麻醉记录
- 优先收集了 45 例过敏性休克阳性患者的完整术前临床记录
- 收集接受全身麻醉的 247 例过敏性休克阴性患者的临床数据
- 基线数据(共 148 个变量):(1)基本资料,如性别、年龄、体重指数、Brinkmann 指数、饮酒史、过敏史、麻醉暴露史和医疗状况,共计 21 个变量;(2)正在进行的药物治疗(七个变量);(3)术前检查数据,如生化筛查、全血计数、血浆凝血试验和术前输血试验(90 个变量);(4)麻醉相关药物(30 个变量)
特征选择方法:基于支持向量机(SVM)的递归特征消除(RFE)、卡方分析、基于相关性的特征选择(CFS)和信息增益率(IGR),最终筛选了 75 个特征用于模型构建
最终建模结果:线性判别分析结合递归特征消除表现出良好的性能,使用 25 个特征进行分类时,准确率为 0.867,马修斯相关系数(MCC)为 0.558。结合递归特征消除的逻辑回归模型也显示出足够的性能,使用六个特征进行分类时,准确率为 0.858,MCC 为 0.541