22  集成机器学习构建与优化脓毒症相关急性肾损伤早期预警系统

Construction and Optimization of an Early Warning Model for Sepsis-Associated Acute Kidney Injury
Using Ensemble Learning

Author

导师:陈纯波教授
汇报:胡林辉  

23 汇报内容

  • \(\color{#808080}{选题依据}\)
  • 研究内容
  • \(\color{#808080}{研究方案}\)
  • \(\color{#808080}{研究基础及条件}\)

23.1 选题依据

23.1.1 选题意义

脓毒症是ICU患者急性肾损伤的最常见病因

表 1— AKI病因 1
Etiology Percent
Sepsis 40.7%
Hypovolemia 34.1%
Drug related 14.4%
Cardiogenic shock 13.2%
Hepatorenal syndrome 3.2%
Obstruction of the urine outflow tract 1.4%

脓毒症相关性急性肾损伤(S-AKI)机制独特而复杂

  • S-AKI三大病理生理机制 2
    • 微循环障碍
    • 炎症反应失调
    • 代谢重编程
  • Sepsis和AKI互相促进

Sepsis和AKI互相促进,治疗Sepsis的措施本身会导致AKI,如万古、两性霉素B:因此药物也作为预测因素之一。

  • 选题意义
    • 理论意义
    • 实用价值
  • 研究的历史、现状、未来
    • 国内外研究现状及趋势
      • novel biomarkers of kidney stress and damage have been recently validated for risk predictio and early diagnosis of acute kidney injury in the settingof ssisep
      • Biomarkers for S-A
      • the discovery of AKI biomarkers, and the application of computer decision supportis
    • 早期预警包括:Risk Recognition and Early Diagnosis 方法

23.2 选题依据

23.2.1 选题意义

S-AKI与ICU患者预后恶化强烈相关

图 1— Clinical course and outcomes of sepsis-associated acute kidney injury (S-AKI) [^s_aki_outcome_ki]

B1[Recovery] –> C1[CKD] –> D1[End-stage renal disease] –> C2 A –> B2[Non-Recovery] —-> |worsen| C2[Death]


![](data-doctor/mermaid-diagram-saki-outcome.png)


:::

::: {.column style="width: 48%; "}
**早期识别风险和早诊断S-AKI改善预后**

<!-- ::: {style="transform: scale(1.2); margin-top: 5%"}
```{mermaid}
%%| label: fig-s_aki_early_warning
%%| fig-cap: 早期识别风险和早诊断S-AKI [^s_aki_early_warning_sn]
flowchart TD

A[S-AKI] --> B1[Risk Recognition] --> C1[Close monitoring] -->|Withon a week| D1[Reverse mild injury] --> E[Better prognosis]
A --> B2[Early Diagnosis] --> C2[Timely organ support] --> D2[Limit further insult] --> E


``` -->

![早期识别风险和早诊断S-AKI [^s_aki_early_warning_sn]](data-doctor/mermaid-diagram-early-detection.png){#fig-s_aki_early_warning}
:::
:::


::: 

::: notes

:::

[^s_aki_outcome_ki]: Peerapornratana S, Manrique-Caballero CL, Gómez H, Kellum JA. Acute kidney injury from sepsis: current concepts, epidemiology, pathophysiology, prevention and treatment. Kidney Int. 2019;96(5):1083-1099. doi:10.1016/j.kint.2019.05.026
[^s_aki_early_warning_sn]: Alobaidi R, Basu RK, Goldstein SL, Bagshaw SM. Sepsis-associated acute kidney injury. Semin Nephrol. 2015;35(1):2-11. doi:10.1016/j.semnephrol.2015.01.002

## 选题依据 {.smaller}

### 研究现状


::: columns 

::: {.column style="width: 48%; margin-right: 1px;"}
**风险因素评估(预测模型)的中文文献调研**


文献主题|关键词|篇数
-|-|-
生物标志物|可溶性CD146、DKK3、肝素结合蛋白、TIMP-2、IGFBP-7、NGAL、CysC、抗凝血酶Ⅲ、尿激酶型纤溶酶原激活物受体-1、可溶性糖基化终末产物受体、红细胞分布宽度|25
临床标志物|APACHEⅡ评分、HELENICC评分、SOFA评分、肾搏动指数、外周灌注指数|5
预测模型 [^prediction_model_literature_home]|TIMP-2、IGFBP-7|1
机器学习|-|0 

: 国内发表S-AKI风险预测方面的论文(知网) {#tbl-chinese_literature tbl-colwidths="[20,70,10]"}



> 检索式
```{.r}
(TI = '脓毒症相关性急性肾损伤'  OR TI = '脓毒症相关急性肾损伤') 
AND (TI = '早期诊断' OR TI = '生物标志' OR TI = '预警' 
OR TI = '预测' OR TI='机器学习')

风险因素评估(预测模型)的英文文献调研 3

表 2— 国外发表机器学习预测S-AKI风险的论文(Pubmed)
集成机器学习 结局 作者所属地区
死亡率 中国杭州
药物选择 中国重庆
死亡率 中国合肥
死亡率 中国长沙
死亡率 中国娄底
S-AKI 中国广州 4
S-AKI 中国北京
死亡率 中国长沙

检索式

sepsis associated acute kidney injury [ti] AND machine learning [tiab] NOT review [pt]

23.3 选题依据

23.3.1 研究现状

早期诊断(临床决策辅助系统,CDSS)

表 3— S-AKI临床决策辅助系统相关文献
数据库 标题 文献类型 作者所属地区
知网 - - -
Pubmed 5 Advances on machine learning applications in sepsis associated-acute kidney injury 6 综述 中国上海

检索式

  • 知网
(TI = '脓毒症相关性急性肾损伤'  OR TI = '脓毒症相关急性肾损伤') 
AND (TI='决策' OR TI="辅助")
  • Pubmed
sepsis associated acute kidney injury [ti] 
AND (decision support [tiab] or clinical application [tiab]) 
AND machine learning [tiab]

CDSS, Clinical Desicions Support System

23.4 研究内容

23.4.1 研究目标

flowchart TD

subgraph Model
A[生物标记物] & B[临床标记物] --> C[集成机器学习] --> D[[风险预测模型]] 
D --> |EHR|E1[风险预警] --> F1[严密监测]
D --> |EHR|E2[亚型判别] --> F2[精准干预]
end

subgraph CDSS
G[S-AKI诊断标准] -->|EHR| H[早期诊断]--> I[及时干预]
end

Model & CDSS --> J[[早期预警系统]]

图 2— 研究目标

EHR, 电子病历数据(Electronic healthy record)

23.5 研究内容

23.5.1 预测模型

  1. 建立预测模型:利用集成机器学习方法

flowchart LR
A[数据准备] --> B[单个基学习器训练]
B --> |集成方法| D[集成模型训练]
D --> E[集成模型评估]
E --> F[模型调优]
F --> G[模型应用]

  • 数据准备:在MIMIC-IV数据集上进行病人筛选、特征工程等。
  • 单个基学习器训练:训练多个不同类型的基学习器,如决策树、支持向量机、随机森林、梯度提升树等。
  • 集成方法选择:从投票法、平均法、bagging(装袋法)、stacking(堆叠法)和boosting(提升法)等,选择适合问题的集成方法。
  • 集成模型训练:将基学习器的预测结果进行组合,得到集成模型的预测结果。
  • 集成模型评估:准确率、精确率、召回率、F1值等。
  • 模型调优:调整基学习器的参数、增加基学习器的数量、更换集成方法等。
  1. 验证与应用预测模型:

使用优化后的集成模型进行预测,对新的未知数据进行分类或回归预测。外部数据可选用eICU或者茂名市人民医院科研一体化数据平台。

图 3— 常见集成方法

23.6 研究内容

23.6.1 决策辅助系统

  1. 实时预警
  • 数据采集:实时收集个体的电子健康记录(EHR)数据,包括与S-AKI预测模型相关的特征字段,如患者年龄、性别、病史、实验室检查结果等。
  • 数据预处理:将个体数据转换为与集成模型输入格式相匹配的方式。
  • 应用集成模型:将个体数据输入到集成模型中,得到S-AKI的风险预测结果(风险概率和可能亚型)。
  • 结果解释和报告:将得到的S-AKI风险百分比进行解释,并生成相应的报告以供临床医生或决策者参考。
  1. 实时诊断
  • 数据采集:实时获取病人的EHR数据,包括与S-AKI诊断相关的指标和参数,如血肌酐水平、尿量、血尿素氮、尿液检测结果等。
  • 实时诊断算法:根据诊断标准定义的规则或算法,使用采集到的数据进行实时诊断。
  • 输出诊断结果:根据实时诊断算法的结果,输出相应的诊断结果。可以通过界面展示、警报系统或与其他系统的集成等方式来呈现诊断结果。
flowchart TD

A1{KDIGO标准} --> |符合| B1[急性肾损伤] -->  C[脓毒症相关急性肾损伤]
A2{Sepsis-3.0标准} --> |符合| B2[脓毒症] -->  C[脓毒症相关急性肾损伤]

图 4— S-AKI诊断标准

23.7 研究内容

23.7.1 重点拟解决的问题

图 5— 重点拟解决的问题

23.7.2 创新之处:双集成

  • 集成机器学习方法:提升预测模型的泛化能力,更具鲁棒性
  • 预测模型与EHR集成:科研成果临床转化,有望早期实时预警S-AKI,为医生提供CDSS,为精准化治疗提供智能工具支持。
  • 数据获取与处理:收集脓毒症患者的临床数据,包括人口学数据、生理指标、实验室检查结果等。这些数据通常是大规模、多维度的,需要进行预处理和清洗,确保数据的准确性和一致性。

  • 特征选择与提取:从大量的数据中选择与急性肾损伤相关的特征,并进行特征提取。这可能包括使用统计方法、数据降维技术来确定最相关的特征。

  • 模型选择与训练:选择合适的机器学习模型来构建早期预警系统。常用的模型包括逻辑回归、支持向量机、决策树、随机森林等。通过使用训练数据对模型进行训练,并进行模型参数的调优。

  • 预警系统设计与评估:设计一个实用的早期预警系统,该系统可以根据患者的临床数据输出预警信息。评估系统的性能,包括准确性、敏感性、特异性等指标,确保系统具有较高的预测准确性。

  • 实时监测与更新:脓毒症相关急性肾损伤早期预警系统需要持续监测患者的生理指标和实验室检查结果,并根据最新的数据对模型进行实时更新和优化,以提高预测准确性和系统的实用性。

  • 临床应用与验证:最终将构建的早期预警系统应用到临床实践中,并进行验证。通过与临床医生的合作和实际数据的对比,评估系统在真实环境中的效果和价值,以确保系统对脓毒症相关急性肾损伤的早期预警具有可靠性和可行性。

23.8 研究内容

23.8.1 预期突破与成果

图 6— 预期突破与成果

争取学术成果

  • 学术论文
  • 学位论文
  • 软件著作权
  • 专利
  • 科技进步奖
  • 提高早期诊断准确性:通过机器学习模型的优化和特征选择,预期能够提高脓毒症相关急性肾损伤早期预警系统的准确性。这将使医生能够更早地发现急性肾损伤的迹象,及时采取治疗措施,从而减少并发症的发生和提高患者的预后。

  • 个性化预警和治疗:通过结合临床数据和个体化特征,预期能够实现对患者的个性化预警和治疗建议。这将使医生能够更好地了解患者的病情和风险,并根据个体差异性制定相应的干预方案,提高治疗效果。

  • 实时监测和预测:预期的系统能够实时监测患者的生理指标和实验室检查结果,并根据最新的数据进行预测。这将有助于医生及时获得患者的状况变化信息,提前采取相应的治疗措施,避免病情进一步恶化。

  • 临床应用和验证:将构建的早期预警系统应用到临床实践中,并进行验证。通过与临床医生的合作和实际数据的对比,验证系统的效果和价值。预期系统能够成功地应用于临床实践中,为医生提供有力的辅助决策工具,改善患者的预后和临床管理。

  • 知识积累和学术贡献:在构建与优化早期预警系统的过程中,预期能够积累大量的临,如自动化的集成机器学习流程床数据和研究经验。这将为相关领域的研究和发展提供宝贵的资源,为未来的研究和创新提供基础。研究成果发表学术论文、软件著作权和专利。

24 汇报内容

  • \(\color{#808080}{选题依据}\)
  • \(\color{#808080}{研究内容}\)
  • 研究方案
  • \(\color{#808080}{研究基础及条件}\)

24.1 研究方案

24.1.1 技术路线图

flowchart LR
subgraph 模型开发
    direction TB
    A("数据收集(MIMICIV)") --> B(数据清洗和预处理)
    B --> C(特征提取和选择)
    C --> |集成机器学习| D[[预测模型]]
end 

subgraph 模型验证
    direction TB
    E("外部数据(eICU)") --> F(模型表现评估) --> G(模型优化与调整)
end


subgraph 模型应用
    direction TB
    H(系统集成与部署) --> |EHR| I(实时预警S-AKI风险)
    H --> J(实时监测S-AKI诊断)
end

模型开发 --> 模型验证 --> 模型应用

图 7— 技术路线图

24.2 研究方案

24.2.1 可能出现的技术问题及解决办法

问题 解决办法
数据质量问题 - 进行数据清洗和预处理,填充缺失值、处理异常值
- 使用滤波和平滑技术减少噪声的影响
- 使用统计方法或机器学习算法来处理异常值和噪声
特征选择问题 - 使用特征选择算法,如相关性分析、方差分析、信息增益等
- 基于领域专家知识进行特征筛选
模型选择与优化问题 - 比较和评估候选模型,包括交叉验证
- 调整模型参数以优化性能
- 使用集成学习方法来提高模型的性能和稳定性
样本不平衡问题 - 过采样技术,如SMOTE(Synthetic Minority Over-sampling Technique)
- 欠采样技术,如随机欠采样
- 使用集成学习方法,如集成过采样与欠采样
解释性和可解释性问题 - 使用可解释性强的模型,如决策树或规则集合
- 使用解释性的方法,如SHAP(SHapley Additive exPlanations)值
模型泛化能力问题 - 使用交叉验证方法评估模型的泛化能力
- 使用集成学习方法,如随机森林或梯度提升树,提高模型的泛化能力技术和方法来解决问题。

24.3 研究方案

24.3.1 总体工作安排及具体进度

阶段 工作内容 时间安排
第一年 数据收集与准备
  • 确定数据需求和收集来源
1个月
  • 数据清洗、预处理和特征工程
6个月
  • 构建初始模型并进行初步评估
2个月
第一年末 撰写论文并提交 1个月
第二年 模型优化与部署
  • 进一步优化模型,包括参数调整和特征选择
2个月
  • 模型评估和验证
1个月
  • 部署模型到生产环境并进行性能优化
2个月
第二年末 提交软件著作权申请 1个月
撰写学位论文 1个月
提交专利申请 1个月
编写论文的最终版本和准备投稿 1个月
进行知识分享和培训活动 1个月

25 汇报内容

  • \(\color{#808080}{选题依据}\)
  • \(\color{#808080}{研究内容}\)
  • \(\color{#808080}{研究方案}\)
  • 研究基础及条件

25.1 研究基础及条件

25.1.1 具备的研究条件

25.1.1.1 软件条件

  • 图 8— 掌握编程技术:Python、R、SQL三剑客
  • 图 9— 掌握前后端展示技术

25.1.1.2 硬件条件

  • 图 10— 具备机器学习的硬件:GPU电脑、双屏显、大容量云服务器

25.2 研究基础及条件

25.2.1 完成该课题研究所做的基础工作

25.2.1.1 有数据

  • 图 11— 数据库建设

25.2.1.2 有技术

25.2.1.3 有成果

主导完成的CDSS全院抗生素强度监测系统 数据挖掘相关的论文

26 参考文献

27 感谢各位专家指导!


  1. Hoste EA, Bagshaw SM, Bellomo R, et al. Epidemiology of acute kidney injury in critically ill patients: the multinational AKI-EPI study. Intensive Care Med. 2015;41(8):1411-1423. doi:10.1007/s00134-015-3934-7↩︎

  2. Manrique-Caballero CL, Del Rio-Pertuz G, Gomez H. Sepsis-Associated Acute Kidney Injury. Crit Care Clin. 2021;37(2):279-301. doi:10.1016/j.ccc.2020.11.010↩︎

  3. https://pubmed.ncbi.nlm.nih.gov/?term=sepsis+associated+acute+kidney+injury+%5Bti%5D+AND+machine+learning+%5Btiab%5D+NOT+review+%5Bpt%5D↩︎

  4. Zhang L, Wang Z, Zhou Z, et al. Developing an ensemble machine learning model for early prediction of sepsis-associated acute kidney injury. iScience. 2022;25(9):104932. Published 2022 Aug 12. doi:10.1016/j.isci.2022.104932↩︎

  5. https://pubmed.ncbi.nlm.nih.gov/?term=sepsis+associated+acute+kidney+injury+%5Bti%5D+AND+%28decision+support+%5Btiab%5D+or+clinical+application+%5Btiab%5D%29+AND+machine+learning+%5Btiab]%5D↩︎

  6. Su Q, Chen Y, Chen W, Chen Y, Chen E. Zhonghua Wei Zhong Bing Ji Jiu Yi Xue. 2022;34(11):1222-1226. doi:10.3760/cma.j.cn121430-20220711-00646↩︎