九章智能数据分析中台

使用CHAT2DB搭建的自然语言数据整理分析工具!
CT-Workflow Platform 是新一代以工作流为中心的临床试验管理平台。基于真实临床试验项目(project3)的完整流程,将数据管理(DM)和统计分析(ST)的每一个步骤系统化、智能化、可视化。
一站式项目管理驾驶舱:
10个专业AI助手覆盖所有关键步骤:
编号AI助手能力应用场景AI-DM-001DMP智能生成器方案解析 + 模板填充DMP撰写AI-DM-002数据核查规则生成器CRF逻辑分析 + 代码生成DVP规则制定AI-DM-003智能Query生成器ML异常检测 + Query文本生成数据清理AI-DM-004医学编码助手NLP术语匹配 + 多候选推荐AE/CM编码AI-DM-005QC智能审核数据差异识别 + 报告生成质量控制AI-ST-001SAP智能撰写分析方法推荐 + SAP章节生成SAP撰写AI-ST-002TFL Shell生成器从SAP提取需求 + 生成ShellTFL设计AI-ST-003统计代码生成器SAS/R代码生成 + 优化TFL编程AI-ST-004SDTM/ADaM助手Mapping推荐 + 转换代码数据标准化AI-ST-005结果解读助手统计解释 + CSR文本生成报告撰写
整合自真实临床试验项目(HZYY1-XAZ-23044):
平台内置对以下国际监管标准的支持:
平台设计完全遵循ALCOA+原则:
原则实现方式Attributable (可归因)所有操作记录用户ID、时间戳、IP地址Legible (可读)数据格式标准化,支持导出为PDF/ExcelContemporaneous (同步)实时写入,不允许回溯修改Original (原始)保留所有版本,原始数据不可删除Accurate (准确)内置验证规则,AI辅助一致性检查Complete (完整)审计追踪覆盖100%操作Consistent (一致)跨模块数据一致性自动检查Enduring (持久)至少保留25年,符合监管要求Available (可用)支持监管机构随时调取,1小时响应
所有操作的完整追踪:
审计报告:
提供完整的计算机系统验证(CSV)文档包:
平台对不同任务采用分级的AI自动化策略:
任务类型自动化程度人工审核典型用例信心阈值文档生成80-90%必需DMP、SAP草案>85%代码生成70-80%必需SAS程序、核查规则>75%数据异常检测95%+抽查逻辑错误、异常值>95%医学编码90-95%边缘案例MedDRA自动匹配>90%QC检查85-90%关键节点数据一致性>80%报告生成75-85%全面审核Query报告、QC报告>70%数据映射60-70%必需SDTM Mapping>60%统计解读50-60%必需CSR结果章节>50%
我们的AI使用哲学:
✅ AI擅长:
⚠️ 需人工:
🚫 AI不做:
每个AI输出都包含:
可选控制模式:
根据任务特性智能选择AI模型:
任务主力模型原因备用模型文档生成GPT-4o长文本质量高Claude Sonnet代码生成DeepSeek Coder专业编程能力,成本低GPT-4医学编码Claude 3.5医学文本理解强GPT-4o数据异常本地模型快速,数据不出本地DeepSeek统计解读GPT-4o推理能力强Claude Opus
成本优化:
平台预定义7种标准角色,符合临床试验职责分离原则:
角色工作流访问AI使用权限审批权限典型职责项目经理全部查看所有AI助手里程碑审批整体进度管理DM LeadDM所有工作流DM AI助手DMP/DVP审批数据管理策略统计师ST所有工作流ST AI助手SAP审批统计分析设计数据管理员数据清理/编码Query/Coding AIQuery关闭日常数据管理统计程序员TFL编程代码生成AI程序QCSAS/R编程QC审核员所有QC工作流QC AI助手QC报告签署质量控制监管事务只读所有无最终数据库锁定监管提交
数据库锁定操作的多级权限控制:
操作DM员DM Lead统计师PM监管发起锁定申请✅✅✅✅❌审核数据质量❌✅❌❌❌统计审批❌❌✅❌❌PM审批❌❌❌✅❌执行锁定❌❌❌❌✅
企业版支持创建自定义角色:
┌─────────────────────────────────────────┐
│ 用户界面层 (Tauri Desktop) │
│ React + TypeScript + Ant Design │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 业务逻辑层 (Rust Backend) │
│ ├─ 工作流引擎 │
│ ├─ 权限管理 │
│ ├─ 审计日志 │
│ └─ 数据验证 │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ AI服务层 (可插拔) │
│ ├─ DeepSeek (主力,成本优) │
│ ├─ GPT-4 (备用,复杂任务) │
│ └─ Claude (医学文本理解) │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 数据持久层 │
│ ├─ SQLite (本地项目数据,加密) │
│ ├─ PostgreSQL (企业版,多用户) │
│ └─ S3/MinIO (文档和大文件) │
└─────────────────────────────────────────┘
操作目标延迟实测性能DMP生成< 30秒~15秒SAS代码生成< 2分钟/程序~45秒数据核查1000条/秒~1500条/秒TFL渲染< 5秒/表格~2秒数据库查询< 100ms (P95)~50ms (P95)大文件上传100MB/秒~120MB/秒并发用户100+ (企业版)已测试200+
javascript
// 自定义AI助手插件
export class CustomAIPlugin {
name = "custom-coding-assistant";
version = "1.0.0";
async process(input: CodingRequest) {
// 调用自己的AI API
const result = await yourAI.generate(input);
return result;
}
}
json
{
"event": "workflow.completed",
"workflow_id": "DM-01",
"project_id": "proj_123",
"timestamp": "2025-01-15T10:30:00Z",
"webhook_url": "https://your-system.com/api/notify"
}
bash
# 获取项目状态
GET /api/v1/projects/{id}/status
# 触发工作流
POST /api/v1/workflows/{id}/start
# 查询AI生成结果
GET /api/v1/ai/jobs/{job_id}
Windows
powershell
# 下载
Invoke-WebRequest -Uri https://releases.ct-workflow.com/latest/CT-Workflow-Setup.exe -OutFile CT-Workflow-Setup.exe
# 安装
.\CT-Workflow-Setup.exe
macOS
bash
# 下载
curl -O https://releases.ct-workflow.com/latest/CT-Workflow.dmg
# 安装
open CT-Workflow.dmg
# 拖拽到Applications文件夹
Linux
bash
# 下载AppImage
wget https://releases.ct-workflow.com/latest/CT-Workflow.AppImage
# 添加执行权限
chmod +x CT-Workflow.AppImage
# 运行
./CT-Workflow.AppImage
bash
# 启动应用后,按照向导完成配置:
1. 选择部署模式
□ 单机版(本地SQLite)
□ 企业版(连接PostgreSQL服务器)
2. 配置AI服务
□ DeepSeek API Key: sk-xxxxx
□ OpenAI API Key (可选): sk-xxxxx
□ Claude API Key (可选): sk-xxxxx
💡 提示:可跳过,后续在设置中配置
3. 创建管理员账号
用户名: admin
密码: ********
邮箱: admin@example.com
4. 完成!🎉
bash
# 在主界面点击"新建项目"
项目名称: HZYY1-XAZ-23044
适应症: 晚期实体瘤
研究类型: I期临床试验
起止日期: 2023-04-01 ~ 2024-12-31
→ AI自动提取:访视表、终点、入排标准
# 创建成功!自动进入项目中心
4. 启动第一个工作流
bash# 在项目中心,点击"DMP制定"工作流卡片
→ 进入DM-01工作流仪表板
→ 点击"Step 1: AI自动生成DMP草案"
→ 等待15秒... ✅ 生成完成!
→ 人工审核和修改
→ 点击"提交审批" → 选择审批人
→ 审批通过后,状态变为"已完成" ✅
→ 自动解锁下一个工作流"CRF设计"
快速演示视频
📹 5分钟快速入门:https://www.ct-workflow.com/demo/quickstart
📹 完整功能演示:https://www.ct-workflow.com/demo/full-tour
📖 用户旅程示例
场景:启动新的肿瘤临床试验项目
Day 1: 项目初始化
09:00 - 项目经理登录平台
├─ 点击"新建项目"
├─ 填写基本信息:
│ • 项目名称:HZYY1-XAZ-23044
│ • 适应症:晚期实体瘤
│ • 预计入组:60例
│ • 研究周期:18个月
├─ 上传方案PDF(152页)
│ → AI自动解析(2分钟)
│ → 提取关键信息:
│ ✓ 12个访视点
│ ✓ 主要终点:ORR
│ ✓ 次要终点:PFS, OS, AE
│ ✓ 入排标准:18条
└─ 项目创建成功!
09:30 - 查看AI生成的项目建议
├─ 建议的执行路径:
│ 1️⃣ DMP制定(预计2天)
│ 2️⃣ CRF设计(预计1周)
│ 3️⃣ EDC搭建(预计2周)
│ 4️⃣ ...
├─ 自动分配团队:
│ • DM Lead: 张三
│ • 统计师: 李四
│ • 程序员: 王五
└─ 发送邀请邮件 ✅
10:00 - 进入项目中心
└─ 可视化仪表板显示:
• 总进度:0%
• 待办任务:3个
• 下一里程碑:DMP审批(预计2天后)
Week 1-2: 数据管理准备
Week 1 - Day 1: DMP工作流
10:00 - DM Lead进入DM-01工作流
├─ Step 1: AI生成DMP草案
│ → 点击"开始生成"
│ → 进度条:分析方案... 20%
│ → 进度条:生成章节... 60%
│ → 进度条:格式化... 90%
│ → ✅ 完成!(耗时15秒)
│
├─ 查看生成的DMP草案:
│ 📄 数据管理计划 v0.1
│ ├─ 1. 项目概述 ✅ (AI生成)
│ ├─ 2. 数据采集计划 ✅
│ ├─ 3. 数据核查计划 ✅
│ ├─ 4. 编码策略 ✅
│ ├─ 5. 质量控制 ✅
│ └─ 6. 数据库锁定标准 ⚠️ (需人工补充)
│
11:00 - Step 2: 人工审核与修改
├─ 在Monaco编辑器中修改:
│ • 补充第6章具体标准
│ • 调整访视窗口期定义
│ • 添加EDC供应商信息
├─ AI实时建议:
│ 💡 "检测到'±3天',是否统一为'±72小时'?"
│ 💡 "建议添加缺失数据处理策略"
└─ 保存版本 v0.2
Week 1 - Day 2: DMP审批
14:00 - Step 3: 提交审批
├─ 选择审批人:项目经理 + 申办方
├─ 添加备注:"请重点关注第6章锁定标准"
└─ 发送审批邮件 ✅
Week 1 - Day 3: DMP定稿
09:00 - 审批人收到通知,打开审阅
├─ 查看修订历史:v0.1 → v0.2 的差异
├─ 添加批注:"第6章已完善,同意" ✅
└─ 批准 → DMP状态变为"已批准"
09:30 - DMP工作流完成!
├─ 系统自动:
│ • 生成DMP定稿版 v1.0
│ • 归档到文档库
│ • 解锁下一工作流"CRF设计"
│ • 更新项目进度:10% → 15%
└─ 通知团队:DMP已完成 ✅
Week 1 - Day 4-5: CRF设计工作流
├─ DM-02工作流启动
├─ AI推荐CDISC标准域:
│ • Demographics (DM)
│ • Adverse Events (AE)
│ • Vital Signs (VS)
│ • Laboratory Tests (LB)
│ • Tumor Response (TR)
│ • Exposure (EX)
│ • Concomitant Medications (CM)
├─ 可视化表单编辑器:
│ • 拖拽添加字段
│ • 设置验证规则
│ • 预览CRF效果
└─ 生成eCRF规范文档 ✅
Week 2: DVP工作流
├─ Step 1: CRF逻辑分析
│ → AI扫描所有CRF表单
│ → 识别:120个字段,35个逻辑关系
│
├─ Step 2: AI生成核查规则
│ 规则类型分布:
│ • 必填检查:45条
│ • 范围检查:30条
│ • 逻辑一致性:25条
│ • 访视窗口:15条
│ • 数据格式:5条
│
├─ Step 3: 生成SAS代码
│ → AI自动生成check_001.sas ~ check_120.sas
│ → 代码包含:
│ • 数据读取
│ • 逻辑判断
│ • Query生成
│ • 日志输出
│
└─ Step 4: UAT测试
• 导入测试数据(50例模拟数据)
• 运行全部核查程序
• 发现5条规则需优化
• 调整后重新测试 ✅
DVP工作流完成!项目进度:30%
Week 3-6: 数据收集阶段
Week 3: EDC上线 + 首例入组
├─ EDC系统配置完成
├─ 中心培训(在线会议)
├─ 首例患者入组(中心001)
• Screening访视数据录入
│ • AI实时核查:发现2个异常
│ ⚠️ "体重超出合理范围(180kg)"
│ ⚠️ "血压收缩压<舒张压"
│ • 研究中心当场修正 ✅
└─ 数据质量:实时监控
Week 4-6: 数据清理工作流(每周循环)
每周一 09:00 - 自动运行数据核查
├─ 执行120条DVP规则
├─ 生成质疑清单:
│ Week 4: 12个Query (5 High, 7 Medium)
│ Week 5: 18个Query (8 High, 10 Medium)
│ Week 6: 15个Query (6 High, 9 Medium)
│
├─ AI自动分类优先级:
│ 🔴 High: 影响主要终点的数据
│ 🟡 Medium: 次要数据异常
│ 🟢 Low: 格式问题
│
└─ 自动分配给相应中心
每周二-四 - 中心回复Query
├─ 中心登录Query管理模块
├─ 查看分配的质疑
├─ 填写回复和数据更新
└─ 提交 → DM审核
每周五 - Query关闭和报告
├─ DM审核中心回复
├─ 关闭已解决的Query
├─ AI生成周报:
│ 📊 本周数据清理进展报告
│ • Query总数:45个
│ • 已关闭:38个(84%)
│ • 待回复:7个(16%)
│ • 平均响应时间:2.3天
└─ 发送给申办方
Week 5-6: 医学编码工作流
├─ AI提取AE术语(125个原始术语)
│ • "头疼" → "Headache"
│ • "恶心呕吐" → 拆分为2个术语
│ • "ALT升高" → "Alanine aminotransferase increased"
│
├─ AI自动匹配MedDRA:
│ ✅ 自动匹配:119个(95%)
│ ⚠️ 多个候选:4个(3%)
│ ❌ 未匹配:2个(2%)
│
├─ 人工审核边缘案例:
│ • "轻度头晕"
│ 候选1: Dizziness (10013573) ⭐推荐
│ 候选2: Presyncope (10036653)
│ • 选择候选1 ✅
│
└─ 生成编码字典:
📄 AE_Coding_Dictionary_v1.0.xlsx
• PT: 85个
• LLT: 125个
• 匹配率: 97%
Month 4-6: 数据库锁定
Month 4: 最后入组完成
├─ 末例患者末次访视(LPLV)
├─ 启动数据库清理最后冲刺
└─ 目标:Month 6完成数据库锁定
Month 5: 数据清理收尾
├─ 每周Query数量:
│ Week 1: 25个
│ Week 2: 18个
│ Week 3: 12个
│ Week 4: 5个
│
├─ 遗留问题会议:
│ • 讨论7个无法解决的Query
│ • 决定:5个数据删除,2个保留加说明
│ • 更新DMP相应章节
│
└─ QC工作流启动:
├─ 100% SDV (源数据验证)
│ • 抽取10%患者(6例)
│ • 核对EDC vs 原始病历
│ • 发现3处差异,全部修正 ✅
│
├─ AI自动数据一致性检查:
│ • 跨表逻辑一致性:✅ 通过
│ • 时间序列合理性:✅ 通过
│ • 派生变量计算:⚠️ 发现1处公式错误
│ • 修正后重新验证:✅ 通过
│
└─ QC报告生成:
📄 QC_Report_Final_v1.0.pdf
• 检查项:156项
• 通过率:99.4%
• 遗留问题:1项(已文档化)
Month 6 - Week 1: 数据库锁定准备
├─ DM-06工作流启动
├─ AI生成锁定清单(25项):
│ ✅ 所有CRF表单已审核
│ ✅ Query关闭率 > 95% (实际98%)
│ ✅ 医学编码完成率 100%
│ ✅ QC完成率 100%
│ ✅ SAE报告完整性检查通过
│ ✅ Protocol Deviations记录完整
│ ⚠️ 1例患者退出原因待确认
│ ... (其余23项)
│
├─ 解决遗留问题:
│ • 联系中心确认退出原因
│ • 更新退出表单
│ • 重新运行核查程序 ✅
│
└─ 锁定准备会议:
• 参会:PM, DM Lead, 统计师, 申办方
• 审阅清单:全部25项 ✅
• 决定:批准锁定
Month 6 - Week 2: 执行锁定
├─ 2025-06-15 10:00 - 数据库锁定!
│ → 系统执行:
│ • 创建数据库快照
│ • 设置所有数据为只读
│ • 生成锁定声明
│ • 导出SDTM格式数据
│ • 发送通知给所有相关人员
│
├─ 锁定声明自动生成:
│ 📄 Database_Lock_Statement_v1.0.pdf
│ • 锁定日期:2025-06-15
│ • 数据集版本:DBL_2025_06_15
│ • 患者数:60例
│ • 访视数:720次
│ • AE数:234个
│ • 签署:DM Lead, 统计师, PM, 申办方
│
└─ 数据传输给统计团队:
• SDTM数据集(10个域)
• Define.xml
• 数据库说明文档
• 传输验证:MD5校验 ✅
Month 7-8: 统计分析
Month 7 - Week 1: SAP撰写工作流
陈安均博士,LHS 技术论坛项目 联合主席,国际 LHS 社区(非营利),加州硅谷
[1/2/2023 更新。英文原文]
《LHS 智能医学系统实用指南》专注于为软件开发人员和医疗健康机构临床团队提供技术实用信息,帮助您快速启动对未来 Learning Health System (LHS) 智能医学系统的研发和应用。
指南内容基于我对美国医学科学院 (US National Academy of Medicine, NAM) 发表的 LHS 系列报告的理解和解读,以及 LHS 这一新领域迄今为止取得的进展。NAM 提出的 LHS 愿景和制定的 LHS 顶层框架不仅将引导美国整个医疗健康系统向智能医学循环学习和传播系统转型,而且会影响全球各国医疗健康系统的更新。
本指南首先总结了 NAM LHS 系列报告,以期回答 LHS 基本问题:我们为什么需要 LHS?什么是 LHS?谁在搭建 LHS?
然后指南简要描述了应用机器学习 (machine learning, ML) 构建 LHS 小型单元的最新技术发展。亮点是首次使用合成患者数据模拟的机器学习赋能的 LHS (即 ML-LHS),所用数据可在 GitHub 上的 “开放合成患者数据” (Open Synthetic Patient Data) 项目获取。出于示范目的,指南分享了来自不同医院或医疗系统的 LHS 项目实例,这些项目正在为疾病风险预测和精准医疗等不同临床任务构建真实患者的 ML-LHS 单元。为加速 LHS 发展,我提出了一个“合成+真实”数据的新策略,有助于更有效地构建 ML-LHS 单元。
随后的章节提供了有关 ML-LHS 不可或缺的电子病历数据(electronic medical record, EMR 或 electronic health record, EHR)、合成患者数据、数据驱动的机器学习以及其他技术组件的更多详细信息。
指南主要目标:
- 为软件开发者和医疗健康机构临床团队提供实用技术信息,帮助快速了解 LHS 的优点并开始研发 LHS。
- 解释为什么构建小型 ML-LHS 单元更切实可行,而不应被另一种大而全的 LHS 构想所束缚。
- 提出“合成+真实”新策略:首先利用合成患者数据模拟 ML-LHS 单元,然后应用模拟流程帮助构建真实病历数据的 ML-LHS 单元。
指南还对 ML-LHS 提出以下假设:
- ML-LHS 性能假设:因其内在的以数据为核心的机器学习方法,ML-LHS 最终可以为大多数疾病和健康状况实现高性能的预测 (>95%) 。
- ML-LHS 平等假设:由大医院主导的临床研究网络 ML-LHS 可以有效地用机器学习模型为小型医疗机构赋能,从而减小在医疗服务不足人群中的医疗服务差异 (health care disparities)。
- ML-LHS AI 假设:因为 LHS 具有数据驱动和部署导向的特征,大部分基于电子病历数据的 AI 将以 LHS 形式更有效地实现和传播。
LHS 实用指南 是 GitHub 上开放 LHS 项目 (Open LHS) 的一部分,旨在智能医学系统新兴领域,促进全球范围的研究、开发和实施等方面的分享和协作。作为 LHS 的动态技术文档,本指南发布在 GitHub 平台,将在 LHS 新信息出现时进行更新,及时为 LHS 社区提供最新进展。
在阅读本快速实用指南后,如果您想尝试病历机器学习或 ML-LHS 研究,可先在 GitHub 上的 开放合成数据项目 查看已有数据。如果您需要新的合成数据,可email我 (ajchen(at) web2express.org) 讨论如何产生新数据。合成数据有望加速您的项目进程,开源 Synthea 技术能够模拟各种疾病或健康状况,可能是您所需的合成数据的起点
【关于 LHS 名称翻译】
LHS 作为新的专业技术术语,本指南采用美国医学科学院发表的 LHS 系列报告中的定义。因为中文直译不能反映 LHS 的核心含义,我这里给出有助于理解的意译。
- 英文全称:Learning Health System。缩写: LHS。
- 中文全称:智能医学循环学习和传播系统。简称:LHS 智能医学系统。
“In a learning health system, science, informatics, incentives, and culture are aligned for continuous improvement and innovation, with best practices seamlessly embedded in the delivery process and new knowledge captured as an integral by-product of the delivery experience.” (Source: NAM website – The Learning Health System Series)
LHS 愿景由美国医学科学院(前身为 US Institute of Medicine, IOM, 美国医学研究院)在一系列报告中提出和描述。下面我将总结报告中的相关信息,说明为什么需要 LHS,以及 LHS 是什么,并选出一些实例。如需详细信息,请参阅 NAM 网站上的 智能医学系统报告系列。

2006 年,IOM 循证医学圆桌会议召开了一次题为“LHS 智能医疗系统”的研讨会,第一份 NAM 《LHS 智能医疗系统》报告于 2007 年发表。该报告指出美国医疗保健系统的表现仍然不尽人意。在剖析了临床证据的生成和应用过程之后,该报告设想了一个新的医疗健康服务系统,临床证据的产生及应用在医疗服务过程中持续不停地交互发生,即智能医疗保健系统。
在重新评估医疗服务如何产生及应用临床证据后,报告发现当前医疗系统存在以下问题:
- 问题:在医疗服务中经常错失良机,发生本可预防的疾病和受伤。
医疗失误问题:医学研究院 2001 年的报告《跨越医疗质量鸿沟》发现,每年约有 44,000 至 98,000 名美国人可能死于医疗失误。这个令人担忧的问题说明了重新设计医疗系统关键方面的需求,包括安全性、有效性、以患者为中心、及时性、效率和公平性。
- 问题:考虑到变化的速度和复杂性,目前流行的产生临床证据的方法是不充分的,并且可能很快就过时。
目前广受依赖的随机对照临床试验 (RCT) 虽然在一定情况下很有用,但太耗时、太昂贵,并且普遍适用性可质疑。
临床证据缺乏普遍适用性:临床研究通常不能可靠地产生能普遍适用于现实世界患者群体临床决策的证据。临床研究使用严格的患者纳入和排除标准,限制了大部分临床人群的参与。因此,即使完成了冗长的临床试验,临床医生仍然可能认为研究结果无法应用于自己的更加复杂的患者群体。例如,Masoudi 和同事发现,只有少数 (13-25%) 现实中的心力衰竭患者符合参加临床试验的入选条件 (Masoudi 2003) 。
- 问题:临床证据的数量、质量和应用方面都存在缺陷。
需要在全系统范围内更加注重临床证据,需要新的临床研究范式,可以更好地利用医疗服务过程中生成的数据,从而加快和改进能支持现实世界临床决策的证据研发。
- 问题:目前阐释证据的方法与制定指南和建议的方法常常会产生矛盾和混乱,指南的传播过于缓慢。
一份报告表明,一些好的研究结果需要长达 17 年时间才开始用于服务患者 (Balas, Boren 2000)。从创新到临床应用之间的滞后时间亟待缩短。
- 问题:低效和浪费在医疗服务中普遍存在。
在系统层面,临床研究与临床服务过程很明显是分离的。该 LHS 报告提出,将临床研究嵌入临床服务过程中可能会解决医疗系统中的这一基本缺陷。
简而言之,如果能够同时开展临床研究和临床服务,就可能提高持续学习和传播的效率和效果,从而大大提高医疗质量并同时降低费用。这就是为什么我们需要 LHS 智能医学系统。
【资料来源:NAM 2007 报告《LHS 智能医疗系统》】
通过重新设计临床研究和医疗健康服务,《LHS 智能医疗系统》报告希望产生和应用最佳证据的过程可成为医疗服务过程本身的有机组成部分,这样就可以使智能医疗健康系统比当前更有效果、更有效率。
智能医学系统的特点:
- 文化:参与式、以团队为基础、透明、不断提升
- 设计和流程:以患者为中心并经过测试
- 患者和公众:全面积极地参与
- 决策:知情、促进、共享和协调
- 医疗服务:每次都从最佳实践开始
- 结果和费用:透明且不断评估
- 知识:临床服务和研究的持续和自然的结果
- 数字技术:持续改进的引擎
- 健康信息:可靠、安全和可重复使用的资源
- 数据应用:为了共同利益而管理和使用数据
- 信任结构:强大、受保护并积极培养
- 领导力:多焦点、网络化和动态性
美国卫生部医疗信息改革协调办公室 (ONC) 设想了一个全国性的智能医学系统 (Friedman 2010)。
【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】
IOM 2013 年报告《低成本的最佳医疗服务:美国通往持续学习的医疗服务系统的途径》重申了 LHS 的愿景。 该报告探索了变革的必要性、使转型成为可能的所需新兴工具、可持续学习的医疗服务系统的愿景、以及实现这一愿景的途径。

该报告重新定义了将当前“破碎的”医疗系统转变为智能医学系统的需求:
- 需要一种新的途径来生成和应用医学知识。
目前产生新医学知识的方法存在不足,难以提供支持优质医疗服务所需的证据。临床证据不足,并且产生医学知识的方法有明显的局限性。
可能的证据与实际产生的证据之间的差距继续扩大。研究表明,指南中有证据支持的陈述的数量没有达到应有的水平。在某些情况下,40-50% 的指南推荐是基于专家意见、案例研究或医疗服务标准,而不是基于多项临床试验或元数据分析。
目前的研究知识库只能为回答重要类型临床问题提供有限的支持,包括效果比较和长期患者结果相关的问题。
临床指南证据不足会影响医疗服务的证据。在美国,基于临床研究获得的正式证据所做出的临床决策的占比,不同研究有不同的估算,有些研究发现仅占 10-20%。
- 知识需要快速传播。
心脏病发作后 β 受体阻滞剂的广泛使用在各方面来说都是一个成功案例:高质量临床证据生成;治疗方案被纳入临床指南、质量改进计划和医疗质量评价;还有些健康保险计划为提高该治疗方案的采用提供了经济激励。然而,即使做出这么大努力,从该治疗方案最初结果的发表到在临床实践中获得普遍应用,也经历了 25 年的时间。这个例子说明,有必要建设新基础设施,使临床学习和方案改进的过程更容易,争取下一个发现不再需要 25 年的持续努力才能广泛用于服务患者。
- 需要控制不可持续的高医疗成本。
为了提高质量、控制成本,需从目前不可持续且有缺陷的医疗系统组织架构,转变为一个可在每个医疗服务环节获取知识并促进持续改善的系统。简而言之,国家需要一个可不断学习的医疗服务系统,这个系统现在既是可能的,也是必要的。
智能医疗服务系统的定义:
“智能医疗服务系统是一种将试验科学、信息学、激励措施和文化有效结合,以达到持续改进和创新的系统,它将最佳临床实践嵌入医疗服务流程中,由患者和家庭在各方面积极参与,并且在临床服务中产生新知识。”(资料来源:NAM 2013 年报告《低成本的最佳医疗服务》)
智能医学系统示意图:

(资料来源:NAM 2013 年报告《低成本的最佳医疗服务》)
【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】
实验科学与信息学:
患者-医生合作:
激励措施:
持续学习的文化:
LHS实例:
临床研究网络LHS实例:
为了让开发者更容易理解 LHS,本指南提供一个更为简洁的技术性定义:
- 智能医学系统将研究嵌入医疗服务中,可同时收集医疗健康数据,不断地机器学习新知识和预测模型,并迅速把新改善应用于医疗服务中。
智能医学系统中的“学习”,是指在人正常学习之外的机器学习、持续学习,最终是系统自我学习。当临床研究和医疗实践无缝有机结合时,传统的知识传播大问题就开始自然地减轻。
从本质上讲,LHS 是关于医学知识产生和使用的基础性变革。接下来的两个章节将深入探讨这类“知识业务”。
【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】
随机临床试验 (RCT) 是当前临床研究生成医学证据和知识的“金标准”。尽管科学发现的步伐在加快,但临床研究目前并不能充分解决紧迫的临床问题,结果是患者和临床医生都在证据不足的情况下做决定。
即使以目前的知识产生速度,知识库也仅仅能为回答许多最重要临床问题提供有限的支持。一项针对九种最常见慢性病临床指南的研究发现,只有不到一半的指南为患有多种合并症的患者提供治疗指南。
当前大型临床研究方法的成本平均为 1,500-2,000 万美元,有些甚至更高,但这些研究还不能反映许多医疗服务机构的实际情况。
需要新的方法来解决当前临床研究的局限性。替代研究方法包括:
替代方法还需要不同的统计分析:例如
实验性研究方法:
观察性研究方法:
NAM 2013 年研讨会总结报告《智能医学系统中的观察性研究》 (OS-LHS) ,回顾了观察性研究的主要方法、如何处理偏差、如何评估治疗异质性,以及在LHS中使用观察性研究方法的其他重要方面。观察性研究可以提供在真实世界临床实践中治疗方法有效性的信息。观察性研究方法是随机临床试验方法的补充,具有以下特点:
观察性研究方法的问题:
关于观察性研究的偏差:
NAM 2013 年的研讨会总结报告《智能医学系统中的大型简单试验和知识生成》 (LST-LHS) ,描述了在 LHS 背景下的 LST 研究方法,并提供了成功的例子。 与随机临床试验相比,大型简单试验能回答有关药物和其他干预措施有效性的一些问题,成本更低、时间更短、或两者兼具。 该报告描述了进行大型简单试验所需的基础设施。使用电子病历是收集和管理大量患者数据必需的,电子病历可让临床试验在临床服务过程中开展。
从许多医疗机构招募足够数量的患者可能需要临床研究网络 (CRN) 或机构联盟。这些网络正朝智能医疗系统模式发展。在 CRN 中,临床医生和研究人员可以从更大的患者群体中学习,检查结果各异的诊断和治疗,找出可产生更好结果的因素。CRN 可以开展更大人群的临床试验,这对研究罕见病或不常见疾病尤为重要。
现在已有数据标准,如 FDA 项目发展出来的临床数据采集协调标准 (CDASH),也有可从多元化的电子病历系统采集数据的电子工具。
详情请见报告中以下专家的介绍:
2016 年,NAM 组织了“加速临床知识的生成和使用”会议,并发表了一篇讨论报告《从最佳医疗服务中生成知识:推进持续的智能医学系统》 (Abraham 2016)。根据报告,尽管嵌入式学习活动大有前景,但临床运作和研究合作的障碍依然存在。
NAM LHS 系列报告发布后,EMR 已迅速在医疗机构中普及开来。同时,随着最近几年计算能力和算法研发的快速发展,NAM LHS 报告中尚未充分讨论的机器学习和人工智能 (AI) 技术出人意料地成为任何临床研究人员皆可运用的常见研究工具。
在我看来,这种前所未有的数字健康数据加之机器学习的环境正在为 LHS 背景下的医学知识生成带来不可估量的可能性。一方面,大量机器学习研究直接使用常规 EMR 数据,已学习和构建了有关诊断和治疗等临床事件的知识库。另一方面,从电子病历数据建造机器学习模型,既不需要先验知识,也不产生传统形式的知识。 机器学习模型,尤其是那些无法解释的模型,将把 LHS 中学习和传播新知识的传统概念推向一个未知领域——在不了解模型的知识来源和知识产物情况下传播机器学习模型。(在这种情况下,我们只知道模型有效,但不知为什么。)
【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】
当前产生和应用新临床知识的系统在很大程度上是相互脱节的,且协调不佳。虽然每年临床数据帮助开发了许多有效的循证临床实践、治疗方法和干预措施,但其中只有一部分被广泛使用。其他许多临床实际仅是在有限范围内使用,未能发挥其改善医疗服务的革新式潜力。
有证据表明,仅仅提供信息尽管速度更快,但很少能改变临床实践。因此,挑战在于如何能够以让临床医生采纳的方式传播知识。
将研究结果用于临床服务的一种技术工具是临床决策支持系统。临床决策支持系统将患者信息与包含临床研究结果和临床指南的数据库集成在一起。该系统生成个性化患者建议,指导临床医生和患者做临床决策。
随着知识生成速度的加快,需要新的方法将正确的信息以清晰易懂的格式传达给患者和临床医生,帮助他们共同做临床决策。报告的相关发现有:
电子病历数据尽管不完美,但可以产出相当准确的统计预测模型,这些模型通常比目前用于预测风险的、基于简单分期策略的模型更好(NAM 2013 OS-LHS 报告)。
正如之前的知识生成部分所述,机器学习模型可以从整个 EMR 或多个 EMR 构建。根据所使用的算法,有些模型是可解释的,有些则不可解释。无法解释的 ML 模型即使是高性能的,它们的传播也将面临挑战。
NAM 2011 年的报告《智能医学系统的数字基础设施:持续改善健康和医疗系统的基础》探讨了利用现有技术及选择创新重点的已有努力和机遇,以确保在一个系统中收集的数据可以跨系统用于各种不同的用途。然而,LHS 基础设施的完整连贯图景仍不明朗。
NAM 2011 年研讨会总结报告《工程设计智能医疗服务系统的未来展望》,回顾了持续反馈和改进医疗服务的质量、安全性、知识和价值的工程方法。智能医疗系统的目标是每次都提供最好的诊疗,并在每次医疗服务中学习和改进。目前,美国在组织、管理和提供医疗服务方面都没能做到令人满意的可靠性、一贯性和可承受性。该报告盘点了可能适用于健康领域的工程学经验教训。然而,它没有提供构建实际 LHS 的指导。
NAM 2013 年的《低成本的最佳医疗服务》报告展示了一个复杂的 LHS,并得出结论:“鉴于系统的复杂性和各个部分的相互关联性,任何一个部分都无法单独达到开发一个不断学习和改进的医疗系统所必需的变革范围和规模。”(第 10 章 281 页)
如果仅将 LHS 定义为最终的全国范围的智能医学系统,NAM 报告的上述结论可能是正确的。但这可能不是一个有效的方法 —— LHS 是如此复杂,以至于无人能够开始构建它。
我认为,为了系统实施的可行性目的,我们应该分不同阶段、在不同层面上定义和建造智能医学系统。最重要的是,LHS 的起点应该是现在就可以由一家医院、一个科室或一个小组建立的那种 LHS,无需依赖任何没必要的外部因素。
因此,本 LHS 快速指南采用自下而上的实用方法:将大型复杂的 LHS 分解为小型 LHS 单元;先设计和构建 LHS 单元,用于执行解决问题的具体任务;然后将功能性 LHS 单元连接成子系统。当多个子系统顺利运行后,再将子系统集成更大的智能医学系统。
由于我们仍处于构建智能医学系统的初期阶段,我们应该首先专注于构建足够数量的小型 LHS 单元作为示范。 在现阶段,LHS 领域最容易出成果的是什么?可能是基于 EMR 数据的预测型 LHS。例如,用于提高疾病早期诊断的智能风险预测系统,或个性化用药智能预测系统,都对医院有很强的商业价值,最有可能立项。
本指南侧重于为构建 ML 赋能的小型 LHS 单元 (ML-LHS) 提供实用指导和实例。通过应用机器学习模型,预测型或其他功能性的 ML-LHS 单元有望为医疗服务或公共卫生服务的许多具体任务提高效果和效率。
ML-LHS 单元的主要特性:
- 数据驱动。
- 机器学习。
- 持续学习。
- 快速传播。
- 自动流程。
现在,相关的开放数据和开源软件使得研发小型但有效的 ML-LHS 变得更加容易,这些技术在 NAM 编写 LHS 报告时还不存在,包括大量可供选择的免费和开源的机器学习算法和工具。在患者数据得到保护的情况下,有些共享的脱敏 EHR 患者数据在数据源网站上申请授权后可获得。对于任何疾病和健康状况,也可以通过 Synthea 等最新技术产生合成的患者病历数据,以补充真实 EHR 数据的缺失。合成数据可方便地用于研发 ML 算法和 LHS 流程、测试或培训。
以下章节将先描述应用合成患者病历首次模拟风险预测 LHS,随后是正在进行中的使用真实 EHR 数据的 ML-LHS 项目实例。基于这些研究的初步结果,我提出一个新的“合成+真实”策略,可更有效地用来构建小型 ML-LHS 单元:首先使用合成病历数据模拟 ML-LHS,然后将其流程应用于真实病历数据。
通过合成患者病历的新技术,现在已经能够合成病历模拟 EMR,然后用此虚拟数据模拟机器学习赋能的 LHS,探索 ML-LHS 的作用。LHS 模拟是一种研究 ML 算法和 LHS 流程的有效方法,研究结果可用于帮助使用真实患者数据构建 ML-LHS 单元。由于基于公共数据而合成的患者数据不存在隐私问题,LHS 模拟研究可跨机构大规模共享数据和协作研发算法和流程。这个模拟步骤有可能为整体 LHS 项目进度节约大量时间。
我们使用 Synthea 技术合成患者病历,进行了首次 ML-LHS 模拟研究,研究结果发表在《自然科学报告》杂志 (Nature Science Reports) (Chen 2022)。下面是该研究总结。
用于风险预测任务的 ML-LHS 核心单元的简化设计如下图所示。该设计着重于模拟两个机器学习核心步骤:(1)从现有的 EHR 数据构建初始 ML 模型,(2)持续机器学习新增数据以改进 ML 模型。这种 LHS 设计利用了 LHS 内在的数据为驱动的 ML 方法。因此,ML-LHS 流程主要侧重于提高 ML 可用数据的质量和数量,以达到改进风险预测 ML 模型的目的。

图示:风险预测 ML-LHS 核心单元的设计示意图。1. 先由现有病历数据构建 ML 模型。2. LHS 学习循环持续使用更新的患者数据改进 ML 模型,并将新模型快速应用到风险预测服务中。
为了模拟一个有 100 万患者规模的真实医院 EHR 的肺癌风险预测 LHS,模拟 LHS 需包含大约 5,000 名肺癌患者。Synthea患者合成软件 共合成了约 150,000 名患者的病历,其中约有 5,500 名患有肺癌。这些 Synthea 患者的 1,300 多万次就诊中有超过 1.75 亿数据点,包括 800 万个诊断、1.11 亿个观察、2,400 万个手术和 1,500 万个药物治疗。
模拟 ML-LHS 的持续学习和改进过程从 30,000 名 Synthea 患者开始,共模拟四次学习循环,每次增添 30,000 名 Synthea 患者。每次更新数据集后,重建新的 XGBoost 预测模型。随着数据集规模从 30,000 名患者增加到 150,000 名患者,肺癌风险预测模型效果逐步提高:肺癌召回率 (recall) 从 0.849 增加到 0.936,精确率 (precision) 从 0.944 增加到 0.962, AUC 从 0.913 增加到 0.963,准确度 (accuracy) 从 0.938 增加到 0.975。如下图,与随机森林算法 (RF)、支持向量机算法 (SVM) 和 K 最邻近算法 (KNN) 的基础模型相比较,Synthea 患者的 XGBoost 肺癌模型的风险预测能力最好。

图示:随着数据量增加,肺癌风险预测 ML 模型在不断改进。比较四种算法的召回率 (recall): XGBoost、RF、SVM 和 KNN。初始数据集:30,000 名患者;有四次数据更新,每次增加 30,000 名患者。
为了验证模拟研究建立的新型数据驱动的 ML-LHS 流程的可复制性,它应该可以为任何目标疾病(如脑梗)建立高效风险预测ML模型:在相同数量的数据更新迭代后,可达到高召回率和精确率。
Synthea 合成患者的脑梗发生率高于肺癌。每 30,000 患者中约有 4,000 名脑梗患者。与肺癌模型相似,脑梗模型的性能指标也随着每次数据更新而提高。在第四次学习和改进周期中,更新的 150,000 名患者中有 20,000 名脑梗患者,XGBoost 基础模型的关键指标提高到:召回率 0.908、精确率 0.964、AUC 0.948、准确度 0.969 (见下图)。
脑梗模型的结果证实,建立的LHS过程在构建脑梗风险预测的高性能模型方面同样有效。我们预计这种 LHS 过程也将适用于其他疾病。

图示:脑梗风险预测 XGBoost 基础模型随着数据量增加而不断改进。 模型性能用召回率、精确度和 AUC 来衡量。含有 10 个变量的基础模型的召回率是基线。
这项模拟研究创建了第一个合成 ML-LHS 单元,并示范了它能够用现有电子病历数据构建肺癌和脑梗等目标疾病的风险预测 XGBoost 基础模型。凭借它固有的数据驱动的机器学习方法,ML-LHS 可以不断从新的患者数据中学习和提高 ML 模型的性能。
合成 ML-LHS 流程可用于帮助使用真实患者数据构建疾病风险预测 ML-LHS。此外,还可以通过超参数 (hyperparameter) 调整进一步优化真实数据 ML 模型。
注:LHS 模拟中的 ML 模型仅能用于研究,不能用于实际医疗服务。
基于 ML-LHS 模拟研究,我提出两个假设:
- ML-LHS 性能假设:通过 LHS 内在的数据驱动 ML 方法,ML-LHS 单元最终可以为多数疾病的风险预测模型达到高召回率和精确率 (>95%) 。
- ML-LHS 平等假设:虽然社区和农村诊所可能没有足够的数据自行构建 ML 模型,但可以加入由大型医院主导的临床研究网络 (CRN),CRN 运行的 ML-LHS 将诊所数据综合纳入学习周期,从而诊所得到赋能,可以平等地使用相同水平的 ML 和 AI 工具。
ML-LHS 非常有希望将医疗服务和公共卫生服务系统转变为更有效和更高质量的系统。我想在这里着重探讨一个我特别关心的应用领域:健康公平性。
ML-LHS 平等假设提出,ML-LHS 具有减轻农村及弱势群体的医疗不公平问题的潜力。尽管农村诊所和城市社区卫生中心 (CHC) 没有足够数量的患者来独自构建可完成各种临床任务的高精度 ML 模型,但 ML-LHS 设计可以扩展到临床研究网络 LHS (CRN-LHS), 覆盖 CRN 内的小型诊所。借助 CRN,教学医院或三级医院负责使用包含农村诊所和城市 CHC 的患者数据构建 ML 模型。由此产生的 ML 模型和 AI 工具可在 LHS 内迅速传播,结果是诊所和 CHC 也能使用大医院用的 ML 和 AI 工具。我预计,CRN-LHS 设计提供了一个有前景的解决方案,不仅可减少医疗服务不平等问题,还可以避免小型诊所在医疗 AI 革命中越来越落后。
ML-LHS 的概念很有前景,但也面临着巨大的挑战。由于 LHS 同时开展系统层面的研究和临床实践,它对初始 ML 模型的要求明显更高,大多数报道的基于 EHR 数据的 ML 模型可能无法满足这样的 LHS 要求。此外,由于患者数据出于隐私原因无法公开共享,能开放获取的 ML-LHS 研发所需的患者数据集极为不足,开发者缺乏数据的问题严重限制了在新兴 LHS 领域广泛开展机器学习研究的可能性。
自从 2012 年 第一届全美智能医学系统峰会 以来(我有幸受邀参加),几乎没有看到医院临床流程实施和运营 ML- LHS 的文献报告,我期望看到的报告应该展现几个关键的 LHS 特征,包括自动数据收集、连续机器学习、新知识和最佳实践的快速传播等。尽管一些研究已经报告了应用 LHS 概念在医院服务流程中改善质量的成功案例,但这些实例并未采用电子病历数据进行持续机器学习 (Bravata 2020, Horwitz 2019),因此它们不属于 ML-LHS 一类的。
非常可惜,仍未见严格意义的 ML-LHS 原创文献报道。
- 实例:加州大学圣地亚哥分校医疗系统 LHS
UCSD El-Kareh 等在 LHS 杂志描述了加州大学圣地亚哥分校医疗系统的 LHS 现状 (El-Kareh 2022),其要点是:
(期待更多成功 LHS 案例……)
由于 LHS 面临的挑战和进展缓慢,国际 LHS 社区 (global LHS community) 需要找到新途径来促进 ML-LHS 的研究和实施。
上述 LHS 模拟研究就是一个新尝试,试图用合成数据帮助医院或其他医疗机构更容易开始 ML-LHS 的研究探索。参照肺癌风险预测 ML-LHS 模拟的流程,华西医院 LHS 团队和桂林医学院附属医院的临床团队对研究人员和学生进行培训,然后使用真实病历数据快速研发出几种疾病的风险预测 ML 模型。该团队正在创建临床研究网络,以实施可提高疾病早期筛查和诊断的 ML-LHS。
根据合成数据模拟对加速医院启动 ML-LHS 研究项目的初步影响,我在这里提出一个新的加速 LHS 研究的策略,即“合成+真实”策略。它将构建 ML-LHS 的艰巨任务分解为两个阶段:
促进 ML-LHS 领域的发展需要成功案例,证明 ML-LHS 确实能为患者和医院带来益处和价值。如果您正在开展 ML-LHS 项目,可以通过 Learning Health Community的 LHS 技术论坛计划与我们联系。我们正在联系全球 LHS 社区的专家,收集 LHS 项目实例,了解 LHS 研究和实施面临的挑战,并组织国际 LHS 技术论坛,让产业界和学术界的创新者汇聚在一起,开展对话或合作。LHS 技术论坛计划的网页展示了论坛信息、LHS 资源和发表论文,还有成功 ML-LHS 案例。本指南也将分享更多 ML-LHS 实例。
在以下章节中,我将提供更多有关医疗健康数据、合成患者数据、数据驱动的机器学习等 ML-LHS 所需关键技术的详细信息。
NAM 2010 研讨会总结报告《临床数据作为医疗系统学习进步的要素 —— 创造和保护一项公共利益》回顾了电子病历在知识产生中的整合和使用。报告讨论了为了调查前沿数据挖掘技术所作的努力,这些技术旨在生成有关医疗健康服务和研究的证据。
项目示例:癌症生物医学信息网格 (caBIG):连接多各生物医学研究和临床试验的参与系统,为癌症研究社区提供共享数据。
NAM 2013 研讨会总结报告《支持健康和医疗系统持续学习的数据改进的重要性》探讨了数据质量问题以及为知识产生而提高数字健康数据采集和应用的核心战略。
健康数据收集和共享的增加正迅速将医疗系统带入“大数据”时代。数字健康数据在各种不同的环境中产生:
尽管大量健康及健康相关数据的收集有望支持医疗系统大规模和多类型的学习,但仅是数据还不够,还必需共享、整合、分析以及持续管理和提升这些数据,才能实现向持续学习的智能医学系统转型。
以 MIMIC-IV 医院数据 为例,信息包括:
电子病历的患者数据必须得到隐私和安全的保护。尽管这意味着放慢研发速度,但我们使用患者数据必须遵守当地法律并符合产业标准 (McGraw 2021) 。
适当开放共享部分脱敏的患者健康数据也很必要,因而有少数医疗机构开放了少量数据,这类开放数据要求使用者申请,被授权后才可得到脱敏患者数据。
共享 EHR 数据:
MIMIC-IV 是一个数据库,包含美国马萨诸塞州波士顿的一个三级教学医疗中心收治的患者的真实住院数据。每位患者的综合信息有:实验室数据、用药情况、生命体征记录等。该数据库旨在支持广泛的医疗服务研究。
MIMIC-III(重症病房数据集 III)是一个免费的大型数据库,包含 2001-2012 年间“贝斯以色列女执事医疗中心”重症监护病房的四万多名患者的脱敏健康数据。该数据库包括个人数据、床旁生命体征数值(每小时 1 个数据点)、实验室数据、手术、药物、护理人员记录、影像报告和死亡率(院内及院外)等信息。
CPRD 是一项真实世界临床数据的研究服务,支持回顾性和前瞻性的公共卫生和临床研究。CPRD 从全英国的全科医师服务网络收集匿名患者数据,涵盖 6,000 万患者,其中包括 1,600 万当前登记在册的患者。
PhysioNet Resource 的任务是开展和促进生物医学研究和教育,其中包括免费提供大规模生理和临床数据,以及相关开源软件。
临床研究数据共享:
政府和其他健康数据来源:
由于真实患者数据受到保护,为医疗系统研究和开发提供合成患者数据变得至关重要。完全从公开数据合成的患者数据应该不存在任何隐私问题。例如,Synthea 合成患者数据是根据公共数据合成的,因此最近被广泛用于研发和测试新的医疗服务信息流程。
Synthea 是一个开源的产生合成患者数据的软件,通过模拟虚构患者的病史,它可产生高质量、合成的、逼真但不真实的患者数据,而不受成本、隐私和安全性的限制。它使需要患者数据但却不能合法或实际取得数据的研究得以进行 (Walonoski 2018) 。
Synthea 软件源代码 在 GitHub 上的 Synthea 项目网页。按照软件说明,您可以自己运行 Synthea 软件合成患者数据。更多信息见 Synthea wiki 。
Synthea 系统采用基于代理的方法产生合成患者病历记录。每个合成患者都是独立生成的,从出生到死亡的过程中经历各种模块化表达的疾病或健康状况。每个患者都使用系统的所有疾病模块。
Synthea 疾病模块基于 通用模块框架,该框架使用一组预定义的状态、转换和条件逻辑,创建代表常见疾病的进展和诊疗标准的状态机 (state machines) 。模块是根据公开可用的健康数据构建的,包括疾病发病率和患病率统计数据,以及临床服务指南。
Synthea 目前有 90 多个不同的疾病模块,每个模块都模拟一种疾病或健康状态。模块构建工具页面列出了当前支持的所有疾病模块。模块库只列出一些常用疾病模块。
表格:Synthea 覆盖的最常见疾病和健康状况
| 患者看全科医生 (PCP) 的前十位原因 | 致死的前十位疾病和健康状况 |
|---|---|
| 婴幼儿定期健康检查 | 缺血性心脏病 |
| 原发性高血压 | 肺癌 |
| 糖尿病 | 阿尔茨海默病 |
| 正常妊娠 | 慢性阻塞性肺病 |
| 呼吸道感染(咽炎、支气管炎、鼻窦炎) | 脑血管疾病 |
| 一般成人体检 | 交通事故受伤 |
| 类脂代谢障碍 | 自残 |
| 耳部感染(中耳炎) | 糖尿病 |
| 哮喘 | 结直肠癌 |
| 尿路感染 | 药物使用障碍(仅限于大麻类控制药物) |
Synthea 的模块设计很巧妙,您可以添加新模块来涵盖您感兴趣但 Synthea 软件尚未包含的疾病或健康状况。详情见以下功能页面:
Synthea 患者病历格式有标准的 FHIR 格式或简单的 CSV 格式。为了更方便地查看不同专项记录中的数据元素,请参阅 病历CSV文档列表 和每个文档中的数据字段。
表格:Synthea 患者病历文件
| 病历文档 | 解释 |
|---|---|
| allergies.csv | 患者过敏数据 |
| careplans.csv | 患者健康计划数据,包括目标 |
| claims.csv | 患者医保账单数据 |
| claims_transactions.csv | 患者医保账单项目明细数据 |
| conditions.csv | 患者诊断或健康状况 |
| devices.csv | 患者携带的永久性和半永久性医疗器械 |
| encounters.csv | 患者就诊数据 |
| imaging_studies.csv | 患者影像元数据 |
| immunizations.csv | 患者免疫接种数据 |
| medications.csv | 患者用药数据 |
| observations.csv | 患者观察结果数据,包括生命体征和实验室报告 |
| organizations.csv | 医院等医疗机构 |
| patients.csv | 患者个人数据 |
| payer_transitions.csv | 付费明细数据(即健康保险付费) |
| payers.csv | 支付机构数据 |
| procedures.csv | 手术等医疗流程数据 |
| providers.csv | 提供医疗服务的临床医生 |
| supplies.csv | 医用品数据 |
请参阅 Synthea 患者数据的外部验证研究文献 (Chen 2019)。
Synthea 软件开发者 Mitre Corp(非营利机构)开放一个 100 万 Synthea 合成患者病历数据集,可从其 网站下载。Synthea 数据也可从 FHIR API 获取。
开放 LHS 项目在 GitHub 上启动了一个 “开放合成患者数据项目”,开放了以上 ML-LHS 模拟研究所用的肺癌和脑梗合成患者数据。因为数据量大,全部开放的合成患者数据发布在哈佛大学数据空间 (Dataverse) 上的 “机器学习用合成患者数据空间”。开放 LHS 项目今后陆续会在哈佛数据空间分享更多的合成患者数据。任何人可下载数据,无需申请。
MDClone 平台从真实患者队列数据产生完全合成的患者数据集,而没有暴露患者隐私的危险,并且能够安全地共享数据。MDClone 合成数据是不可逆的、人工合成的数据,它复制了真实世界原始数据的统计学特征和相关性。合成数据利用了关注的离散和非离散变量,使用了统计方法产生全新的数据集,因而不包含可识别真实患者身份的信息。例如,NIH N3C 项目使用 MDClone 从新冠患者数据生成了合成数据集,用于更广泛的研究。
英国的临床实践研究数据链 (CPRD) 使用全科医疗服务的患者数据产生高保真合成数据集,在复制了真实全科患者数据中的复杂临床关系的同时保护了患者隐私。CPRD 合成数据 可以代替真实患者数据,用于复杂的统计分析以及机器学习和人工智能研究应用。通过将异常值分析与图形建模和重采样相结合,CPRD 的方法可以产生合成数据集。在推断机器学习分类器时,合成数据在特征分布、特征依赖性和敏感性分析的统计结果方面与原始真实数据不存在显著差异。 CPRD 合成数据集可用于训练目的或改进算法或机器学习流程 (Tucker 2020) 。
基于来自 NCI 监测流行病学和最终结果 (SEER) 项目的公开癌症登记数据,Goncalves 等人生成并评估了合成癌症患者数据 (Goncalves 2020)。 他们比较了现有的产生合成电子病历的几种方法,每种方法的流程如下:给定一组隐私和真实的 EHR 样本,拟合模型,然后用模型生成新的合成 EHR 样本。结果发现,多项式乘积混合 (MPoM) 方法和分类潜在高斯过程 (CLGP) 方法可以提供具有以下两个特征的合成 EHR 样本:(1)合成数据与隐私真实数据的统计学特性相当,(2)模型的隐私信息泄露并不显著。
Synthea 患者数据属于符合现实但并不是真实的数据。事实证明,Synthea 数据在开发和测试 ML 方法或流程方面很有用,但 Synthea 和真实患者数据之间的差异决定了 ML 模型的适用范围。Synthea 数据存在多种局限性,包括:疾病种类有限,一些数据偏向于特定患者人群,以及一些健康因素缺失,比如症状。由于这些差异,任何从合成数据构建的 ML 模型都不能用于实际临床服务。
【资料来源:NAM 2019 特别人工智能报告】
NAM 2019 特别报告《医疗服务人工智能:希望、炒作、前途和危险》列出了当前和短期内的人工智能解决方案;强调 AI 在研发、应用和维护方面的挑战、局限和最佳实践;概述了为医疗应用设计的人工智能工具相关的法律和监管环境;优先考虑医疗人工智能对公平、包容和人权的需求;并提出向前推进的关键考虑因素 (NAM 2019,Matheny 2020) 。详情见网络研讨会 视频。
人工智能最早在 1950 年代提出并经历了两次“AI 寒冬”。 此次人工智能兴起,大约从 2010 年左右开始,得益于机器学习和数据科技的成功,以及计算存储和能力的显著增加。它推动了像谷歌、亚马逊和苹果等大型消费企业的发展。除了梯度提升、随机森林、支持向量机、人工神经网络等常见的机器学习技术外,基于各种神经网络的深度学习系统也将人工智能发展推向了新的高度。
人工智能有望在医疗健康领域取得变革性甚至颠覆性的进展。下表列出 NAM 报告中提到的机器学习在医疗健康领域的一些应用。
表格:机器学习的一些医疗健康服务应用
| 用户组 | 医疗健康服务应用 |
|---|---|
| 患者及家属 | 健康状况监测 |
| 患者及家属 | 疾病风险评估 |
| 患者及家属 | 疾病预防与管理 |
| 临床医生护理团队 | 早期检测、预测和诊断工具 |
| 临床医生护理团队 | 精准医疗和个性化医疗 |
| 公共卫生 | 发现高风险人群 |
| 公共卫生 | 人群健康 |
然而,在医疗服务中部署和使用 AI 的例子很少,并且鲜有证据表明部署 AI 工具后日常医疗服务结果得到了改善。例如,在机器学习风险预测模型研究邻域,有大量关于模型研发和验证的文献,但只有稀少文献数据描述这些模型在医疗临床服务中成功部署和日常应用,对比鲜明!
尽管如此,该报告描述了一个医疗服务系统和医院对临床 AI 应用进行评估、决策和采用的框架。它强调医疗人工智能应该在LHS智能医学系统的框架下部署和应用。 针对 NAM 2013《低成本的最佳医疗服务》报告中概述的十个推荐领域,它还描绘了该如何在 LHS 系统中考虑每个领域的人工智能问题。
【我的解读】
- 由于 LHS 将研究嵌入到医疗服务中,我们必须把 ML 模型的部署环节设计为医疗系统的有机组成部分。我认为这一要求和通常的ML和AI研究有本质区别,但是和 LHS 的要求是一致的。因此,部署越多 LHS,ML 和 AI 在医疗服务环境中部署和应用也将增加越多。
现有的 ML/AI 研究通常缺乏以数据为中心的焦点。然而,近来人们认识到,以数据为中心的 ML/AI 与以模型为中心的 ML/AI 同样重要。
在以模型为中心的 ML 开发中,数据集通常是固定的,重点在于迭代模型架构或优化训练,以提高模型性能。
与此相反,以数据为中心的 ML 专注于系统方法,以评估、整合、清理和注释用于训练和测试 AI 模型的数据,这个流程有可能采用“交钥匙”模型构建器。
斯坦福大学研究人员在《自然机器智能》 (Nature Machine Intelligence) 杂志发表的最新论文讨论了为数据驱动的 AI 建立数据流的最新进展、最佳实践和相关资源 (Liang 2022)。这篇论文源自斯坦福 HAI中心举办的数据驱动 AI 研讨会(详见 报告回放录像)。
在《麻省理工学院管理》杂志 2022 年的采访中,吴恩达博士描述了为什么现在已经是时候侧重 数据驱动AI 的研究和应用了。如需了解他清晰的问题陈述和建议的解决方案,可观看吴博士关于以数据为中心 AI 的线上报告。您还可以在 https://datacentricai.org/ 加入由吴博士推动的数据驱动 AI 运动。
我认为 LHS 本质上是一种以数据为中心的 (data-centric) ML 方法,这是由 LHS 的学习循环特征决定的。同时,LHS 还是以部署为导向的 (deployment-oriented) AI 策略。为解决医学知识的系统学习和传播问题,NAM 专家组在重新设计未来 LHS 智能医疗系统时已确认数据驱动和部署导向这两个必要特征,并提出 LHS 框架,把临床研究嵌入临床服务流程中,有机地结合数据驱动和部署导向。可见,这些年 LHS 的有关 ML 和 AI 策略的超前设计一直被忽略了,希望今后 LHS 社区能够把 LHS 的潜能发挥出来。
LHS = 医疗 AI 框架?
在 LHS 框架下,数据驱动与模型渠道并不互相排斥,而是互相补充。我在《自然科学报告》发表的模拟 ML-LHS 文章中提出,有必要在未来开展研究,探索结合以数据为中心和以算法为中心的两种方法的最佳策略。作为一般性建议,临床团队应当考虑首先使用ML基础模型开展数据驱动的学习循环,部署和运行起 ML-LHS,然后通过调整超参数或修改底层算法来进一步优化 ML 模型性能。
基于这个推理,我提出 ML-LHS 第 3 个新假设:
- ML-LHS AI 假设:因为 LHS 具有数据驱动和部署导向的特征,大部分基于电子病历数据的 AI 将以 LHS 形式更有效地实现和传播。
电子病历范围的机器学习 (EMR-wide ML) 指的是使用 EMR 中所有可得的健康因素和数据进行机器学习,这与仅限于使用少数预先选择的健康因素的传统建模不同。由于大量电子病历数据呈非结构化形式,因此全电子病历范围的机器学习通常使用自然语言处理 (NLP) 技术从文本中提取数据并进行标准化。
根据目标任务的不同,可以采用两大类机器学习算法来构建预测模型:
以下文献报道的研究是 EMR 范围 ML 代表性实例:
感谢韩若冰女士帮助翻译本指南。感谢 Joshua C. Rubin, JD, MBA, MPH, MPP 审阅和编辑本指南。特别感谢美国医学科学院发表 LHS 系列报告,如果没有他们开创性的研究,就不可能有 LHS 的方向。感谢所有引用的参考资料。
©2022-2023 陈安均,版权所有。