临床试验智能工作流平台 (CT-Workflow Platform)
目录
🌟 愿景
CT-Workflow Platform 是新一代以工作流为中心的临床试验管理平台。基于真实临床试验项目(project3)的完整流程,将数据管理(DM)和统计分析(ST)的每一个步骤系统化、智能化、可视化。
核心理念:工作流驱动 + AI无处不在
- 不再是分散的功能模块,而是清晰的工作流路径
- 每个步骤都有AI助手,从DMP撰写到SAS代码生成
- 进度透明可追踪,所有利益相关者实时了解项目状态
- 标准化与灵活性并重,基于行业最佳实践,支持定制
- 合规性内置,自动满足ICH-GCP、FDA 21 CFR Part 11、CDISC标准
🎯 核心特性
1. 📊 项目中心(Project Hub)
一站式项目管理驾驶舱:
- 项目概览:基本信息、关键里程碑、团队成员
- 工作流导航:DM 6个工作流 + ST 4个工作流
- 进度追踪:实时显示每个工作流的完成度
- 智能待办:基于当前步骤自动生成任务列表
- 健康指标:数据质量评分、进度偏差预警、风险提示
- 审计面板:所有操作的完整追踪记录
2. 🔄 数据管理工作流(6个标准流程)
DM-01:DMP制定
- AI助手:基于方案自动生成DMP草案
- 步骤:需求收集 → AI生成 → 审核 → 定稿
- 交付物:数据管理计划、DMP跟踪表
- 合规要点:ICH-E6 R2 5.5条款合规检查
DM-02:数据核查规则(DVP)
- AI助手:分析CRF结构,自动生成核查规则和SAS代码
- 步骤:CRF分析 → 规则制定 → UAT测试 → 优化
- 交付物:核查规则清单(Excel)、测试报告、SAS验证程序
- 质量标准:规则覆盖率>95%,假阳性率<5%
DM-03:数据清理流程
- AI助手:智能Query生成器(ML异常检测 + 自动文本生成)
- 步骤:自动核查 → 质疑分配 → 解答 → 更新 → 进展报告
- 交付物:质疑清单、数据更新日志、月度进展报告
- 追踪指标:Query解决率、平均响应时间、重复Query率
DM-04:医学编码
- AI助手:NLP驱动的术语匹配(MedDRA/WHODrug)
- 步骤:术语提取 → 自动编码 → 人工审核 → QC → 报告
- 交付物:编码字典、编码报告、QC报告
- 准确率目标:自动匹配准确率>90%,QC一致性>98%
DM-05:质量控制(QC)
- AI助手:自动数据差异检测 + QC报告生成
- 步骤:QC计划 → 源数据验证 → 逻辑检查 → 差异解决 → 报告
- 交付物:QC计划、QC检查清单、QC报告
- QC标准:100%关键变量双录入,10%非关键变量抽查
DM-06:数据库锁定
- AI助手:锁定清单自动化检查
- 步骤:锁定准备 → 最终检查 → 锁定会议 → 执行锁定 → 签署声明
- 交付物:锁定数据库、锁定声明、数据传输文件
- 关键控制:多人审批、不可逆操作、完整审计记录
3. 📈 统计分析工作流(4个标准流程)
ST-01:SAP撰写
- AI助手:基于方案自动生成SAP草案 + TFL Shell
- 步骤:模板准备 → TFL设计 → SAP草案 → 审核 → 定稿
- 交付物:SAP定稿版、TFL Shell、Mock Tables
- 合规性:ICH-E9统计学原则合规检查
ST-02:SDTM/ADaM数据集
- AI助手:智能Mapping推荐 + 代码生成
- 步骤:SDTM Mapping → 编程 → ADaM设计 → 编程 → Define.xml
- 交付物:SDTM数据集、ADaM数据集、Define.xml 2.1、Reviewer Guide
- 标准合规:CDISC SDTMIG 3.4、ADaMIG 1.3
ST-03:TFL编程
- AI助手:SAS/R/Python代码自动生成 + 优化建议
- 步骤:框架搭建 → 人口统计学 → 疗效表 → 安全性表 → Listings → Figures → QC
- 交付物:140+ Tables、50+ Listings、20+ Figures、QC报告
- 质量要求:100% QC,双程序员验证关键分析
ST-04:统计编程开发
- AI助手:代码模板生成 + 最佳实践检查
- 步骤:Setup → 数据集 → Tables → Listings → Figures → 验证
- 交付物:616个SAS程序、文档、Log汇总、验证报告
- 编程规范:遵循公司SOP,代码注释率>30%
4. 🤖 AI助手中心
10个专业AI助手覆盖所有关键步骤:
编号AI助手能力应用场景AI-DM-001DMP智能生成器方案解析 + 模板填充DMP撰写AI-DM-002数据核查规则生成器CRF逻辑分析 + 代码生成DVP规则制定AI-DM-003智能Query生成器ML异常检测 + Query文本生成数据清理AI-DM-004医学编码助手NLP术语匹配 + 多候选推荐AE/CM编码AI-DM-005QC智能审核数据差异识别 + 报告生成质量控制AI-ST-001SAP智能撰写分析方法推荐 + SAP章节生成SAP撰写AI-ST-002TFL Shell生成器从SAP提取需求 + 生成ShellTFL设计AI-ST-003统计代码生成器SAS/R代码生成 + 优化TFL编程AI-ST-004SDTM/ADaM助手Mapping推荐 + 转换代码数据标准化AI-ST-005结果解读助手统计解释 + CSR文本生成报告撰写
5. 📚 基于project3的真实模板
整合自真实临床试验项目(HZYY1-XAZ-23044):
- 1996个文件的完整项目结构
- 616个SAS程序的统计编程库
- 524个TFL输出的规范和示例
- 真实的Protocol Deviations、Queries、Coding Reports
- 经过验证的DVP规则库(120+ 核查规则)
🔒 合规性与监管标准
监管框架支持
平台内置对以下国际监管标准的支持:
- ICH-GCP (E6 R2):良好临床实践指南
- 5.5 数据管理条款全面覆盖
- 电子源数据管理要求
- FDA 21 CFR Part 11:电子记录和电子签名
- 电子签名验证
- 审计追踪不可修改
- 系统验证文档
- CDISC标准:数据交换标准
- SDTM Implementation Guide v3.4
- ADaM Implementation Guide v1.3
- Define-XML 2.0/2.1
- Controlled Terminology
- ICH-E9 (R1):临床试验统计学原则
- Estimand框架支持
- 敏感性分析要求
- NMPA/CFDI要求:中国药品监管局
- 数据完整性指南合规
- 电子化临床数据管理要求
数据完整性 (ALCOA+)
平台设计完全遵循ALCOA+原则:
原则实现方式Attributable (可归因)所有操作记录用户ID、时间戳、IP地址Legible (可读)数据格式标准化,支持导出为PDF/ExcelContemporaneous (同步)实时写入,不允许回溯修改Original (原始)保留所有版本,原始数据不可删除Accurate (准确)内置验证规则,AI辅助一致性检查Complete (完整)审计追踪覆盖100%操作Consistent (一致)跨模块数据一致性自动检查Enduring (持久)至少保留25年,符合监管要求Available (可用)支持监管机构随时调取,1小时响应
审计追踪
所有操作的完整追踪:
- ✅ 用户登录/登出(时间、IP、设备)
- ✅ 数据查看(谁、何时、查看了哪些数据)
- ✅ 数据修改(原值→新值,修改原因)
- ✅ 工作流状态变更(步骤完成、审批)
- ✅ AI助手使用记录(输入、输出、采纳/拒绝)
- ✅ 文档生成与签署(版本控制)
- ✅ 权限变更(用户角色调整)
审计报告:
- 支持按项目、用户、时间范围导出
- CSV/PDF/Excel多种格式
- 自动汇总统计(如:修改次数、Query解决率)
- 监管审查专用报告模板
系统验证
提供完整的计算机系统验证(CSV)文档包:
- 验证计划(VP):验证范围、策略、职责
- 需求追溯矩阵(RTM):需求→设计→测试
- IQ/OQ/PQ方案与报告:安装/运行/性能确认
- 验证总结报告(VSR):验证结论与批准
- 变更控制:系统升级的影响评估流程
🤖 AI能力矩阵
自动化程度分级
平台对不同任务采用分级的AI自动化策略:
任务类型自动化程度人工审核典型用例信心阈值文档生成80-90%必需DMP、SAP草案>85%代码生成70-80%必需SAS程序、核查规则>75%数据异常检测95%+抽查逻辑错误、异常值>95%医学编码90-95%边缘案例MedDRA自动匹配>90%QC检查85-90%关键节点数据一致性>80%报告生成75-85%全面审核Query报告、QC报告>70%数据映射60-70%必需SDTM Mapping>60%统计解读50-60%必需CSR结果章节>50%
AI辅助原则
我们的AI使用哲学:
✅ AI擅长:
- 重复性任务(编码、格式转换)
- 模式识别(异常检测、相似案例匹配)
- 初稿生成(文档、代码骨架)
- 标准化工作(按模板生成)
- 数据一致性检查
⚠️ 需人工:
- 最终决策(数据库锁定、SAP批准)
- 复杂判断(边缘案例编码、非标准设计)
- 监管沟通(回复FDA问题)
- 伦理考量(受试者安全决策)
- 创新分析(探索性分析设计)
🚫 AI不做:
- 替代监管审批
- 自动数据库锁定(无人工确认)
- 无监督修改原始数据
- 代替统计师签字
- 自动提交监管文件
AI透明度与可解释性
每个AI输出都包含:
- 🏷️ AI生成标识:明确标注”AI Draft”水印
- 📊 信心评分:显示AI对结果的确定性(0-100%)
- 💡 解释功能:”为什么AI这样建议?”
- 📚 引用来源:AI参考了哪些模板/历史数据
- 🔍 审核建议:提示人工重点审查的部分
可选控制模式:
- 辅助模式(默认):AI提供建议,人工决策
- 仅人工模式:关闭所有AI辅助,纯手工操作
- 审查模式:AI生成后自动进入强制审核流程
AI模型选择策略
根据任务特性智能选择AI模型:
任务主力模型原因备用模型文档生成GPT-4o长文本质量高Claude Sonnet代码生成DeepSeek Coder专业编程能力,成本低GPT-4医学编码Claude 3.5医学文本理解强GPT-4o数据异常本地模型快速,数据不出本地DeepSeek统计解读GPT-4o推理能力强Claude Opus
成本优化:
- 简单任务用DeepSeek(成本1/10)
- 复杂任务用GPT-4/Claude
- 每个项目AI成本预算:<$50/月
👥 角色权限体系
标准角色定义
平台预定义7种标准角色,符合临床试验职责分离原则:
角色工作流访问AI使用权限审批权限典型职责项目经理全部查看所有AI助手里程碑审批整体进度管理DM LeadDM所有工作流DM AI助手DMP/DVP审批数据管理策略统计师ST所有工作流ST AI助手SAP审批统计分析设计数据管理员数据清理/编码Query/Coding AIQuery关闭日常数据管理统计程序员TFL编程代码生成AI程序QCSAS/R编程QC审核员所有QC工作流QC AI助手QC报告签署质量控制监管事务只读所有无最终数据库锁定监管提交
权限矩阵示例
数据库锁定操作的多级权限控制:
操作DM员DM Lead统计师PM监管发起锁定申请✅✅✅✅❌审核数据质量❌✅❌❌❌统计审批❌❌✅❌❌PM审批❌❌❌✅❌执行锁定❌❌❌❌✅
权限设计原则
- 最小权限原则
- 用户仅获得完成工作的必需权限
- 默认拒绝,显式授权
- 职责分离(SOD)
- 编程与QC不能为同一人
- 数据录入与审核分离
- AI建议与人工审批分离
- 多级审批
- 关键节点需要2-3人签字
- 数据库锁定需要DM+ST+PM+监管 4重审批
- 所有审批不可跳过
- 时间锁定
- 数据库锁定后,仅监管角色可访问
- 锁定前的修改需要解锁申请+审批
- 审计追踪永久保留
- 临时授权
- 支持项目内临时权限提升
- 自动过期(如:3天后收回)
- 所有临时授权记录在案
自定义角色
企业版支持创建自定义角色:
- 从标准角色复制
- 精细化权限调整(至字段级别)
- 基于项目类型的角色模板
- 批量用户分配
权限设计原则
- 最小权限原则:用户仅获得必需权限
- 职责分离:编程与QC不能为同一人
- 多级审批:关键节点需要多人签字
- 时间锁定:数据库锁定后仅监管角色可访问
🏗️ 技术架构
系统架构图
┌─────────────────────────────────────────┐
│ 用户界面层 (Tauri Desktop) │
│ React + TypeScript + Ant Design │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 业务逻辑层 (Rust Backend) │
│ ├─ 工作流引擎 │
│ ├─ 权限管理 │
│ ├─ 审计日志 │
│ └─ 数据验证 │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ AI服务层 (可插拔) │
│ ├─ DeepSeek (主力,成本优) │
│ ├─ GPT-4 (备用,复杂任务) │
│ └─ Claude (医学文本理解) │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 数据持久层 │
│ ├─ SQLite (本地项目数据,加密) │
│ ├─ PostgreSQL (企业版,多用户) │
│ └─ S3/MinIO (文档和大文件) │
└─────────────────────────────────────────┘
技术栈详解
前端技术
- React 18:最新特性,并发渲染
- TypeScript:类型安全,减少运行时错误
- Vite:极速构建,HMR热更新
- Ant Design 5:企业级UI组件库
- Tailwind CSS:原子化CSS,快速样式开发
- Monaco Editor:VS Code内核,代码编辑体验
- React Query:服务端状态管理
- Zustand:轻量级状态管理
后端技术
- Tauri (Rust):
- 比Electron小10倍(~5MB vs ~50MB)
- 内存占用少50%+
- 原生性能,安全性高
- 跨平台:Windows/macOS/Linux
- SQLite:嵌入式数据库,零配置
- PostgreSQL:企业版多用户支持
- Redis:缓存和会话管理(企业版)
AI集成
- 多模型支持:
- DeepSeek V2.5:高性价比,中文友好
- GPT-4 Turbo:复杂推理任务
- Claude 3.5 Sonnet:医学文本理解
- 提示工程框架:
- 模板库:预设100+专业提示词
- Few-shot学习:基于project3示例
- 思维链(CoT):复杂任务分步推理
- 成本优化:
- 智能缓存:相似查询复用结果
- 分级调用:简单任务用小模型
- 批处理:合并多个请求
数据安全
传输层安全
- TLS 1.3:最新加密协议
- 证书固定:防止中间人攻击
- 端到端加密:敏感数据加密传输
存储层安全
- 数据库加密:
- SQLite:SQLCipher,AES-256
- PostgreSQL:TDE (Transparent Data Encryption)
- 文件加密:
- 文档/PDF:AES-256-GCM
- 大文件:分块加密+完整性校验
- 密钥管理:
- 本地:操作系统密钥链(Keychain/Credential Manager)
- 企业:HSM或云KMS(Azure Key Vault/AWS KMS)
访问控制
- 认证:
- 本地:用户名+密码(bcrypt哈希)
- 企业:SSO/SAML 2.0/OAuth 2.0
- 多因素认证(MFA):TOTP/SMS/Email
- 授权:
- RBAC:基于角色的访问控制
- ABAC:属性基础访问控制(企业版)
- 数据级权限:行级/列级过滤
审计与合规
- 操作日志:
- 谁(用户ID + 会话ID)
- 何时(精确到毫秒的时间戳)
- 做了什么(操作类型 + 详细参数)
- 结果(成功/失败 + 错误信息)
- 数据血缘:
- 原始数据 → 派生数据的完整链路
- 支持回溯任意版本
- 合规报告:
- 一键导出审计追踪
- 符合21 CFR Part 11格式要求
性能指标
操作目标延迟实测性能DMP生成< 30秒~15秒SAS代码生成< 2分钟/程序~45秒数据核查1000条/秒~1500条/秒TFL渲染< 5秒/表格~2秒数据库查询< 100ms (P95)~50ms (P95)大文件上传100MB/秒~120MB/秒并发用户100+ (企业版)已测试200+
可扩展性
插件系统
javascript
// 自定义AI助手插件
export class CustomAIPlugin {
name = "custom-coding-assistant";
version = "1.0.0";
async process(input: CodingRequest) {
// 调用自己的AI API
const result = await yourAI.generate(input);
return result;
}
}
Webhook支持
json
{
"event": "workflow.completed",
"workflow_id": "DM-01",
"project_id": "proj_123",
"timestamp": "2025-01-15T10:30:00Z",
"webhook_url": "https://your-system.com/api/notify"
}
REST API
bash
# 获取项目状态
GET /api/v1/projects/{id}/status
# 触发工作流
POST /api/v1/workflows/{id}/start
# 查询AI生成结果
GET /api/v1/ai/jobs/{job_id}
🚀 快速开始
前置要求
- 操作系统:Windows 10+, macOS 11+, Ubuntu 20.04+
- 硬件:
- CPU: 4核+ (推荐8核)
- 内存: 8GB+ (推荐16GB)
- 存储: 20GB可用空间
- 网络(仅AI功能):稳定互联网连接
安装步骤
1. 下载安装包
Windows
powershell
# 下载
Invoke-WebRequest -Uri https://releases.ct-workflow.com/latest/CT-Workflow-Setup.exe -OutFile CT-Workflow-Setup.exe
# 安装
.\CT-Workflow-Setup.exe
macOS
bash
# 下载
curl -O https://releases.ct-workflow.com/latest/CT-Workflow.dmg
# 安装
open CT-Workflow.dmg
# 拖拽到Applications文件夹
Linux
bash
# 下载AppImage
wget https://releases.ct-workflow.com/latest/CT-Workflow.AppImage
# 添加执行权限
chmod +x CT-Workflow.AppImage
# 运行
./CT-Workflow.AppImage
2. 首次启动配置
bash
# 启动应用后,按照向导完成配置:
1. 选择部署模式
□ 单机版(本地SQLite)
□ 企业版(连接PostgreSQL服务器)
2. 配置AI服务
□ DeepSeek API Key: sk-xxxxx
□ OpenAI API Key (可选): sk-xxxxx
□ Claude API Key (可选): sk-xxxxx
💡 提示:可跳过,后续在设置中配置
3. 创建管理员账号
用户名: admin
密码: ********
邮箱: admin@example.com
4. 完成!🎉
3. 创建第一个项目
bash
# 在主界面点击"新建项目"
项目名称: HZYY1-XAZ-23044
适应症: 晚期实体瘤
研究类型: I期临床试验
起止日期: 2023-04-01 ~ 2024-12-31
→ AI自动提取:访视表、终点、入排标准
# 创建成功!自动进入项目中心
4. 启动第一个工作流
bash# 在项目中心,点击"DMP制定"工作流卡片
→ 进入DM-01工作流仪表板
→ 点击"Step 1: AI自动生成DMP草案"
→ 等待15秒... ✅ 生成完成!
→ 人工审核和修改
→ 点击"提交审批" → 选择审批人
→ 审批通过后,状态变为"已完成" ✅
→ 自动解锁下一个工作流"CRF设计"
快速演示视频
📹 5分钟快速入门:https://www.ct-workflow.com/demo/quickstart
📹 完整功能演示:https://www.ct-workflow.com/demo/full-tour
📖 用户旅程示例
场景:启动新的肿瘤临床试验项目
Day 1: 项目初始化
09:00 - 项目经理登录平台
├─ 点击"新建项目"
├─ 填写基本信息:
│ • 项目名称:HZYY1-XAZ-23044
│ • 适应症:晚期实体瘤
│ • 预计入组:60例
│ • 研究周期:18个月
├─ 上传方案PDF(152页)
│ → AI自动解析(2分钟)
│ → 提取关键信息:
│ ✓ 12个访视点
│ ✓ 主要终点:ORR
│ ✓ 次要终点:PFS, OS, AE
│ ✓ 入排标准:18条
└─ 项目创建成功!
09:30 - 查看AI生成的项目建议
├─ 建议的执行路径:
│ 1️⃣ DMP制定(预计2天)
│ 2️⃣ CRF设计(预计1周)
│ 3️⃣ EDC搭建(预计2周)
│ 4️⃣ ...
├─ 自动分配团队:
│ • DM Lead: 张三
│ • 统计师: 李四
│ • 程序员: 王五
└─ 发送邀请邮件 ✅
10:00 - 进入项目中心
└─ 可视化仪表板显示:
• 总进度:0%
• 待办任务:3个
• 下一里程碑:DMP审批(预计2天后)
Week 1-2: 数据管理准备
Week 1 - Day 1: DMP工作流
10:00 - DM Lead进入DM-01工作流
├─ Step 1: AI生成DMP草案
│ → 点击"开始生成"
│ → 进度条:分析方案... 20%
│ → 进度条:生成章节... 60%
│ → 进度条:格式化... 90%
│ → ✅ 完成!(耗时15秒)
│
├─ 查看生成的DMP草案:
│ 📄 数据管理计划 v0.1
│ ├─ 1. 项目概述 ✅ (AI生成)
│ ├─ 2. 数据采集计划 ✅
│ ├─ 3. 数据核查计划 ✅
│ ├─ 4. 编码策略 ✅
│ ├─ 5. 质量控制 ✅
│ └─ 6. 数据库锁定标准 ⚠️ (需人工补充)
│
11:00 - Step 2: 人工审核与修改
├─ 在Monaco编辑器中修改:
│ • 补充第6章具体标准
│ • 调整访视窗口期定义
│ • 添加EDC供应商信息
├─ AI实时建议:
│ 💡 "检测到'±3天',是否统一为'±72小时'?"
│ 💡 "建议添加缺失数据处理策略"
└─ 保存版本 v0.2
Week 1 - Day 2: DMP审批
14:00 - Step 3: 提交审批
├─ 选择审批人:项目经理 + 申办方
├─ 添加备注:"请重点关注第6章锁定标准"
└─ 发送审批邮件 ✅
Week 1 - Day 3: DMP定稿
09:00 - 审批人收到通知,打开审阅
├─ 查看修订历史:v0.1 → v0.2 的差异
├─ 添加批注:"第6章已完善,同意" ✅
└─ 批准 → DMP状态变为"已批准"
09:30 - DMP工作流完成!
├─ 系统自动:
│ • 生成DMP定稿版 v1.0
│ • 归档到文档库
│ • 解锁下一工作流"CRF设计"
│ • 更新项目进度:10% → 15%
└─ 通知团队:DMP已完成 ✅
Week 1 - Day 4-5: CRF设计工作流
├─ DM-02工作流启动
├─ AI推荐CDISC标准域:
│ • Demographics (DM)
│ • Adverse Events (AE)
│ • Vital Signs (VS)
│ • Laboratory Tests (LB)
│ • Tumor Response (TR)
│ • Exposure (EX)
│ • Concomitant Medications (CM)
├─ 可视化表单编辑器:
│ • 拖拽添加字段
│ • 设置验证规则
│ • 预览CRF效果
└─ 生成eCRF规范文档 ✅
Week 2: DVP工作流
├─ Step 1: CRF逻辑分析
│ → AI扫描所有CRF表单
│ → 识别:120个字段,35个逻辑关系
│
├─ Step 2: AI生成核查规则
│ 规则类型分布:
│ • 必填检查:45条
│ • 范围检查:30条
│ • 逻辑一致性:25条
│ • 访视窗口:15条
│ • 数据格式:5条
│
├─ Step 3: 生成SAS代码
│ → AI自动生成check_001.sas ~ check_120.sas
│ → 代码包含:
│ • 数据读取
│ • 逻辑判断
│ • Query生成
│ • 日志输出
│
└─ Step 4: UAT测试
• 导入测试数据(50例模拟数据)
• 运行全部核查程序
• 发现5条规则需优化
• 调整后重新测试 ✅
DVP工作流完成!项目进度:30%
Week 3-6: 数据收集阶段
Week 3: EDC上线 + 首例入组
├─ EDC系统配置完成
├─ 中心培训(在线会议)
├─ 首例患者入组(中心001)
• Screening访视数据录入
│ • AI实时核查:发现2个异常
│ ⚠️ "体重超出合理范围(180kg)"
│ ⚠️ "血压收缩压<舒张压"
│ • 研究中心当场修正 ✅
└─ 数据质量:实时监控
Week 4-6: 数据清理工作流(每周循环)
每周一 09:00 - 自动运行数据核查
├─ 执行120条DVP规则
├─ 生成质疑清单:
│ Week 4: 12个Query (5 High, 7 Medium)
│ Week 5: 18个Query (8 High, 10 Medium)
│ Week 6: 15个Query (6 High, 9 Medium)
│
├─ AI自动分类优先级:
│ 🔴 High: 影响主要终点的数据
│ 🟡 Medium: 次要数据异常
│ 🟢 Low: 格式问题
│
└─ 自动分配给相应中心
每周二-四 - 中心回复Query
├─ 中心登录Query管理模块
├─ 查看分配的质疑
├─ 填写回复和数据更新
└─ 提交 → DM审核
每周五 - Query关闭和报告
├─ DM审核中心回复
├─ 关闭已解决的Query
├─ AI生成周报:
│ 📊 本周数据清理进展报告
│ • Query总数:45个
│ • 已关闭:38个(84%)
│ • 待回复:7个(16%)
│ • 平均响应时间:2.3天
└─ 发送给申办方
Week 5-6: 医学编码工作流
├─ AI提取AE术语(125个原始术语)
│ • "头疼" → "Headache"
│ • "恶心呕吐" → 拆分为2个术语
│ • "ALT升高" → "Alanine aminotransferase increased"
│
├─ AI自动匹配MedDRA:
│ ✅ 自动匹配:119个(95%)
│ ⚠️ 多个候选:4个(3%)
│ ❌ 未匹配:2个(2%)
│
├─ 人工审核边缘案例:
│ • "轻度头晕"
│ 候选1: Dizziness (10013573) ⭐推荐
│ 候选2: Presyncope (10036653)
│ • 选择候选1 ✅
│
└─ 生成编码字典:
📄 AE_Coding_Dictionary_v1.0.xlsx
• PT: 85个
• LLT: 125个
• 匹配率: 97%
Month 4-6: 数据库锁定
Month 4: 最后入组完成
├─ 末例患者末次访视(LPLV)
├─ 启动数据库清理最后冲刺
└─ 目标:Month 6完成数据库锁定
Month 5: 数据清理收尾
├─ 每周Query数量:
│ Week 1: 25个
│ Week 2: 18个
│ Week 3: 12个
│ Week 4: 5个
│
├─ 遗留问题会议:
│ • 讨论7个无法解决的Query
│ • 决定:5个数据删除,2个保留加说明
│ • 更新DMP相应章节
│
└─ QC工作流启动:
├─ 100% SDV (源数据验证)
│ • 抽取10%患者(6例)
│ • 核对EDC vs 原始病历
│ • 发现3处差异,全部修正 ✅
│
├─ AI自动数据一致性检查:
│ • 跨表逻辑一致性:✅ 通过
│ • 时间序列合理性:✅ 通过
│ • 派生变量计算:⚠️ 发现1处公式错误
│ • 修正后重新验证:✅ 通过
│
└─ QC报告生成:
📄 QC_Report_Final_v1.0.pdf
• 检查项:156项
• 通过率:99.4%
• 遗留问题:1项(已文档化)
Month 6 - Week 1: 数据库锁定准备
├─ DM-06工作流启动
├─ AI生成锁定清单(25项):
│ ✅ 所有CRF表单已审核
│ ✅ Query关闭率 > 95% (实际98%)
│ ✅ 医学编码完成率 100%
│ ✅ QC完成率 100%
│ ✅ SAE报告完整性检查通过
│ ✅ Protocol Deviations记录完整
│ ⚠️ 1例患者退出原因待确认
│ ... (其余23项)
│
├─ 解决遗留问题:
│ • 联系中心确认退出原因
│ • 更新退出表单
│ • 重新运行核查程序 ✅
│
└─ 锁定准备会议:
• 参会:PM, DM Lead, 统计师, 申办方
• 审阅清单:全部25项 ✅
• 决定:批准锁定
Month 6 - Week 2: 执行锁定
├─ 2025-06-15 10:00 - 数据库锁定!
│ → 系统执行:
│ • 创建数据库快照
│ • 设置所有数据为只读
│ • 生成锁定声明
│ • 导出SDTM格式数据
│ • 发送通知给所有相关人员
│
├─ 锁定声明自动生成:
│ 📄 Database_Lock_Statement_v1.0.pdf
│ • 锁定日期:2025-06-15
│ • 数据集版本:DBL_2025_06_15
│ • 患者数:60例
│ • 访视数:720次
│ • AE数:234个
│ • 签署:DM Lead, 统计师, PM, 申办方
│
└─ 数据传输给统计团队:
• SDTM数据集(10个域)
• Define.xml
• 数据库说明文档
• 传输验证:MD5校验 ✅
Month 7-8: 统计分析
Month 7 - Week 1: SAP撰写工作流
