临床试验智能工作流平台 (CT-Workflow Platform)

目录

  1. 简介与愿景
  2. 核心特性
  3. 合规性与监管
  4. AI能力矩阵
  5. 角色权限体系
  6. 技术架构
  7. 快速开始
  8. 用户旅程
  9. 对比与优势
  10. 应用场景
  11. 预期成果
  12. 项目结构
  13. 实施与培训
  14. 常见问题
  15. 路线图
  16. 许可与支持

🌟 愿景

CT-Workflow Platform 是新一代以工作流为中心的临床试验管理平台。基于真实临床试验项目(project3)的完整流程,将数据管理(DM)和统计分析(ST)的每一个步骤系统化、智能化、可视化。

核心理念:工作流驱动 + AI无处不在

  • 不再是分散的功能模块,而是清晰的工作流路径
  • 每个步骤都有AI助手,从DMP撰写到SAS代码生成
  • 进度透明可追踪,所有利益相关者实时了解项目状态
  • 标准化与灵活性并重,基于行业最佳实践,支持定制
  • 合规性内置,自动满足ICH-GCP、FDA 21 CFR Part 11、CDISC标准

🎯 核心特性

1. 📊 项目中心(Project Hub)

一站式项目管理驾驶舱:

  • 项目概览:基本信息、关键里程碑、团队成员
  • 工作流导航:DM 6个工作流 + ST 4个工作流
  • 进度追踪:实时显示每个工作流的完成度
  • 智能待办:基于当前步骤自动生成任务列表
  • 健康指标:数据质量评分、进度偏差预警、风险提示
  • 审计面板:所有操作的完整追踪记录

2. 🔄 数据管理工作流(6个标准流程)

DM-01:DMP制定

  • AI助手:基于方案自动生成DMP草案
  • 步骤:需求收集 → AI生成 → 审核 → 定稿
  • 交付物:数据管理计划、DMP跟踪表
  • 合规要点:ICH-E6 R2 5.5条款合规检查

DM-02:数据核查规则(DVP)

  • AI助手:分析CRF结构,自动生成核查规则和SAS代码
  • 步骤:CRF分析 → 规则制定 → UAT测试 → 优化
  • 交付物:核查规则清单(Excel)、测试报告、SAS验证程序
  • 质量标准:规则覆盖率>95%,假阳性率<5%

DM-03:数据清理流程

  • AI助手:智能Query生成器(ML异常检测 + 自动文本生成)
  • 步骤:自动核查 → 质疑分配 → 解答 → 更新 → 进展报告
  • 交付物:质疑清单、数据更新日志、月度进展报告
  • 追踪指标:Query解决率、平均响应时间、重复Query率

DM-04:医学编码

  • AI助手:NLP驱动的术语匹配(MedDRA/WHODrug)
  • 步骤:术语提取 → 自动编码 → 人工审核 → QC → 报告
  • 交付物:编码字典、编码报告、QC报告
  • 准确率目标:自动匹配准确率>90%,QC一致性>98%

DM-05:质量控制(QC)

  • AI助手:自动数据差异检测 + QC报告生成
  • 步骤:QC计划 → 源数据验证 → 逻辑检查 → 差异解决 → 报告
  • 交付物:QC计划、QC检查清单、QC报告
  • QC标准:100%关键变量双录入,10%非关键变量抽查

DM-06:数据库锁定

  • AI助手:锁定清单自动化检查
  • 步骤:锁定准备 → 最终检查 → 锁定会议 → 执行锁定 → 签署声明
  • 交付物:锁定数据库、锁定声明、数据传输文件
  • 关键控制:多人审批、不可逆操作、完整审计记录

3. 📈 统计分析工作流(4个标准流程)

ST-01:SAP撰写

  • AI助手:基于方案自动生成SAP草案 + TFL Shell
  • 步骤:模板准备 → TFL设计 → SAP草案 → 审核 → 定稿
  • 交付物:SAP定稿版、TFL Shell、Mock Tables
  • 合规性:ICH-E9统计学原则合规检查

ST-02:SDTM/ADaM数据集

  • AI助手:智能Mapping推荐 + 代码生成
  • 步骤:SDTM Mapping → 编程 → ADaM设计 → 编程 → Define.xml
  • 交付物:SDTM数据集、ADaM数据集、Define.xml 2.1、Reviewer Guide
  • 标准合规:CDISC SDTMIG 3.4、ADaMIG 1.3

ST-03:TFL编程

  • AI助手:SAS/R/Python代码自动生成 + 优化建议
  • 步骤:框架搭建 → 人口统计学 → 疗效表 → 安全性表 → Listings → Figures → QC
  • 交付物:140+ Tables、50+ Listings、20+ Figures、QC报告
  • 质量要求:100% QC,双程序员验证关键分析

ST-04:统计编程开发

  • AI助手:代码模板生成 + 最佳实践检查
  • 步骤:Setup → 数据集 → Tables → Listings → Figures → 验证
  • 交付物:616个SAS程序、文档、Log汇总、验证报告
  • 编程规范:遵循公司SOP,代码注释率>30%

4. 🤖 AI助手中心

10个专业AI助手覆盖所有关键步骤:

编号AI助手能力应用场景AI-DM-001DMP智能生成器方案解析 + 模板填充DMP撰写AI-DM-002数据核查规则生成器CRF逻辑分析 + 代码生成DVP规则制定AI-DM-003智能Query生成器ML异常检测 + Query文本生成数据清理AI-DM-004医学编码助手NLP术语匹配 + 多候选推荐AE/CM编码AI-DM-005QC智能审核数据差异识别 + 报告生成质量控制AI-ST-001SAP智能撰写分析方法推荐 + SAP章节生成SAP撰写AI-ST-002TFL Shell生成器从SAP提取需求 + 生成ShellTFL设计AI-ST-003统计代码生成器SAS/R代码生成 + 优化TFL编程AI-ST-004SDTM/ADaM助手Mapping推荐 + 转换代码数据标准化AI-ST-005结果解读助手统计解释 + CSR文本生成报告撰写

5. 📚 基于project3的真实模板

整合自真实临床试验项目(HZYY1-XAZ-23044):

  • 1996个文件的完整项目结构
  • 616个SAS程序的统计编程库
  • 524个TFL输出的规范和示例
  • 真实的Protocol Deviations、Queries、Coding Reports
  • 经过验证的DVP规则库(120+ 核查规则)

🔒 合规性与监管标准

监管框架支持

平台内置对以下国际监管标准的支持:

  • ICH-GCP (E6 R2):良好临床实践指南
    • 5.5 数据管理条款全面覆盖
    • 电子源数据管理要求
  • FDA 21 CFR Part 11:电子记录和电子签名
    • 电子签名验证
    • 审计追踪不可修改
    • 系统验证文档
  • CDISC标准:数据交换标准
    • SDTM Implementation Guide v3.4
    • ADaM Implementation Guide v1.3
    • Define-XML 2.0/2.1
    • Controlled Terminology
  • ICH-E9 (R1):临床试验统计学原则
    • Estimand框架支持
    • 敏感性分析要求
  • NMPA/CFDI要求:中国药品监管局
    • 数据完整性指南合规
    • 电子化临床数据管理要求

数据完整性 (ALCOA+)

平台设计完全遵循ALCOA+原则:

原则实现方式Attributable (可归因)所有操作记录用户ID、时间戳、IP地址Legible (可读)数据格式标准化,支持导出为PDF/ExcelContemporaneous (同步)实时写入,不允许回溯修改Original (原始)保留所有版本,原始数据不可删除Accurate (准确)内置验证规则,AI辅助一致性检查Complete (完整)审计追踪覆盖100%操作Consistent (一致)跨模块数据一致性自动检查Enduring (持久)至少保留25年,符合监管要求Available (可用)支持监管机构随时调取,1小时响应

审计追踪

所有操作的完整追踪

  • ✅ 用户登录/登出(时间、IP、设备)
  • ✅ 数据查看(谁、何时、查看了哪些数据)
  • ✅ 数据修改(原值→新值,修改原因)
  • ✅ 工作流状态变更(步骤完成、审批)
  • ✅ AI助手使用记录(输入、输出、采纳/拒绝)
  • ✅ 文档生成与签署(版本控制)
  • ✅ 权限变更(用户角色调整)

审计报告

  • 支持按项目、用户、时间范围导出
  • CSV/PDF/Excel多种格式
  • 自动汇总统计(如:修改次数、Query解决率)
  • 监管审查专用报告模板

系统验证

提供完整的计算机系统验证(CSV)文档包:

  • 验证计划(VP):验证范围、策略、职责
  • 需求追溯矩阵(RTM):需求→设计→测试
  • IQ/OQ/PQ方案与报告:安装/运行/性能确认
  • 验证总结报告(VSR):验证结论与批准
  • 变更控制:系统升级的影响评估流程

🤖 AI能力矩阵

自动化程度分级

平台对不同任务采用分级的AI自动化策略:

任务类型自动化程度人工审核典型用例信心阈值文档生成80-90%必需DMP、SAP草案>85%代码生成70-80%必需SAS程序、核查规则>75%数据异常检测95%+抽查逻辑错误、异常值>95%医学编码90-95%边缘案例MedDRA自动匹配>90%QC检查85-90%关键节点数据一致性>80%报告生成75-85%全面审核Query报告、QC报告>70%数据映射60-70%必需SDTM Mapping>60%统计解读50-60%必需CSR结果章节>50%

AI辅助原则

我们的AI使用哲学

AI擅长

  • 重复性任务(编码、格式转换)
  • 模式识别(异常检测、相似案例匹配)
  • 初稿生成(文档、代码骨架)
  • 标准化工作(按模板生成)
  • 数据一致性检查

⚠️ 需人工

  • 最终决策(数据库锁定、SAP批准)
  • 复杂判断(边缘案例编码、非标准设计)
  • 监管沟通(回复FDA问题)
  • 伦理考量(受试者安全决策)
  • 创新分析(探索性分析设计)

🚫 AI不做

  • 替代监管审批
  • 自动数据库锁定(无人工确认)
  • 无监督修改原始数据
  • 代替统计师签字
  • 自动提交监管文件

AI透明度与可解释性

每个AI输出都包含

  • 🏷️ AI生成标识:明确标注”AI Draft”水印
  • 📊 信心评分:显示AI对结果的确定性(0-100%)
  • 💡 解释功能:”为什么AI这样建议?”
  • 📚 引用来源:AI参考了哪些模板/历史数据
  • 🔍 审核建议:提示人工重点审查的部分

可选控制模式

  • 辅助模式(默认):AI提供建议,人工决策
  • 仅人工模式:关闭所有AI辅助,纯手工操作
  • 审查模式:AI生成后自动进入强制审核流程

AI模型选择策略

根据任务特性智能选择AI模型:

任务主力模型原因备用模型文档生成GPT-4o长文本质量高Claude Sonnet代码生成DeepSeek Coder专业编程能力,成本低GPT-4医学编码Claude 3.5医学文本理解强GPT-4o数据异常本地模型快速,数据不出本地DeepSeek统计解读GPT-4o推理能力强Claude Opus

成本优化

  • 简单任务用DeepSeek(成本1/10)
  • 复杂任务用GPT-4/Claude
  • 每个项目AI成本预算:<$50/月

👥 角色权限体系

标准角色定义

平台预定义7种标准角色,符合临床试验职责分离原则:

角色工作流访问AI使用权限审批权限典型职责项目经理全部查看所有AI助手里程碑审批整体进度管理DM LeadDM所有工作流DM AI助手DMP/DVP审批数据管理策略统计师ST所有工作流ST AI助手SAP审批统计分析设计数据管理员数据清理/编码Query/Coding AIQuery关闭日常数据管理统计程序员TFL编程代码生成AI程序QCSAS/R编程QC审核员所有QC工作流QC AI助手QC报告签署质量控制监管事务只读所有无最终数据库锁定监管提交

权限矩阵示例

数据库锁定操作的多级权限控制:

操作DM员DM Lead统计师PM监管发起锁定申请✅✅✅✅❌审核数据质量❌✅❌❌❌统计审批❌❌✅❌❌PM审批❌❌❌✅❌执行锁定❌❌❌❌✅

权限设计原则

  1. 最小权限原则
    • 用户仅获得完成工作的必需权限
    • 默认拒绝,显式授权
  2. 职责分离(SOD)
    • 编程与QC不能为同一人
    • 数据录入与审核分离
    • AI建议与人工审批分离
  3. 多级审批
    • 关键节点需要2-3人签字
    • 数据库锁定需要DM+ST+PM+监管 4重审批
    • 所有审批不可跳过
  4. 时间锁定
    • 数据库锁定后,仅监管角色可访问
    • 锁定前的修改需要解锁申请+审批
    • 审计追踪永久保留
  5. 临时授权
    • 支持项目内临时权限提升
    • 自动过期(如:3天后收回)
    • 所有临时授权记录在案

自定义角色

企业版支持创建自定义角色:

  • 从标准角色复制
  • 精细化权限调整(至字段级别)
  • 基于项目类型的角色模板
  • 批量用户分配

权限设计原则

  • 最小权限原则:用户仅获得必需权限
  • 职责分离:编程与QC不能为同一人
  • 多级审批:关键节点需要多人签字
  • 时间锁定:数据库锁定后仅监管角色可访问

🏗️ 技术架构

系统架构图

┌─────────────────────────────────────────┐
│         用户界面层 (Tauri Desktop)        │
│  React + TypeScript + Ant Design        │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│         业务逻辑层 (Rust Backend)         │
│  ├─ 工作流引擎                           │
│  ├─ 权限管理                             │
│  ├─ 审计日志                             │
│  └─ 数据验证                             │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│          AI服务层 (可插拔)               │
│  ├─ DeepSeek (主力,成本优)              │
│  ├─ GPT-4 (备用,复杂任务)              │
│  └─ Claude (医学文本理解)               │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│        数据持久层                        │
│  ├─ SQLite (本地项目数据,加密)          │
│  ├─ PostgreSQL (企业版,多用户)         │
│  └─ S3/MinIO (文档和大文件)             │
└─────────────────────────────────────────┘

技术栈详解

前端技术

  • React 18:最新特性,并发渲染
  • TypeScript:类型安全,减少运行时错误
  • Vite:极速构建,HMR热更新
  • Ant Design 5:企业级UI组件库
  • Tailwind CSS:原子化CSS,快速样式开发
  • Monaco Editor:VS Code内核,代码编辑体验
  • React Query:服务端状态管理
  • Zustand:轻量级状态管理

后端技术

  • Tauri (Rust)
    • 比Electron小10倍(~5MB vs ~50MB)
    • 内存占用少50%+
    • 原生性能,安全性高
    • 跨平台:Windows/macOS/Linux
  • SQLite:嵌入式数据库,零配置
  • PostgreSQL:企业版多用户支持
  • Redis:缓存和会话管理(企业版)

AI集成

  • 多模型支持
    • DeepSeek V2.5:高性价比,中文友好
    • GPT-4 Turbo:复杂推理任务
    • Claude 3.5 Sonnet:医学文本理解
  • 提示工程框架
    • 模板库:预设100+专业提示词
    • Few-shot学习:基于project3示例
    • 思维链(CoT):复杂任务分步推理
  • 成本优化
    • 智能缓存:相似查询复用结果
    • 分级调用:简单任务用小模型
    • 批处理:合并多个请求

数据安全

传输层安全

  • TLS 1.3:最新加密协议
  • 证书固定:防止中间人攻击
  • 端到端加密:敏感数据加密传输

存储层安全

  • 数据库加密
    • SQLite:SQLCipher,AES-256
    • PostgreSQL:TDE (Transparent Data Encryption)
  • 文件加密
    • 文档/PDF:AES-256-GCM
    • 大文件:分块加密+完整性校验
  • 密钥管理
    • 本地:操作系统密钥链(Keychain/Credential Manager)
    • 企业:HSM或云KMS(Azure Key Vault/AWS KMS)

访问控制

  • 认证
    • 本地:用户名+密码(bcrypt哈希)
    • 企业:SSO/SAML 2.0/OAuth 2.0
    • 多因素认证(MFA):TOTP/SMS/Email
  • 授权
    • RBAC:基于角色的访问控制
    • ABAC:属性基础访问控制(企业版)
    • 数据级权限:行级/列级过滤

审计与合规

  • 操作日志
    • 谁(用户ID + 会话ID)
    • 何时(精确到毫秒的时间戳)
    • 做了什么(操作类型 + 详细参数)
    • 结果(成功/失败 + 错误信息)
  • 数据血缘
    • 原始数据 → 派生数据的完整链路
    • 支持回溯任意版本
  • 合规报告
    • 一键导出审计追踪
    • 符合21 CFR Part 11格式要求

性能指标

操作目标延迟实测性能DMP生成< 30秒~15秒SAS代码生成< 2分钟/程序~45秒数据核查1000条/秒~1500条/秒TFL渲染< 5秒/表格~2秒数据库查询< 100ms (P95)~50ms (P95)大文件上传100MB/秒~120MB/秒并发用户100+ (企业版)已测试200+

可扩展性

插件系统

javascript

// 自定义AI助手插件
export class CustomAIPlugin {
  name = "custom-coding-assistant";
  version = "1.0.0";
  
  async process(input: CodingRequest) {
    // 调用自己的AI API
    const result = await yourAI.generate(input);
    return result;
  }
}

Webhook支持

json

{
  "event": "workflow.completed",
  "workflow_id": "DM-01",
  "project_id": "proj_123",
  "timestamp": "2025-01-15T10:30:00Z",
  "webhook_url": "https://your-system.com/api/notify"
}

REST API

bash

# 获取项目状态
GET /api/v1/projects/{id}/status

# 触发工作流
POST /api/v1/workflows/{id}/start

# 查询AI生成结果
GET /api/v1/ai/jobs/{job_id}

🚀 快速开始

前置要求

  • 操作系统:Windows 10+, macOS 11+, Ubuntu 20.04+
  • 硬件
    • CPU: 4核+ (推荐8核)
    • 内存: 8GB+ (推荐16GB)
    • 存储: 20GB可用空间
  • 网络(仅AI功能):稳定互联网连接

安装步骤

1. 下载安装包

Windows

powershell

# 下载
Invoke-WebRequest -Uri https://releases.ct-workflow.com/latest/CT-Workflow-Setup.exe -OutFile CT-Workflow-Setup.exe

# 安装
.\CT-Workflow-Setup.exe

macOS

bash

# 下载
curl -O https://releases.ct-workflow.com/latest/CT-Workflow.dmg

# 安装
open CT-Workflow.dmg
# 拖拽到Applications文件夹

Linux

bash

# 下载AppImage
wget https://releases.ct-workflow.com/latest/CT-Workflow.AppImage

# 添加执行权限
chmod +x CT-Workflow.AppImage

# 运行
./CT-Workflow.AppImage

2. 首次启动配置

bash

# 启动应用后,按照向导完成配置:

1. 选择部署模式
   □ 单机版(本地SQLite)
   □ 企业版(连接PostgreSQL服务器)

2. 配置AI服务
   □ DeepSeek API Key: sk-xxxxx
   □ OpenAI API Key (可选): sk-xxxxx
   □ Claude API Key (可选): sk-xxxxx
   
   💡 提示:可跳过,后续在设置中配置

3. 创建管理员账号
   用户名: admin
   密码: ********
   邮箱: admin@example.com

4. 完成!🎉

3. 创建第一个项目

bash

# 在主界面点击"新建项目"

项目名称: HZYY1-XAZ-23044
适应症: 晚期实体瘤
研究类型: I期临床试验
起止日期: 2023-04-01 ~ 2024-12-31
→ AI自动提取:访视表、终点、入排标准

# 创建成功!自动进入项目中心
4. 启动第一个工作流
bash# 在项目中心,点击"DMP制定"工作流卡片

→ 进入DM-01工作流仪表板
→ 点击"Step 1: AI自动生成DMP草案"
→ 等待15秒... ✅ 生成完成!
→ 人工审核和修改
→ 点击"提交审批" → 选择审批人
→ 审批通过后,状态变为"已完成" ✅
→ 自动解锁下一个工作流"CRF设计"
快速演示视频
📹 5分钟快速入门:https://www.ct-workflow.com/demo/quickstart
📹 完整功能演示:https://www.ct-workflow.com/demo/full-tour

📖 用户旅程示例
场景:启动新的肿瘤临床试验项目
Day 1: 项目初始化
09:00 - 项目经理登录平台
├─ 点击"新建项目"
├─ 填写基本信息:
│   • 项目名称:HZYY1-XAZ-23044
│   • 适应症:晚期实体瘤
│   • 预计入组:60例
│   • 研究周期:18个月
├─ 上传方案PDF(152页)
│   → AI自动解析(2分钟)
│   → 提取关键信息:
│       ✓ 12个访视点
│       ✓ 主要终点:ORR
│       ✓ 次要终点:PFS, OS, AE
│       ✓ 入排标准:18条
└─ 项目创建成功!

09:30 - 查看AI生成的项目建议
├─ 建议的执行路径:
│   1️⃣ DMP制定(预计2天)
│   2️⃣ CRF设计(预计1周)
│   3️⃣ EDC搭建(预计2周)
│   4️⃣ ...
├─ 自动分配团队:
│   • DM Lead: 张三
│   • 统计师: 李四
│   • 程序员: 王五
└─ 发送邀请邮件 ✅

10:00 - 进入项目中心
└─ 可视化仪表板显示:
    • 总进度:0%
    • 待办任务:3个
    • 下一里程碑:DMP审批(预计2天后)
Week 1-2: 数据管理准备
Week 1 - Day 1: DMP工作流
10:00 - DM Lead进入DM-01工作流
├─ Step 1: AI生成DMP草案
│   → 点击"开始生成"
│   → 进度条:分析方案... 20%
│   → 进度条:生成章节... 60%
│   → 进度条:格式化... 90%
│   → ✅ 完成!(耗时15秒)
│
├─ 查看生成的DMP草案:
│   📄 数据管理计划 v0.1
│   ├─ 1. 项目概述 ✅ (AI生成)
│   ├─ 2. 数据采集计划 ✅
│   ├─ 3. 数据核查计划 ✅
│   ├─ 4. 编码策略 ✅
│   ├─ 5. 质量控制 ✅
│   └─ 6. 数据库锁定标准 ⚠️ (需人工补充)
│
11:00 - Step 2: 人工审核与修改
├─ 在Monaco编辑器中修改:
│   • 补充第6章具体标准
│   • 调整访视窗口期定义
│   • 添加EDC供应商信息
├─ AI实时建议:
│   💡 "检测到'±3天',是否统一为'±72小时'?"
│   💡 "建议添加缺失数据处理策略"
└─ 保存版本 v0.2

Week 1 - Day 2: DMP审批
14:00 - Step 3: 提交审批
├─ 选择审批人:项目经理 + 申办方
├─ 添加备注:"请重点关注第6章锁定标准"
└─ 发送审批邮件 ✅

Week 1 - Day 3: DMP定稿
09:00 - 审批人收到通知,打开审阅
├─ 查看修订历史:v0.1 → v0.2 的差异
├─ 添加批注:"第6章已完善,同意" ✅
└─ 批准 → DMP状态变为"已批准"

09:30 - DMP工作流完成!
├─ 系统自动:
│   • 生成DMP定稿版 v1.0
│   • 归档到文档库
│   • 解锁下一工作流"CRF设计"
│   • 更新项目进度:10% → 15%
└─ 通知团队:DMP已完成 ✅

Week 1 - Day 4-5: CRF设计工作流
├─ DM-02工作流启动
├─ AI推荐CDISC标准域:
│   • Demographics (DM)
│   • Adverse Events (AE)
│   • Vital Signs (VS)
│   • Laboratory Tests (LB)
│   • Tumor Response (TR)
│   • Exposure (EX)
│   • Concomitant Medications (CM)
├─ 可视化表单编辑器:
│   • 拖拽添加字段
│   • 设置验证规则
│   • 预览CRF效果
└─ 生成eCRF规范文档 ✅

Week 2: DVP工作流
├─ Step 1: CRF逻辑分析
│   → AI扫描所有CRF表单
│   → 识别:120个字段,35个逻辑关系
│
├─ Step 2: AI生成核查规则
│   规则类型分布:
│   • 必填检查:45条
│   • 范围检查:30条
│   • 逻辑一致性:25条
│   • 访视窗口:15条
│   • 数据格式:5条
│
├─ Step 3: 生成SAS代码
│   → AI自动生成check_001.sas ~ check_120.sas
│   → 代码包含:
│       • 数据读取
│       • 逻辑判断
│       • Query生成
│       • 日志输出
│
└─ Step 4: UAT测试
    • 导入测试数据(50例模拟数据)
    • 运行全部核查程序
    • 发现5条规则需优化
    • 调整后重新测试 ✅
    
DVP工作流完成!项目进度:30%
Week 3-6: 数据收集阶段
Week 3: EDC上线 + 首例入组
├─ EDC系统配置完成
├─ 中心培训(在线会议)
├─ 首例患者入组(中心001)
• Screening访视数据录入
│   • AI实时核查:发现2个异常
│       ⚠️ "体重超出合理范围(180kg)"
│       ⚠️ "血压收缩压<舒张压"
│   • 研究中心当场修正 ✅
└─ 数据质量:实时监控

Week 4-6: 数据清理工作流(每周循环)
每周一 09:00 - 自动运行数据核查
├─ 执行120条DVP规则
├─ 生成质疑清单:
│   Week 4: 12个Query (5 High, 7 Medium)
│   Week 5: 18个Query (8 High, 10 Medium)
│   Week 6: 15个Query (6 High, 9 Medium)
│
├─ AI自动分类优先级:
│   🔴 High: 影响主要终点的数据
│   🟡 Medium: 次要数据异常
│   🟢 Low: 格式问题
│
└─ 自动分配给相应中心

每周二-四 - 中心回复Query
├─ 中心登录Query管理模块
├─ 查看分配的质疑
├─ 填写回复和数据更新
└─ 提交 → DM审核

每周五 - Query关闭和报告
├─ DM审核中心回复
├─ 关闭已解决的Query
├─ AI生成周报:
│   📊 本周数据清理进展报告
│   • Query总数:45个
│   • 已关闭:38个(84%)
│   • 待回复:7个(16%)
│   • 平均响应时间:2.3天
└─ 发送给申办方

Week 5-6: 医学编码工作流
├─ AI提取AE术语(125个原始术语)
│   • "头疼" → "Headache"
│   • "恶心呕吐" → 拆分为2个术语
│   • "ALT升高" → "Alanine aminotransferase increased"
│
├─ AI自动匹配MedDRA:
│   ✅ 自动匹配:119个(95%)
│   ⚠️ 多个候选:4个(3%)
│   ❌ 未匹配:2个(2%)
│
├─ 人工审核边缘案例:
│   • "轻度头晕" 
│     候选1: Dizziness (10013573) ⭐推荐
│     候选2: Presyncope (10036653)
│   • 选择候选1 ✅
│
└─ 生成编码字典:
    📄 AE_Coding_Dictionary_v1.0.xlsx
    • PT: 85个
    • LLT: 125个
    • 匹配率: 97%
Month 4-6: 数据库锁定
Month 4: 最后入组完成
├─ 末例患者末次访视(LPLV)
├─ 启动数据库清理最后冲刺
└─ 目标:Month 6完成数据库锁定

Month 5: 数据清理收尾
├─ 每周Query数量:
│   Week 1: 25个
│   Week 2: 18个
│   Week 3: 12个
│   Week 4: 5个
│
├─ 遗留问题会议:
│   • 讨论7个无法解决的Query
│   • 决定:5个数据删除,2个保留加说明
│   • 更新DMP相应章节
│
└─ QC工作流启动:
    ├─ 100% SDV (源数据验证)
    │   • 抽取10%患者(6例)
    │   • 核对EDC vs 原始病历
    │   • 发现3处差异,全部修正 ✅
    │
    ├─ AI自动数据一致性检查:
    │   • 跨表逻辑一致性:✅ 通过
    │   • 时间序列合理性:✅ 通过
    │   • 派生变量计算:⚠️ 发现1处公式错误
    │   • 修正后重新验证:✅ 通过
    │
    └─ QC报告生成:
        📄 QC_Report_Final_v1.0.pdf
        • 检查项:156项
        • 通过率:99.4%
        • 遗留问题:1项(已文档化)

Month 6 - Week 1: 数据库锁定准备
├─ DM-06工作流启动
├─ AI生成锁定清单(25项):
│   ✅ 所有CRF表单已审核
│   ✅ Query关闭率 > 95% (实际98%)
│   ✅ 医学编码完成率 100%
│   ✅ QC完成率 100%
│   ✅ SAE报告完整性检查通过
│   ✅ Protocol Deviations记录完整
│   ⚠️ 1例患者退出原因待确认
│   ... (其余23项)
│
├─ 解决遗留问题:
│   • 联系中心确认退出原因
│   • 更新退出表单
│   • 重新运行核查程序 ✅
│
└─ 锁定准备会议:
    • 参会:PM, DM Lead, 统计师, 申办方
    • 审阅清单:全部25项 ✅
    • 决定:批准锁定

Month 6 - Week 2: 执行锁定
├─ 2025-06-15 10:00 - 数据库锁定!
│   → 系统执行:
│       • 创建数据库快照
│       • 设置所有数据为只读
│       • 生成锁定声明
│       • 导出SDTM格式数据
│       • 发送通知给所有相关人员
│
├─ 锁定声明自动生成:
│   📄 Database_Lock_Statement_v1.0.pdf
│   • 锁定日期:2025-06-15
│   • 数据集版本:DBL_2025_06_15
│   • 患者数:60例
│   • 访视数:720次
│   • AE数:234个
│   • 签署:DM Lead, 统计师, PM, 申办方
│
└─ 数据传输给统计团队:
    • SDTM数据集(10个域)
    • Define.xml
    • 数据库说明文档
    • 传输验证:MD5校验 ✅
Month 7-8: 统计分析
Month 7 - Week 1: SAP撰写工作流