开题报告答辩

Emergency Vertigo | 30-day Readmission

基于多维度临床特征的急诊眩晕患者再入院逻辑回归风险模型的构建与验证

护理学院 | 护理学 | 慢性病管理与照护
研究生：吴启鹏　导师：杨巧红副教授

2026年5月19日

目录答辩内容安排

眩晕/头晕在急诊中具有稳定而可观的就诊规模

3.3%美国 NHAMCS 1993-2005：眩晕或头晕相关急诊就诊占全部急诊就诊比例

260万折合每年约 260 万例急诊就诊

53,190日本大阪 ORION 2018-2020 救护车转运眩晕相关病例

急诊眩晕负担的三个层次文献数据重绘

选题依据 2病因谱复杂，不能只看“眩晕”两个字

急诊眩晕涉及多系统病因，诊断与出院管理都存在不确定性

NHAMCS 诊断构成比例为报告引用值

对研究设计的直接启示

变量必须多维：人口学、病史、症状体征、检查、治疗、出院管理都可能影响短期结局。
结局应全因：再入院原因不一定与同一眩晕诊断完全一致，卒中、心血管、跌倒、代谢问题都可能触发。
模型需可解释：急诊和护理场景更需要能解释、能落地、能和随访干预连接的风险工具。

前庭中枢心血管代谢药物心理出院衔接

选题依据 3为什么用 30 天非计划性再入院

30 天窗口能覆盖症状复发、严重病因进展和出院后管理不足

再入院不是“重复住院”这么简单

病情未稳：眩晕复发、步态不稳、严重病因进展。
安全事件：跌倒损伤、用药不良反应、慢性病控制不佳。
照护断点：出院指导不足、复诊衔接弱、前庭康复或随访未闭环。
质量信号：可反映首次评估、风险分层和出院准备的不足。

30 天非计划再入院观察窗口结局判定方法

研究空白证据存在，但无法直接指导本场景

现有研究在“眩晕专科变量”与“再入院结局”之间存在错位

证据类型

主要回答

可借鉴点

用于本研究的不足

眩晕诊断/卒中识别研究

识别中枢性、严重神经系统病因

年龄、神经阳性体征、失衡、步态异常、高血压等

多聚焦诊断鉴别，较少回答出院后再入院

BPPV 与急诊处置研究

规范床旁试验、耳石复位、减少不必要影像

治疗充分性、康复指导、跌倒风险

多为特定病因或过程质量，无法覆盖多病因再入院

通用再入院模型

预测住院患者短期再入院

合并症、住院天数、既往住院、贫血、肾功能、社会支持

缺少眩晕专科症状、前庭体征、复位治疗和步态状态

预测模型方法学

TRIPOD / PROBAST 强调规范报告和偏倚控制

样本量、变量处理、验证、校准、临床净获益

需要结合本地真实世界数据重新构建

空白 1

缺少面向急诊眩晕住院患者 30 天非计划性再入院的专门模型。

空白 2

通用模型变量体系与眩晕临床路径不完全匹配，解释性不足。

空白 3

不少模型未充分报告校准、内部验证、DCA 和工具转化。

研究逻辑把风险识别前移到出院前后

从“被动再入院处理”转向“首次入院阶段风险分层”

1多维资料采集人口学、病史、症状体征、检验、影像、治疗和出院管理

2统计筛选单因素分析 + LASSO 压缩，兼顾临床意义与过拟合控制

3逻辑回归建模输出 OR、95%CI、风险概率，便于临床解释

4验证与解释AUC、校准、F1、SHAP、DCA，评价准确性与净获益

5临床转化单 HTML 风险工具，连接复诊提醒、康复指导和跌倒预防

研究目的

本研究围绕“条目池、模型、工具”逐层推进

目标一：构建预测因素条目池

通过文献回顾、小组讨论和线上专家咨询，构建急诊眩晕患者 30 天再入院风险模型候选变量体系。

文献回顾小组讨论两轮专家咨询

目标二：构建并内部验证模型

基于深圳市人民医院急诊眩晕患者临床资料，筛选再入院相关预测因素，建立逻辑回归风险预测模型。

LASSO逻辑回归7:3 验证

目标三：开发网页版工具

根据最终模型开发单 HTML 风险计算工具，输入患者特征后输出 30 天再入院概率和风险分层。

本地计算不保存身份信息静态部署

研究内容	方法路径
预测因素条目池	证据检索 + 专家评分 + 条目筛选标准
风险模型	单因素分析、LASSO 筛选、多因素逻辑回归、内部验证
网页工具	单文件 HTML/CSS/JavaScript，本地计算，输出风险概率和风险分层

科学问题与创新性

科学问题

如何确保所开发的急诊眩晕患者 30 天再入院风险模型具有科学性、准确性，并能够服务临床风险分层？

研究设计

明确研究对象、结局定义、预测指标采集时间点和数据来源。

变量构建

文献回顾、小组讨论和两轮专家咨询形成候选条目池。

模型验证

训练集/验证集、交叉验证、AUC、F1、校准和 DCA 综合评价。

工具转化

采用急诊可获得变量，开发本地计算的单 HTML 风险工具。

预期创新性

结局

关注急诊眩晕患者 30 天非计划性再入院，补充短期预后风险评估证据。

变量

整合人口学、基础病、症状体征、检查、治疗过程和出院管理多维资料。

方法

结合专家咨询、LASSO、逻辑回归、SHAP 和决策曲线分析。

转化

开发单 HTML 网页工具，提高模型在急诊场景中的可使用性。

研究设计单中心回顾性预测模型研究

以深圳市人民医院急诊眩晕患者为真实世界数据来源

设计要素	本研究设定
研究类型	单中心回顾性研究，按临床预测模型研究要求设计
研究对象	急诊收治的成人眩晕、头晕、平衡障碍或相关症状患者
预测资料	首次急诊就诊入院时及本次住院期间可获得资料
结局指标	首次出院后 30 天内全因非计划性再入院
数据来源	急诊/住院电子病历、检验、影像、医嘱、出院记录、随访记录
模型呈现	回归方程、风险概率、风险分层、网页工具

本研究技术路线图

条目池构建证据检索 + 小组讨论

候选变量首先来自系统化证据，而不是事后挑选

检索表达式按数据库特点调整主题词与自由词

中文数据库

中国知网、万方、维普、中国生物医学文献数据库

英文数据库

PubMed、Embase、Web of Science、Cochrane Library、CINAHL

建库至 2026 年 5 月追溯参考文献双人独立筛选第三者裁决

筛选标准

纳入对象：成人眩晕、头晕、前庭疾病或急诊相关患者。
纳入内容：涉及再入院、再次就诊、短期预后、复发、卒中识别或预测模型。
纳入信息：报告可能影响再入院或短期预后的临床因素。
排除：儿童或非临床人群、主题不相关、全文不可得、关键信息不足、重复发表或低质量文献。

变量体系多维临床特征是模型的基础

候选变量覆盖“基础风险、急性病情、诊疗过程、出院衔接”

变量选择原则

首次急诊就诊入院时或住院期间常规可获得。
临床含义明确，能解释眩晕病因、病情严重程度或再入院管理。
数据记录相对稳定，便于回顾性提取和网页工具输入。
最终变量仍需根据专家咨询和真实数据质量调整。

7类候选变量维度

30+初步条目

多维变量结构

候选变量重点条目一屏展示

初步候选预测因素条目池

分类	核心变量	临床意义
人口学资料	年龄、性别、居住状态/主要照护者、医保类型	基础风险、照护可及性、随访依从性
既往病史	高血压、糖尿病、冠心病、房颤/心律失常、卒中/TIA、慢性肾病、焦虑抑郁睡眠障碍、近1年眩晕史、近1年住院史	脑血管风险、慢病负担、复发基础和再入院易感性
症状特征	发作至就诊时间、持续时间、反复发作、恶心呕吐、头痛/颈枕痛、听力下降/耳鸣/耳闷、复视/构音障碍/吞咽困难/肢体麻木无力	区分发作模式、严重病因线索与症状负担
体征与功能	收缩压、舒张压、心率、眼震表现、步态不稳/不能独立行走、神经系统阳性体征	急性病情程度、中枢风险和跌倒风险
实验室/辅助检查	血红蛋白、白细胞、血糖、血钠、肌酐/eGFR、LDL-C、D-二聚体、心电图异常、头颅CT异常	贫血、炎症、代谢、肾功能、血栓和心脑血管风险
治疗与留观	耳石复位、前庭抑制药/止吐药、抗血小板或抗凝治疗、住院天数	治疗充分性、症状控制、病情复杂度
出院管理	出院诊断是否明确、出院时仍有眩晕/步态不稳、前庭康复或跌倒预防指导、30天内复诊或电话随访	照护连续性与可干预风险点

专家咨询保证变量临床意义和可采集性

两轮线上专家咨询

1专家来源急诊、神经内科、耳鼻咽喉、前庭医学、护理管理、统计/流行病学

2第一轮评分重要性、可获得性、记录可靠性，5级评分 + 开放建议

3结果反馈积极系数、权威系数、均数、满分率、变异系数、协调程度

4第二轮确认修订条目并再次评分，形成最终候选清单

10-20拟邀请专家人数

≥3.5重要性均数保留标准

≤0.25变异系数保留标准

专家评分维度每项 1-5 分

研究对象纳排标准与结局定义

入组对象聚焦“成人急诊眩晕相关住院/留观患者”

纳入标准

年龄 ≥18 岁。
以眩晕、头晕、平衡障碍或相关症状为主要原因经急诊就诊并收入院或急诊观察病房。
首次入院资料较完整，能够提取主要预测变量。
能够通过病历系统、电话或门诊记录完成出院后 30 天结局随访。

排除标准

主要原因明确为外伤、中毒、癫痫、精神行为异常等与眩晕关系不密切急症。
计划性再入院或转院后无法判断 30 天结局。
住院期间死亡、自动出院且无法完成结局判断。
关键变量缺失严重；重复入院仅纳入首次符合条件记录。

结局定义

首次出院后 30 天内发生全因非计划性再入院

包含	眩晕复发、卒中/心血管事件、跌倒、代谢异常、药物问题等导致的非计划急性住院
排除	明确计划性检查、择期手术、分期治疗入院
核实	医院信息系统、门诊复诊记录、电话随访、区域医疗信息

样本量按事件数与参数数控制过拟合

计划收集约 1000 例，支持 10-12 个最终预测参数

样本量推导EPV ≥ 10

12%按 30 天非计划再入院率保守估计

1201000 例 × 12% = 约 120 个再入院事件

10-12EPV≥10 时可支持的最终预测参数数量

不同再入院率情景下的事件数n=1000

数据来源多系统整合与时间点管理

预测指标限定在“首次急诊入院时及本次住院期间”

首次急诊入院时

急诊电子病历系统：主诉、分诊、发作至就诊时间、生命体征。
住院电子病历系统：既往病史、用药史、症状体征、功能状态。
检验与影像系统：入院早期可获得的实验室和影像资料。

本次住院期间

检验系统：血红蛋白、白细胞、血糖、血钠、肌酐/eGFR、LDL-C、D-二聚体等。
影像系统：头颅 CT 或其他必要影像结果。
医嘱与出院记录：治疗措施、住院天数、出院诊断、出院时状态、随访安排。

首次出院后 30 天

结局：全因非计划性再入院。
核实来源：医院信息系统、门诊复诊记录、电话随访和区域医疗信息。
计划性检查、择期手术或分期治疗入院不计入结局事件。

控制点	处理方式
变量定义	研究前制定统一数据提取表，明确单位、分类方式和采集时间点。
数据核查	关键变量双人核查；对随访状态不明确者单独记录并说明统计处理方法。
隐私边界	建模数据用于研究分析；后续网页工具仅本地计算，不保存患者个人身份信息。

数据预处理先把数据质量问题暴露出来

建模前处理缺失、异常、共线性和类别稀疏问题

缺失值

按缺失比例与缺失机制处理。低比例、近似随机缺失可插补；高缺失或记录质量差原则上不入模。

缺失比例机制判断

连续变量

检查分布、异常值、单位一致性和偏态情况。必要时转换、分层或采用稳健处理。

分布异常值

共线性

对临床含义相近或统计高度相关变量进行检查，避免最终模型系数不稳定。

VIF相关矩阵

类别稀疏

处理低频类别和罕见组合，必要时合并临床意义相近变量，避免估计不稳。

低频类别合并

特征工程建模前数据处理流程

建模策略解释性优先的逻辑回归路径

变量筛选分三步：单因素、LASSO、逻辑回归

1单因素分析比较再入院组与未再入院组基线差异，同时保留临床意义明确变量。

2LASSO筛选通过惩罚项压缩变量，网格搜索与交叉验证选择最优 λ。

3多因素逻辑回归按 7:3 划分数据集：7 为训练集建模，3 为内部验证；输出 OR 和 95%CI。

logit(p) = β0 + β1X1 + β2X2 + ... + βkXk
p = 30 天非计划性再入院预测概率

LASSO 与最终模型的关系示意图

模型评价不只看 AUC

模型性能评价覆盖区分度、分类性能、校准度和临床净获益

区分度

评价模型区分再入院与未再入院的能力。

分类性能

准确率、精确率、召回率、F1；重点关注召回率和 F1。

校准度

校准曲线、校准截距和校准斜率，判断概率是否可信。

临床净获益

决策曲线分析不同阈值概率下的净获益。

评价维度	指标
区分度	AUC
分类性能	准确率、精确率、召回率、F1
校准度	校准曲线、校准截距、校准斜率
临床实用性	决策曲线分析（DCA）

解释与分层让模型结果能被临床理解

用 SHAP 解释变量贡献，并输出低、中、高风险分层

SHAP 总体重要性示意非真实结果，展示计划图形形式

风险分层的临床表达

18%
示例预测概率

分层	临床动作
低风险	常规出院宣教，明确危险信号
中风险	安排强化随访，交代家属近期2周内留好陪护，避免复发意外发生
高风险	要求留院观察2周，帮助患者平稳过渡

网页工具单 HTML，本地计算，不上传数据

最终把模型转成急诊可用的风险计算页面

工具设计原则

与最终模型变量保持一致：连续变量用数值输入，分类变量用下拉框或单选项。
浏览器本地完成计算，输入数据不上传服务器，不保存患者身份信息。
输出 30 天非计划性再入院预测概率、风险等级和解释提示。
可部署至 Cloudflare Pages 或同类静态网页平台，便于维护版本。

HTMLCSSJavaScript本地计算移动端适配

年龄68 岁

高血压病史是

神经系统阳性体征否

步态不稳/不能行走是

血糖8.6 mmol/L

出院时仍有症状是

30天复诊/电话随访已安排

计算风险

18%
中风险

建议强化随访

解释步态/症状

基础、风险与计划研究可行性与收尾

已有数据基础和临床场景，可支撑模型构建与转化验证

研究基础

自 2022 年起开展急诊眩晕“个案管理模式”；截至 2024 年 6 月，已前瞻性连续收集超过 672 例急诊眩晕患者完整临床与随访数据，并结合神经内科门诊 830 例个案管理患者形成结构化数据库。

平台条件

医院 HIS、五大中心系统、LIS、区域医疗信息平台、电话随访、企业微信/微信公众号平台，可支持回顾性数据提取、随访核实和后续健康提醒。

主要风险与应对

数据缺失：统一变量定义、预调查、双人核查。事件数不足/过拟合：控制最终变量数、LASSO、交叉验证、必要时合并变量或采用惩罚逻辑回归。

2026.05完成开题报告、修改和答辩，明确对象、结局和数据提取方案。

2026.06文献回顾、小组讨论、第一轮专家咨询，修订条目池。

2026.07第二轮专家咨询，确定候选变量，开展预调查。

2026.08-09收集约 1000 例资料，完成清理、随访核对和缺失检查。

2026.10统计描述、单因素、LASSO、逻辑回归，完成训练/验证评价。

2026.11SHAP、DCA、网页工具开发和功能测试。

2026.12论文撰写、修改、定稿和答辩准备。

敬请批评指正