编者按:临床预测模型作为临床研究的“高阶玩法”,不仅仅是发表高分SCI文章的热门选择,更是改变临床实践的重要途径。随着临床预测模型热度日渐上升,很多团队都在尝试建立各类疾病诊断/治疗的预测模型,但经常遭遇准确性低或应用不便等“拦路虎”。 在此背景下,《临床预测模型构建方法学》应运而生。本书由30余位临床统计高手合力编著而成,是一本拿来即用的“实战指南”。
在本书热销之际,AME科研时间将节选部分精彩篇章以飨读者。今天带来“ 临床预测模型的构建与评价:临床研究者面临的挑战”一章。本章作者将针对临床研究者面临的挑战 谈一些自己的看法。
临床预测模型的构建与评价:临床研究者面临的挑战
韩艳秋,胡志德
在过往一期《转化医学年鉴》( Annals of Translational Medicine )杂志中,周支瑞等详细地介绍了临床预测模型的概念、应用以及构建模型的方法学和步骤 [1] 。作者介绍了一些有趣且有价值的统计学方法,如列线图、决策曲线分析、净重新分类指数和综合改良指数,同时还介绍了如何按部就班地在R软件中运行相关代码。毫无疑问,对于对临床模型感兴趣的研究者而言,这篇特别报告将是一篇重要的指南。这篇报告对临床预测模型统计学方法的问题已经进行了详尽的全面的阐述。在此,笔者拟从临床方面谈一些自己的看法。
一、变量的选择
如果我们将临床模型比喻成建筑,那么每一个模型中的参数无疑就是这个建筑的砖块。在大数据时代,数据俯拾皆是,比如常规实验室检查数据、遗传学信息、病史、体征、症状、并发症和微生物学检查结果等。在这篇特别报告中,作者从统计学的角度介绍了变量选择的方法。在此,我从临床的角度补充一些变量选择原则。
(一)经济学方面的考虑
理论上,纳入模型的变量越多,模型的预测准确性也越高。但是,纳入较多的变量会导致花费增高。所以,在构建临床预测模型时,应该优先选择花费较低的变量,比如病史、体征、症状、常规血液学检查结果、肝肾功能检查。如果一个临床预测模型的总花费较高,特别是包括了一些非常规的参数时(比如遗传学信息、淋巴细胞亚群分析、循环microRNA),其临床应用就会受限。
(二)变量的标准化
部分变量,尤其是实验室检查,已经实现了较好的标准化。也就是说,其结果在不同的实验室之间具有可比性(比如血红蛋白、肝酶)。在构建模型时,这些变量应该作为首选。对于一些尚未实现标准化的变量或测试,比如胸腔积液IL-27对于结核性胸膜炎的诊断,就应该保持警惕,因为IL-27的结果在很大程度上受选择的试剂盒影响。在这种情况下,腺苷脱氨酶(ADA)应该更受青睐,即便其诊断准确性不如IL-27[2] 。对于一些症状和体征,其定义往往不够清晰,比如在肺动脉高压患者中使用纽约心脏病协会(NYHA)的功能分级系统。临床医师间在应用该系统时的一致性仍然不能令人满意[3] 。
(三)周转时间(TAT)
对于一些紧急的病例,比如急诊室的胸痛或腹痛患者,快速的鉴别诊断极为关键。在这种情况下构建预测模型,就必须考虑周转时间。我们假定在因急性胸痛而就诊于急诊室的患者中,采用聚合酶链反应(PCR)的方法检测循环microRNA可以为急性心肌梗死的诊断提供参考,所以将循环microRNA纳入预测模型在统计学上是合理的。但是,将此变量纳入临床预测模型就意味着:如果我们想在胸痛患者中利用这个模型预测急性心肌梗死,首先就要获取循环microRNA的检测结果。而循环microRNA的周转时间约为3小时,这就意味着想要利用这个模型,就必须得等上至少3小时。所以这个模型并不利于急性心肌梗死的早期诊断,其临床效能还有待于商榷。临床预测模型的周转时间取决于模型中周转时间最长的那个变量。
(四)易于获取
一些临床变量较难获取,比如遗传学信息。即便在非急诊情况下,纳入这些变量可能会削弱模型的临床应用价值。我们建议研究者使用一些易于获取的变量,比如症状、体征、病史和常规实验室检查。
(五)变量的时间点
预测特定疾病预后的模型具有很高的应用价值,因为治疗方案的选择和疾病的远期管理在很大程度上受患者预后的影响。如果模型预测的目的是为了辅助临床医师选择治疗方案,那么基线(治疗前)的变量就应该作为首选。如果我们使用一个包含治疗后的变量(比如术后并发症)的模型去指导治疗措施的选择,这就属于自相矛盾了。如果一个模型进行是为了指导疾病的远期管理(比如术后随访频次、术后肺癌患者的化疗),那选择治疗后的变量也是可以接受的。
上述列举的原则是一些我们对于临床预测模型构建中变量选择的个人观点。必须承认的是,在构建预测模型时,预测模型的准确性和成本、周转时间、标准化之间存在一种“此消彼长”的关系。对于模型构建者来说,如何评估这些要素之间的关系是一个挑战。
二、模型的评估:从有统计学意义到有临床效能之间还有很长的一段路要走
在报告中,作者提出了一些评价模型的统计学方法,比如C统计量、决策曲线和校准曲线等[1] 。在临床模型构建的研究者中,这些方法的使用较为广泛。然而,临床实践极为复杂,并不是由一些参数组成的模型或者算法。以在因呼吸困难就诊于急诊室的人群中诊断心力衰竭为例,众所周知,一些基线特征也能提供心衰方面的诊断信息,比如病史、影像学特征、常规血液学检查等。这些特征也可以用于构建诊断模型。值得注意的是,如果已知这些基线信息及临床医生的诊断信息可以用一个量表去量化,那这个量表的曲线下面积(AUC)大约为0.90[4] 。所以,如果一个模型的AUC低于这个量表,这个模型就毫无意义了。
诊断准确性方面的提升并不意味着更好的疾病结局[5] 。换而言之,临床效能要比预测准确性更具有吸引力和价值。阐明预测模型临床效能的高级别的证据是随机对照试验,但是这种类型的研究较少。有一些类似的研究探讨的是单个标志物的性能,比如在急性呼吸困难患者中,B型利钠肽(BNP)检测与临床结局、健康服务的研究[6] 。在这项随机对照试验中,612个因急性呼吸困难而就诊于急诊室的患者被随机分为接受BNP检测和不接受BNP检测组。BNP检测的临床效能是通过两组的结局比较来反映的,包括入院率、住院时间、死亡率和再入院率。采用相似的策略,可以去评价一个诊断模型的临床效能。对于预后模型,其评估策略也相似。比如,基于一个模型的治疗方案是否优于常规治疗方案,就像评价在急性呼吸道感染患者中,基于降钙素原的抗生素启动和维持治疗方案的效能一样[7] 。
三、结论
在临床实践中,临床模型可以方便患者的管理,因此代表了一个热门的临床研究策略。周支瑞等系统地概括了临床模型构建和评估的一些原则,为我们构建临床预测模型提供了全新的思路。我们认为,一个优秀的模型应该应用方便、预测准确性高,同时具有可以接受的临床效能。对于临床研究者而言,构建这样一个模型极具挑战。
参考文献(向上滑动查看)
[1] Zhou ZR,Wang WW,Li Y,et al. In-depth mining of clinical data :the construction of clinical prediction model with R[ J]. Ann Transl Med,2019,7(23):796.
[2] Porcel JM. Advances in the diagnosis of tuberculous pleuritis[J]. Ann Transl Med,2016,4(15):282.
[3] Taichman DB,McGoon MD,Harhay MO,et al. Wide variation in clinicians’ assessment of New York Heart Association/World Health Organization functional class in patients with pulmonary arterial hypertension[ J]. Mayo Clin Proc,2009,84(7):586–592.
[4] Januzzi Jr. JL,Camargo CA,Anwaruddin S,et al. The N-terminal Pro-BNP investigation of dyspnea in the emergency department (PRIDE) study[ J]. Am J Cardiol,2005,95(8):948–954.
[5] Bossuyt PM,Reitsma JB,Linnet K,et al. Beyond diagnostic accuracy:the clinical utility of diagnostic tests[ J]. Clin Chem,2012,58(12):1636–1643.
[6] Schneider HG,Lam L,Lokuge A,et al. B-type natriuretic peptide testing, clinical outcomes, and health services use in emergency department patients with dyspnea: a randomized trial[ J]. Ann Intern Med,2009,150(16):365–371.
[7] Schuetz P,Briel M,Christ-Crain M,et al. Procalcitonin to guide initiation and duration of antibiotic treatment in acute respiratory infections:an individual patient data metaanalysis[ J]. Clin Infect Dis,2012,55(15):651–662.
欲解锁更多精彩内容,并获得书中相关数据及代码,请扫描下方二维码进入微店!
- 临床预测模型构建方法学
资讯
AME旗下13本期刊最新影响因子|2021年6月
责任编辑:陈 童 AME Publishing Company
排版编辑:王 翩 AME Publishing Company
b.03. 2022.05.05.02
点击
阅读原文
进入AME微店返回搜狐,查看更多