临床研究中年龄只能是连续变量吗?具体的年龄数值可以说把年龄当了连续变量,而80后则把年龄当了分类变量。临床研究中,年龄也是一个很重要的变量,那么问题来了,是把年龄视为连续变量,还是分分段作为分类变量呢?
一个经典的状况(←如果太抽象,请直接看例子)
在探讨危险因素时,我们经常会遇到这样的情况:
a.结局是一个二分类的变量。比如病例对照研究中的“病例VS.对照”;队列研究中的“患病VS.未患病”等等。
b.结局存在多个潜在的危险因素。比如性别、年龄、疾病分型、尿蛋白加号的数量等等。
c.希望探讨每个因素是否存在效应以及效应的大小。
这时候您会怎么做呢?
据说百分之好多都这样(←我是错的!我是错的!)
先简单描述一下,另加单因素分析是少不了的。但是最后,肯定还会做一下多因素分析。如果您是老手,您肯定会尝试Logistic回归,那么问题来了,是不是把所有变量是直接丢进模型里去就可以了?
随着SPSS等软件的普及,人们对多因素分析模型的使用越来越普遍了,Logistic回归模型也成为了应用最广泛的模型之一。我们按照SPSS教程,对着菜单点一点,很容易就能让软件为我们自动拟合出一个模型。我们问过很多医生,大多数医生认为只要变量选对了,丢到模型里去算,然后读结果就好了。实际上这样做会带来很多问题。
一大波“栗 子”正在接近中
假设A医院有一组接受某手术治疗的患者,大医生LN试图分析他们发生术后并发症的危险因素。(看上去是个队列研究啊喂!当然也可以是病例对照……)患者的结局自然只有两种:术后出现并发症、无术后并发症。我们想找找哪些因素与出现并发症相关,作为一个资深野兽派研究者,我们提出了一个高大上的潜在危险因素——年龄!
因此,这个例子就是,年龄到底是不是发生术后并发症的危险因素呢?
场景一,傻傻分不清楚
在分析年龄这单个因素对术后结局的影响时,您可能会这样做:直接把年龄当做连续变量,比较两种结局患者的年龄均数。
咱一看结果,哎!这个结果好呀,两组均值这么接近(54.96岁 VS. 55.39岁),p值还这么大(0.568)。然后就顺手得出一个结论,年龄这个因素与术后并发症发生没毛关系。然后代入Logistic回归模型(为了栗子清爽,我们暂时只引入年龄一个变量,加入多个变量时与此相似)。结果当然是年龄仍然没啥意义。
场景二,没抖好的小聪明 也许您胆大心细,一心想要探(阳)究(性)真(结)理(论)。然后就想了,年龄这东西,连续变量不一定准啊!对,给丫变成分类的试试。怎么分呢?看看文献都怎么做,咱就怎么分吧! 咔!!!(李楠大吼一声) 尝试变成分类资料探索并没有什么不妥,但是大家经常会参照文献的方法分段,这就不一定总是正确了。当然大多数情况下,考虑临床实际意义进行分类还是必要的,但是在探索阶段,似乎直接这样做就会丢掉好多信息。 在这个例子中,不妨让我们先按10岁一个年龄段划一下试试。分完之后,年龄变成了这个样纸。
我们一看!哎,不错啊,年龄变量一下子清爽多了,那咱们再回归一下吧!!!
一看结果,估计随之而来的就是失落。得!白折腾半天。神奇的李楠劝大家别着急,咱们马上看看情景三吧。
场景三,低调有内涵 估计您其实是个善于理性思考的医生,在实际分析的时候应该不会出现情景二的后半段。故事的发展应该是接下来这个样子的。在对年龄分段后,您做了一个R×C列联表。
看到表您就发现了,在30岁这个年龄段只有28.6%的人有术后并发症;而40-60这三个年龄段的术后并发症发生率则提高到44.7%-51.2%;到了70岁发生率又回落到了33.3%。从不同年龄段并发症的发生率来看,似乎是一个U字形,并非是完全无关的。也许我们应该将中间三组合并为一个年龄段,保留头尾两个年龄段,这样分组更加合适。先别急,还是让我们先分析分析再说吧。我们先做个卡方检验试试。
哎!确实各年龄组间的并发症发生率存在差异!那为什么之前Logistic回归却显示年龄与并发症无关呢?其实问题是我们把变量代入模型的方式不对。(你不是玩儿我吧!)没错,就是这个原因。
聊一毛钱儿的 无论年龄是连续变量还是分类变量,直接代入模型的时候,模型都会将年龄与并发症发生风险间的关系想象成等比例递增的关系。换句话说,模型会认为年龄增加1岁,或年龄增加一个年龄段,其发生风险增加的幅度是一致的。也就是说从30岁到31岁与从50到51岁风险增加相同,从30到40岁与从60到70岁风险增加也相同。然而,从上面的交叉表我们就能看出,年龄与并发症发生风险的关系并不是这样的,而是有一个先上升、后下降的趋势。所以在我们分析的时候,就要把年龄变成无序多分类变量代入模型。
然后Logistic回归的结果马上就变样了。
我们看到,年龄这个无序多分类变量还是有意义(p=0.017)的!在各个分组中,40、50、60这三组,与30岁组相比,都是有统计学意义的危险因素,而70岁组与30岁组风险相当。从专业上看,似乎也可以理解,毕竟对于高龄老人,如果术前考虑手术风险较高,医生就会放弃手术了,而真正接受手术的患者,其基本健康状况可能优于一般人群。当然,之后我们还可以把中间三组合并在分析,我们就不详细展示了。
总结 从上面这一斤多栗子中,我们看到的是对于连续变量、有序分类变量进行分析,尤其是代入Logistic回归分析时的大致思路。并不是直接比比,然后丢模型就ok了,而是要多探索,结合临床实际对人群进行分组,并结合实际解读分析结果。这样才能够充分的利用数据。 不过需要额外说明的是,所有这些分析上的尝试,仅仅适用于探索性和培育性的研究,也就是说我们希望通过向数据学习,而挖掘一些新的知识。对于验证性的研究,比如药物临床试验,此时所有的研究因素都应该是已知的,研究的目的知识验证假说、得到证据。这是我们应该严格按照统计计划书完成分析内容,而不应该进行上述尝试,否则就有玩弄数据和统计方法、攫取阳性结论的嫌疑了。
- 青丘狐传说共有几集青丘狐传说共有几集2024-03-17 12:07 1个回答2024-03-17 13:21《青丘狐传说》精华版32集,未删减版37集。共有《阿绣》《封三娘》《婴宁》《胡四》《...
- 世界杯历史五大伪豪门:欧洲中国队上榜,第五名令人意想不到世界杯历史上总有那么一些球队,你听上去好像名气还可以,虽然是一支什么传统劲旅,但是你仔细一看他的履历实在惨不忍睹,甚至沦为了被...
- 水果先生加盟怎么样?能够抢占大市场吗?水果先生,凭着浓郁的口感,吸引了不少人,商机火爆。如今上班族、学生一族在休闲时候都会喝上饮品,他们就成了饮品的忠实消费者。水果...
- 杂牌电视机都有哪些杂牌电视机包括以下几种类型: 液晶电视:这是目前市场上最主流的电视机类型,具有画质清晰、色彩鲜艳、操作简单、价格实惠等特点。一些...
- 微信为什么会自动退出在日常使用微信的过程中,许多用户可能会遇到微信自动退出的情况。这不仅影响了用户的正常使用体验,还可能造成聊天记录等重要信息的丢...
- 出自《论语》的成语大全:出自论语的成语有哪些《学而篇第一》 1-1、【学而时习之】——学过的内容要经常复习它。《论语·学而》(1·1):“子曰:'学而时习之,不亦说乎!” 1-2、【不亦乐乎...
- 丹麦国家队大名单-丹麦国家队阵容-丹麦欧洲杯夺冠之路丹麦国家男子足球队成立于1889年,现任主教练为阿格·哈雷德。1992年瑞典欧洲杯,由于南斯拉夫发生了内战丹麦取代了南斯拉夫晋级决赛圈。丹...
- 新手玩家如何选门派?《神武4》电脑版法系门派轻松入门!《神武4》电脑版共有13个门派,每个门派特色鲜明,并有着不同的定位,很多新手玩家在进入游戏后,不知道该选择哪个门派。作为一个过来人...
- 有关微内核OS史上最透彻一篇本文由知名博主Dog250投稿Linux阅码场原创发表。 - Dog250 华为鸿蒙OS发布已经一周了,在这一周中发生了很多事情,有人对华为路转粉,也有人对...
- 手机电车充电app排行榜TOP10推荐联桩app 2023-12-02 安卓手机 iOS 高陆通 2021-06-22 安卓手机 e城通app 2023-10-18 安卓手机 充电吧app 2024-12-13 安卓手机 iOS 云智充app 2023-11-17 安卓手机 iOS ...