Chapter 6 生存分析
6.1 生存分析基本过程介绍
生存数据分析也离不开描述——差异性分析——影响因素分析。
描述生存时间的分布特点:计算中位生存时间、绘制KM曲线、计算发病密度
比较生存过程:logrank检验
探讨生存过程的影响因素:COX回归(批量单因素、先单后多、逐步回归)
以上所有功能,风暴统计平台都可以一站式实现,菜单式操作,简洁快速!支持图片色彩、字体等自定义修改,可达到论文发表级别!
6.2 生存曲线
6.2.1 绘制生存曲线
6.2.2 KM曲线自定义设置
6.2.2.1 生存曲线图设置
KM曲线置信区间:TRUE或FALSE,是否显示置信区间,默认情况下是不显示的
绘制累计率曲线:TRUE或FALSE,是否绘制累计率曲线,在按照0删失,1死亡的赋值编码,累计率曲线是自左下至右上,呈上升趋势,而生存曲线是自左上至右下,呈下降趋势
图形配色方案:平台共提供了9种配色方案,满足多样化选择
显示删失标记:TRUE或FALSE,默认为TRUE,删失个案会以+在曲线上展示
曲线类型:实线或虚线,默认为实线,可以按需选择
中位生存时间:none、hv、h、v,默认为none,h代表显示y轴对应坐标,v代表显示x轴对应坐标。
根据上方调整后,基础KM曲线已经发生了变化,见下图:
6.2.2.2 坐标轴和标签设置
x轴间隔:默认为6个单位为间隔,如果随访时间最大值与最小值的差值过大,也可以增大间隔,使图片简洁美观
x轴/y轴标题:如需修改标题,可以在框中填写,目前平台只能显示英文,标点括号也要是英文格式哦
变量标签:同样只能修改为英文标签,如需修改变量赋值(如使1代表male,2代表female),可以在”数据整理”模块的分类变量值标签设置处更改
时间单位:根据数据需要,可以修改为day、week、month、year
y轴最小值:如果生存曲线主要分布在坐标轴的上半部分,为了图片美观,可以使y轴从任意位置开始显示,减少留白
6.3 COX比例风险模型
6.3.1 自变量筛选
首先选入变量,包括生存结局变量、生存时间变量、定量自变量、分类自变量。
其次,选择自变量的筛选方式,包括P阈值,回归方法。
P阈值决定了单因素分析时,P值小于多少会进入多因素回归,一般为0.05,在变量过少时,也可以放宽要求,0.1,0.2也是有的。
回归方法有先单后多(选”否”),双向逐步回归,向前逐步回归,向后逐步回归,根据P<0.05筛选。
6.3.3 开展逐步回归方法分析
逐步回归方法,平台也提供了多种选择:双向逐步回归,向前逐步回归,向后逐步回归以及考虑到有时P值大于阈值的变量在逐步回归时也会留在模型中,新增了根据P<0.05的原则开展逐步回归!
注:先单后多与逐步回归是两种不同的自变量筛选方式,先单后多主要根据单因素P阈值进行筛选;逐步回归则是通过变量的逐个纳入与剔除,以AIC值最小作为最优模型选择准则。因此有些变量P值大于预设的阈值但仍保留在逐步回归模型中也是正常的哦,想要避免这种情况的发生,可以选择”根据P<0.05筛选”的逐步回归!