Chapter 6 生存分析

6.1 生存分析基本过程介绍

生存数据分析也离不开描述——差异性分析——影响因素分析

  • 描述生存时间的分布特点:计算中位生存时间绘制KM曲线计算发病密度

  • 比较生存过程:logrank检验

  • 探讨生存过程的影响因素:COX回归(批量单因素、先单后多、逐步回归)

以上所有功能,风暴统计平台都可以一站式实现,菜单式操作,简洁快速!支持图片色彩、字体等自定义修改,可达到论文发表级别!

6.2 生存曲线

6.2.1 绘制生存曲线

6.2.1.1 生存曲线变量选择

根据界面提示,分别选入结局变量、时间变量、分组变量。

这里结局变量,建议以0和1进行赋值,0代表删失事件,1代表死亡事件。

注:尽量不要以1和2代表或者赋值颠倒(如:0代表死亡、1代表删失)。

变量选择完毕后,界面直接显示出原始情况下的KM曲线。

6.2.1.2 中位生存时间的计算方法

这里给出了5种计算方法,但是结果都大同小异,大家可以按需选取。

另外,风暴统计平台支持多种组件的自定义设置,包括生存曲线设置、坐标轴和标签设置、P值设置、风险表设置、生存曲线下载设置,下面进行一一介绍。

6.2.2 KM曲线自定义设置

6.2.2.1 生存曲线图设置

  • KM曲线置信区间:TRUE或FALSE,是否显示置信区间,默认情况下是不显示的

  • 绘制累计率曲线:TRUE或FALSE,是否绘制累计率曲线,在按照0删失,1死亡的赋值编码,累计率曲线是自左下至右上,呈上升趋势,而生存曲线是自左上至右下,呈下降趋势

  • 图形配色方案:平台共提供了9种配色方案,满足多样化选择

  • 显示删失标记:TRUE或FALSE,默认为TRUE,删失个案会以+在曲线上展示

  • 曲线类型:实线或虚线,默认为实线,可以按需选择

  • 中位生存时间:none、hv、h、v,默认为none,h代表显示y轴对应坐标,v代表显示x轴对应坐标。

根据上方调整后,基础KM曲线已经发生了变化,见下图:

6.2.2.2 坐标轴和标签设置

x轴间隔:默认为6个单位为间隔,如果随访时间最大值与最小值的差值过大,也可以增大间隔,使图片简洁美观

x轴/y轴标题:如需修改标题,可以在框中填写,目前平台只能显示英文,标点括号也要是英文格式哦

变量标签:同样只能修改为英文标签,如需修改变量赋值(如使1代表male,2代表female),可以在”数据整理”模块的分类变量值标签设置处更改

时间单位:根据数据需要,可以修改为day、week、month、year

y轴最小值:如果生存曲线主要分布在坐标轴的上半部分,为了图片美观,可以使y轴从任意位置开始显示,减少留白


6.2.2.3 P值设置

是否显示P值:TRUE或FALSE或自定义P值的内容,输入框内填写的内容会增加在Log rank P的后面。

P值字体大小:0到20号字体,可以自定义调整

P值位置:可以根据x轴,y轴协同调整。

6.2.2.4 风险表设置

显示风险表:TRUE或FALSE,是否显示风险表,默认不显示

6.2.2.5 生存曲线下载设置

曲线页面:默认为A4大小,也可以自定义长度和宽度

保存的类型:支持pdf、jpeg、png、tiff

中文字体:有或无,目前平台还无法展示中文,因此这一步暂时没有太大用处

6.3 COX比例风险模型

6.3.1 自变量筛选

首先选入变量,包括生存结局变量、生存时间变量、定量自变量、分类自变量。

其次,选择自变量的筛选方式,包括P阈值,回归方法。

P阈值决定了单因素分析时,P值小于多少会进入多因素回归,一般为0.05,在变量过少时,也可以放宽要求,0.1,0.2也是有的。

回归方法有先单后多(选”否”),双向逐步回归,向前逐步回归,向后逐步回归,根据P<0.05筛选。

6.3.2 开展先单后多方法分析

根据研究需要,如果需要开展先单后多的自变量筛选方式,那么“是否开展逐步回归分析”选择”否”。P阈值自行选择,当选择不限制时,选入的全部变量都将纳入多因素回归分析。

6.3.3 开展逐步回归方法分析

逐步回归方法,平台也提供了多种选择:双向逐步回归,向前逐步回归,向后逐步回归以及考虑到有时P值大于阈值的变量在逐步回归时也会留在模型中,新增了根据P<0.05的原则开展逐步回归

注:先单后多与逐步回归是两种不同的自变量筛选方式,先单后多主要根据单因素P阈值进行筛选;逐步回归则是通过变量的逐个纳入与剔除,以AIC值最小作为最优模型选择准则。因此有些变量P值大于预设的阈值但仍保留在逐步回归模型中也是正常的哦,想要避免这种情况的发生,可以选择”根据P<0.05筛选”的逐步回归!

6.3.4 下载结果

平台给出了多种结果展示,仅展示单因素回归结果仅展示多因素回归结果单因素+多因素显示在同一张表格中!


然后也可以选择小数位数,在默认情况下,P值为3位小数,其他统计量为2位小数。指定小数位数后,P值与统计量的小数位数将会统一。调整完成后,下载最终的三线表结果!

6.3.5 查看R语言分析源码

目前风暴统计平台还会给出R语言输出结果,方差膨胀因子(VIF)。

这里简单解释一下方差膨胀因子:方差膨胀因子是检验自变量间共线性问题的常用方法,如果自变量间共线性过强,会导致分析结果不稳定,还可能出现回归系数的符号与实际情况完全相反的情况。