代码之家  ›  专栏  ›  技术社区  ›  T Richard

卡普兰-迈尔曲线与生成的统计数据不一致

  •  0
  • T Richard  · 技术社区  · 6 年前

    我正在绘制一条Kaplan-Meier(KM)曲线,用于读取R包frailtypack中提供的数据。我使用了这些简单的代码,按性别变量对曲线进行分层:

    library(survival)
    library(frailtypack)
    data(readmission)
    readmission
    sobj<-Surv(readmission$time,readmission$event==1)
    km.plot <- survfit(sobj ~readmission$sex, data = readmission)
    km.plot
    plot(km.plot,lty=c(1,2),lwd=2)
    legend(x="bottomleft",lty=c(1,2),lwd=2, legend=c("Male","Female"))
    

    数据是关于复发事件的(即受试者有多次失败)。“km.plot”的输出告诉我,男性和女性都有大量的审查事件时间。在这种情况下,我希望KM曲线趋于非零生存概率,但女性的KM曲线趋于零。当我只制作了第一个事件的情节,忽略了随后的事件时,我仍然得到这个。

    我认为我的代码可能有问题,但很难找出原因。我非常感谢你的帮助

    1 回复  |  直到 6 年前
        1
  •  1
  •   IRTFM    6 年前

    不要在回归参数之外创建Surv对象,并且不要在不引用数据帧的情况下使用列名。在您的代码中违反这两种实践将阻止–predict–和–plot–方法知道在哪里使用模型对象中的terms属性访问数据元素。

    曲线形状问题:如果最后一个事件是死亡,那么K-M曲线将降为零。

    请解释为什么您认为K-M曲线对于“重复事件”是有意义的?