代码之家  ›  专栏  ›  技术社区  ›  maryvrx

将每晚的平均值与每晚的值进行比较,统计有效性?

  •  1
  • maryvrx  · 技术社区  · 2 年前

    我正在使用网站的数据来研究不同因素在几个晚上对网站退出的影响。我利用日落后的几分钟时间研究蝙蝠离开现场的情况。

    我想看看骚乱前的5个晚上和骚乱后的5个夜晚。我删除了我分析中的干扰之夜(Night0)。

    我的问题是:我可以取我的变量(日落后的分钟数)前5天的平均值(自然变化),然后将其与Night+1、+2、+3、+4和+5的输出进行比较吗? 这在统计上有效吗?

    我犹豫是否使用自日落以来的平均分钟数并将其影响到“之前”因子,或者将之前5个晚上的所有行叠加并将其影响力影响到“以前”因子。

    我希望我的问题很清楚。

    非常感谢您的回复

    1 回复  |  直到 2 年前
        1
  •  1
  •   Alexander Grimaudo    2 年前

    我不会取扰动前夜晚的平均值。我会将原始数据汇集在“扰动前”因子下,然后将其与“夜晚1”、“夜晚2”等汇集的数据进行比较。如果你有多个站点,你需要加入一个随机效果。此外,假设您的响应是在事件发生前几分钟,则需要使用gamma分布。以下是如何在R和lme4中实现这一点的代码:

    library(lme4)
    
    my.data$pool <- relevel(my.data$pool, ref="pre-disturbance")
    #This is setting your model's reference level to the pre-disturbance pooled data. 
    #When you run summary() on the model object, it will compare your daily disturbance 
    #pools directly to the 'pre-disturbance' pool. 
    
    model <- glmer(num.minutes ~ data.pool + (1|site), family=Gamma(link='log'), data=my.data)
    #The model
    
    summary(model)