代码之家  ›  专栏  ›  技术社区  ›  Raaj

R:两个随机变量的列联表

  •  1
  • Raaj  · 技术社区  · 11 年前

    我有两个Beta变量 B1(8,5) B2(4,7) 我为他们每个人生成了1000个样本。

    如果我必须使用双向列联表来测试两组样本的独立性,

    1) 使用应急表是否合适?

    2) 有没有正确的方法?

    (我创建了一个频率表,但我看到的只是这一点——X的所有样本都按行排列,Y的所有样本按列排列,每个单元格中都写有0)

    1 回复  |  直到 11 年前
        1
  •  1
  •   Henry    11 年前

    Beta随机变量可以连续取值0到1。因此,一个简单的应急表没有多大意义。

    你可以查看协方差,或者一个图表,或者数据的bin,然后查看一个列联表。也许是这样

    > set.seed(1)
    > B1 <- rbeta(1000, shape1=8, shape2=5)
    > B2 <- rbeta(1000, shape1=4, shape2=7)
    > cov(B1,B2)
    [1] 0.0003400774
    > plot (B1,B2)
    > CT <- table(cut(B1,4), cut(B2,4))
    > print(CT)
    
                    (0.0518,0.246] (0.246,0.44] (0.44,0.635] (0.635,0.829]
      (0.214,0.401]             15           30           11             3
      (0.401,0.587]             77          173           83            12
      (0.587,0.774]            106          231          126            20
      (0.774,0.96]              25           54           30             4
    > chisq.test(CT)
    
            Pearson's Chi-squared test
    
    data:  CT 
    X-squared = 2.4747, df = 9, p-value = 0.9816
    
    Warning message:
    In chisq.test(CT) : Chi-squared approximation may be incorrect