![]() |
1
59
如果您有一个数据帧,其中一些列是数字的,而另一些列是其他的(字符或因子),并且您只想对数字列进行相关性,那么可以执行以下操作:
但是
|
![]() |
2
15
对于数值数据,你有解决方案。但这是绝对数据,你说。然后生活变得更加复杂… 首先,两个分类变量之间的关联度不是用斯皮尔曼秩相关来衡量的,而是用卡方检验来衡量的。实际上这是逻辑。排名意味着你的数据有一定的顺序。现在告诉我哪个更大,黄色还是红色?我知道,有时R的确在分类数据上执行斯皮尔曼秩相关。如果我将黄色1和红色2编码,r会认为红色大于黄色。 所以,忘记斯皮尔曼的分类数据。我将演示chisq测试以及如何使用combn()选择列。但是你会从更多的时间里受益于Agresti的书: http://www.amazon.com/Categorical-Analysis-Wiley-Probability-Statistics/dp/0471360937
然后你应该得到:
其中v1和v2表示它在哪些变量之间移动,“out”表示关联的p值。这里所有的变量都是独立的。正如我随机创建的数据一样,这是您所期望的。 |
![]() |
3
2
我找到了一个更简单的方法,通过查看crash生成的r脚本。如下所示:
|