代码之家  ›  专栏  ›  技术社区  ›  Ryan Fox

我如何计算这些统计数字?

  •  13
  • Ryan Fox  · 技术社区  · 16 年前

    我正在编写一个应用程序来帮助促进一些研究,其中的一部分涉及到做一些统计计算。现在,研究人员正在使用一个叫做 SPSS . 他们关心的部分输出如下所示:

    [Part of the SPSS output

    他们只关心 F Sig. 价值观。我的问题是,我没有统计方面的背景,我不知道这些测试叫什么,也不知道如何计算它们。

    我想 f 值可能是 F-test 但是在遵循维基百科上给出的步骤之后,我得到了一个不同于 SPSS 给予。

    6 回复  |  直到 9 年前
        1
  •  4
  •   Haacked    16 年前

    This website 可能对你有更多帮助。阿尔索 this one .

    我正在一个统计课程的记忆中工作,但是什么都没有:

    在进行方差分析(ANOVA)时,实际上是根据“组间”的均方方差和“组内”的均方方差计算f统计量。上面的第二个链接对于这个计算似乎很好。

    这使得F统计量精确地度量模型的强大程度,因为“组间”方差是解释力,“组内”方差是随机误差。高F意味着一个非常重要的模型。

    和许多统计操作一样,您返回确定SIG。使用F统计。在这里,你的维基百科信息稍微方便一些。你要做的是-利用SPSS给你的自由度-找到适当的p值 F table 会给你计算出的F统计量。出现这种情况的p值[f(表)=f(计算值)]是显著性。

    从概念上讲,较低的显著性值显示了非常强的拒绝无效假设的能力(这就意味着确定模型具有解释力)。

    如果有错的话,对数学界的人道歉。我要回去做编辑!!!!

    祝你好运。统计数据很有趣,可能不是这部分。=)

        2
  •  3
  •   Henry Mahncke    16 年前

    我假设从您的问题上,您的研究同事希望自动化执行某些统计分析的过程(即,他们希望批量处理数据集)。您有两种选择:

    1)spss现在可以通过python编写脚本(从版本15开始)-转到spss.com并搜索python。您可以编写python脚本来自动进行数据分析并从透视表中提取键值,然后以您喜欢的任何方式处理答案。这有一个优点,即允许在Python脚本的结果和合作者的SPS中手工计算的结果之间进行精确的比较。因此,您不必真正了解任何统计数据来完成这项工作(这是一个关键优势)

    2)您可以在R(一个自由的统计环境)中这样做,这可能是脚本化的。这有一个缺点,那就是你必须学习统计数据以确保你做的正确。

        3
  •  2
  •   Grey Panther    16 年前

    统计数字很难。经过一年的阅读和重新阅读书籍和论文,我只能自信地说,我非常了解它的基础。

    您可能希望为您使用的任何编程语言调查现成的库,因为它们在数学和统计学上都是很常见的(舍入错误是一个明显的例子)。

    举个例子,你可以看看 the R project 这是一个交互式环境和一个库,您可以从C++代码中使用,它在GPL下分发(即,如果您只在内部使用它,只发布结果,则不需要打开代码)。

        4
  •  2
  •   leif    16 年前

    简而言之:不要手动操作,链接/使用现有软件。Sain-Grocen的回答是错误的。:。(

    这些都是对参数估计重要性的检验,通常用于多变量响应多元回归。在统计编程环境之外,这些不是简单的事情。我建议要么从一个预先存在的统计程序中获取输出,要么使用一个可以链接并使用该代码的程序。

    恐怕第一个答案(sain ou grocen's)会引导你走上错误的道路。他的解释很可能是你实际处理的一个特殊情况。在他的链接中解释的方差分析是一个单变量响应,在一个平衡的设计中。这些不是你看到的F统计数据。输出中的名称(Pillai的跟踪,Hotelling的跟踪,…)是一些可用的多变量版本。它们在某些假设下具有F分布。我不能在这里解释一本有价值的教材,我建议你先看一下 Johnson和Wichern的“应用多变量统计分析”

        5
  •  0
  •   Gregg Lind    16 年前

    你能解释一下为什么SPSS本身不能很好地解决这个问题吗?它是否生成数据透视表作为难以操作的输出?这是项目的成本吗?

    F-统计可以由任何数量的特定测试产生。f只是一个分布(不严格地说,是对值组“频率”的描述),比如正态分布(高斯分布)或均匀分布。一般来说,它们是由方差比产生的。意见:许多统计学家(包括我自己)发现基于F的测试是不稳定的(行话:非- 稳健的 )

    特定的输出统计数据(Pillai的跟踪等)表明原始分析是一个manova示例,正如其他海报所描述的那样,这是一个复杂的、难以得到正确的过程。

    我也猜,基于马诺瓦和SPSS的使用,这是一个心理学或社会学项目…如果没有,请开导。可能其他更简单的模型实际上更容易理解,也更容易重复。如果有,请咨询当地大学的统计咨询小组。

    祝你好运!

        6
  •  0
  •   Barry DeCicco    15 年前

    以下是关于Manova Ouptput的一个很好的统计和SPSS网站的解释:

    带解释的输出: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

    如何和为什么进行manova或多变量GLM: (与上述路径相同,但以'/manova.htm'结尾)

    从头开始编写计算这些输出的软件既冗长又困难; 有很多数值问题和矩阵反演要做。

    正如亨利所说,使用python脚本,或者R。我建议与了解spss if脚本的人合作。 此外,SPSS本身能够使用OMS将输出表导出到文件中。 SPSS中的脚本可以做到这一点。

    找出你的研究小组中谁认识SPS并与他们合作。