|
|
1
54
你很困惑,这是可以理解的。那份文件很糟糕。我不得不回到论文的基础上(Hyndman,R.J.;Fan,Y.(1996年11月)。统计包中的样本分位数”。 美国统计学家 50(4):361“365。 doi:10.2307/2684934 )为了得到理解。让我们从第一个问题开始。
第一部分直接来源于论文,但文献作者遗漏了
而且,最后一句话是错误的。它应该阅读
至于
这真是令人困惑。文件要求的内容
至于最后一位,r只是说明s的用途。 原始文件给出了6个“样本分位数”函数的理想属性列表,并说明了对8的偏好,该偏好满足所有的1。#5满足了所有的人,但他们不喜欢其他的理由(这比从原则中衍生出来的现象学更多)。#2是像我这样的非统计的极客认为的分位数,是维基百科描述的。 btw,响应 dreeves answer Mathematica做的事情明显不同。我想我理解地图。虽然Mathematica更容易理解,(a)用无意义的参数射自己的脚更容易,(b)它不能做R的算法2。(这里是 Mathworld's Quantile page 表示Mathematica不能做2,但给出了所有其他算法在四个参数方面的简单概括。) |
|
|
2
5
当你给它一个向量,并且没有已知的CDF时,计算分位数的方法有很多种。 考虑这样一个问题:当你的观察结果不完全落在分位数上时,该怎么做? “类型”只是决定如何做到这一点。因此,这些方法说,“在k阶统计量和p(k)之间使用线性插值”。 那么,P(k)是什么?一个人说,“嗯,我喜欢用K/N”。另一个人说,“我喜欢使用(k-1)/(n-1)”等。这些方法中的每一个都有不同的属性,更适合于一个或另一个问题。 α和β只是参数化函数p的方法。在一种情况下,它们是1和1。在另一种情况下,它们是3/8和-1/4。我不认为P在文档中是常量。它们并不总是显式地显示依赖关系。 看看当你输入向量1:5和1:6时,不同类型会发生什么。 (还要注意,即使您的观察值正好落在分位数上,某些类型仍将使用线性插值)。 |
|
|
RSW · Python-检查序列中的最后一个值是否相对高于其余值 1 年前 |
|
|
mayen · Z-Score作为差异值的度量 1 年前 |
|
|
John Philips · Python中的重命名函数 1 年前 |
|
|
Yneedtobeserious · 给定的数据点,形成它们的关系 1 年前 |
|
|
Idan Hazan · 转换总和为1的列表并保持值之间的关系[重复] 1 年前 |
|
|
Jimmy3421 · 为什么pd.cut会产生NaN值 2 年前 |
|
|
JoRayMe · 有没有办法从数据数组中识别浮点数中的小数位数? 2 年前 |