代码之家 › 专栏 › 技术社区 › student_R123

关于R中自举回归中的剩余存储

simulation regression r

student_R123 · 技术社区 · 7 年前

我试图通过从原始样本中重新抽样X和Y来进行自举回归。我采用了更为手动的方法(不使用任何包) 这是我迄今为止的工作,

set.seed(326581)
X1=rnorm(10,0,1)
Y1=rnorm(10,0,2)
data=data.frame(X1,Y1)

lst <- replicate(
  100,
  df.smpl <- data %>% sample_n(10, replace = T),
  simplify = FALSE)

该列表包含100个样本,其中每个样本有2列(x,y),样本大小为10。这些是引导程序示例。

为了得到引导残差,我将x和y列分为两个单独的数据帧,如下所示:

new1=data.frame(lapply(lst, `[`, 'X1'))

new2=data.frame(lapply(lst, `[`, 'Y1))

之后,我尝试用下面的代码存储每个模型的残差,

res=c()
for(i in 1:100)
{
 res[i]=residuals(lm(new2[,i]~new1[,i]))
}

但似乎有问题。有人能帮我弄明白吗?

顺便问一下,还有比这更简单的方法吗?

1 回复 | 直到 7 年前

Maurits Evers 7 年前

list lapply sapply

res <- lapply(lst, function(df) residuals(lm(Y1 ~ X1, data = df)))

lm(Y1 ~ X1) data.frame lst

length(res)
#[1] 100

lm 10x100 matrix

res <- sapply(lst, function(df)
    residuals(lm(Y1 ~ X1, data = df))) 
dim(res)
#[1]  10 100

# Add residuals and weights to lst
lst <- lapply(lst, function(df) {
    df$res <- residuals(lm(Y1 ~ X1, data = df));
    df$weights <- 1 / fitted(lm(abs(res) ~ X1, data = df))^2;
    df;
})

# Return 2nd coeffficient of weighted regression
coeff <- lapply(lst, function(df)
    coefficients(lm(Y1 ~ X1, data = df , weights = weights))[2])

推荐文章

Shawn Hemelstrand · 如何在ggplot中的许多回归线中为一条特定回归线上色以匹配注释?

3 年前

Arvind Sharma · 在R中编写一个用于回归的循环,替换自变量进行稳健性检查

3 年前

krassowski · 如何将'VGAM::cumulative'包装到助手函数中('object not found'问题)?

3 年前

Nazanin · CNN模型的核尺寸

3 年前

Anna Carolina de RoldÃ£o · R中的错误消息:错误`[.data.frame`(m,labs):选择了未定义的列

3 年前

D. Smel · 如何在线性模型的两侧生成对数函数

7 年前

MTT · 最适合散点图的回归

7 年前

santobedi · scikit学习中的多输出高斯过程回归

7 年前

Ben · FELM+Stargazer-将工具变量估计与OLS对齐

7 年前

Anx8 · minepy:缓冲区的维度数错误

7 年前