![]() |
1
1
获得数据后,创建一个训练索引。 然后通过再次对数据子集,但减去列车索引来创建测试集。
此外
如果使用时间序列,则
祝你好运 |
![]() |
2
1
有几个软件包可以帮助实现这一点。这个
将数据集中的一列作为第一个参数(通常是响应变量)传递,并在该变量中的值之间按比例分割数据集。如果你有一个可能只有5%的时间出现某个值的响应变量,这很有帮助,你希望你的训练集和测试集在每个值中都有类似的表示。它可以像这样使用:
|
|
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
|
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
|
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
![]() |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
![]() |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |