![]() |
1
2
这个问题的正确答案是,在逻辑回归中不应删除截距。修正警告信息而不修正模型的错误规范是不合适的做法。 在正确完成的逻辑回归中,当存在完美分离(完全解释手头数据样本中的类成员关系的预测因子组合)时,该错误消息可能会出现,并且存在处理该现象的成熟方法,例如 this page . 然而,在逻辑回归模型中删除截距是不合适的。看见 this page Cross Validated https://stats.stackexchange.com/questions/11109/how-to-deal-with-perfect-separation-in-logistic-regression 其中包括很多建议。 |
![]() |
2
0
我会尽力回答这个问题。 警告是什么意思? 什么时候会发生这种情况? 根据我的经验,这种情况最常发生的情况是包括因素(或虚拟变量)的情况,在一个类别中只观察到一个结果。当交互作用包含在多个层次的因素中,且用于分析的数据有限时,这种情况最为常见。 类似地,如果与观测值的数量相比,有许多变量(将使用的变量、交互转换等作为单个变量进行计数,因此总数将是所有这些变量的总和),则可能出现类似的图像。在您的情况下,如果您有因子,删除截距将为每个因子添加1级,这可能会降低概率边缘情况0和1附近的精度。 简言之,如果我们的部分数据没有(或几乎没有)不确定性,那么这个警告将给我们一个指示。
我可以忽略它,否则我如何修复它?
这取决于手头的问题和问题的规模。有几个来源,比如
John Fox
可能会考虑这些观测值可能出现的异常值,并且有很好的论证表明,在使用影响措施后,去除这些异常值。
是这些模型类型主题的可靠来源。在遵循统计中的一般理论和指导原则的同时,问题变成了“我的模型是否正确指定?”、“它对我的模型的影响有多严重?”和“你在工作中可以做多少事?”。 |