![]() |
1
4
我认为答案取决于你的特征。 用填充缺少的数据 expectation maximization (EM)
更正式一点说,如果你在性别列中有一个缺失值,但你有一个工资值,EM告诉你P(性别=男性|工资=w0,θ),即在给定工资=w0和θ的情况下,性别为男性的概率,θ是通过最大似然估计获得的参数。 更简单地说,这可以通过运行性别对工资的回归(使用逻辑回归,因为y变量是分类的)来实现,从而为您提供上述概率。 视觉上:
(这些完全是附加值,但传达了男性工资分配通常高于女性的想法)
不要归咎于 如果这两个特征之间没有关系,并且您认为丢失的数据可能不是随机丢失的。 |
![]() |
July · 如何定义数字间隔,然后四舍五入 1 年前 |
![]() |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
|
Ashok Shrestha · 需要追踪特定的颜色线并获取坐标 1 年前 |
![]() |
Nicote Ool · 在FastApi和Vue3中获得422 1 年前 |
|
Abdulaziz · 如何对集合内的列表进行排序[重复] 1 年前 |
![]() |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |