我对tsfresh输入格式感到困惑。我可以为不同的id提供缺少值的数据帧吗?例如,时间序列1 {t0: 1, t2: 4, t5: 1} 时间序列2 {t1: 5, t2: 2} .我应该用0填充缺失的值(t1、t3等)吗? 提前感谢
{t0: 1, t2: 4, t5: 1}
{t1: 5, t2: 2}
tsfresh 不“关心”数据的时间条目。它的大多数特征计算器不需要有固定的时间间隔(例如,无论我们谈论的是哪个时间戳,时间序列的平均值仍然是相同的)。所以,是的,从技术上讲,不同的id可以有不同的时间。
tsfresh
也就是说,一些特征计算器确实依赖于时间戳并具有适当的时间间隔(例如傅里叶变换)。然而,对于如何填补这些缺失的值,存在许多不同的方法,这需要大量的领域知识。这就是为什么 tsfresh 不会“自动”执行此操作。然而,许多库(如pandas)为此提供了许多可能性,例如使用重采样方法。