![]() |
1
1
有几件事需要注意。虽然这不太可能解决你的问题,但评论起来太多了。首先,你确定数据包数据是依赖时间的吗?当我想到网络流量时,我不确定数据包
通常,编码器/缩放器不适合整个数据,只适合训练数据。对IP地址进行标签编码也不是一个好主意。如果稍后出现一个全新的IP地址怎么办?你不会有标签的。
其次,对于时间序列数据,正常的列车测试分割是不可行的。训练数据永远不应该在时间尺度上的测试数据之后,通过随机的训练测试分割,你会得到这一点。看看sklearns TimeSeriesSplit . 对于网络,请查看 this answer 关于ReLU激活。虽然它通常是一个很好的激活函数,但我不确定它是否能很好地与LSTM配合使用。你应该测试一下。您还可以将测试数据用作验证和测试数据。不要。 至于您的数据不平衡问题,请研究类的欠采样/过采样或加权(如已完成 here ). 我认为对于时间序列数据,您应该查看过采样不足的目标类。 |
![]() |
Seán Healy · LSTM或变压器模型是否有任何可逆实现? 1 年前 |
![]() |
leone · ValueError:输入数据应为非空 1 年前 |
![]() |
Thắng Ngô Äức · 为什么我的LSTM预测不正确 1 年前 |
![]() |
Python · 如何训练LSTM架构来预测数字序列? 1 年前 |
![]() |
GENERALE · 协议预测实现中的LSTM/GRU模型准确性问题 1 年前 |