![]() |
1
0
由于您没有指定树的最大深度,因此它会一直增长,直到您拥有所有纯节点。因此,在训练集上进行过度拟合和校正/期望具有100%的精度(如果节点的最小样本数不太大,则更高)是很自然的。 这个事实在训练场上不是很有见地。 事实上,你在测试集上有一个“如此好的”准确性,这确实可以指出训练/测试集分布的相似性(如果它们是从同一现象中提取的,那么它是预期的一个点),并且树具有某种程度的泛化性。 作为一般规则,我会说,从一个结果推断结论是错误的,当训练集是过度适合。此外,考虑到0.69的精度,“良好”的精度是相对于手头的问题。在许多应用中,训练集和测试集之间30%的差异可能是一个巨大的差距。 为了更好地理解您的问题和更健壮的结果,最好使用交叉验证方法和随机林。 |