![]() |
1
2
假设行数足够大,大#定律可以生效,并且不需要精确到1%(只是非常接近),可以执行以下操作:
这将顺序扫描整个文件一次,以获得行,但它不会保留在内存中的整个文件。它将一行一行地迭代,并且只在内存中保留随机选择的~1%的行。如果您不想将文件加载到内存中,也不想先扫描它以计数行,那么这可能是最好的方法。
如果您确实需要它正好占行数的1%,并且/或者需要它也适用于较小的文件,那么您可以扫描该文件一次,以计算文件中的总行数
|
![]() |
2
0
例如
|
![]() |
Cam · Pandas列表日期到日期时间 3 月前 |
![]() |
Bijan · Pandas批量更新帐户字符串 4 月前 |
![]() |
Kernel · 进入熊猫的定义。系列super().reindex 5 月前 |
|
adventurous_chip_55 · 如何引爆柱子 5 月前 |
![]() |
RKIDEV · Panda迭代行并将第n行值乘以下一(n+1)行值 5 月前 |