代码之家  ›  专栏  ›  技术社区  ›  tandem

从python中的一个大(40GB)tar文件一次访问一个文件

  •  -1
  • tandem  · 技术社区  · 5 年前

    我正试图接近一个大的柏油球( tar.gz )在python中。tarball包含多个 mp3 wav 文件夹。我想单独阅读每个文件并做我想做的处理。

    我确实看到了这里提供的一些建议: this this

    在此方面的任何帮助都将不胜感激。

    1 回复  |  直到 5 年前
        1
  •  0
  •   He3lixxx KevinH    5 年前

    你可以用 TarFile.extractfile 在归档文件中的每个文件上获取一个缓冲读取器,而不解压缩其他文件。

    import tarfile
    
    with tarfile.open("test.tar.gz") as archive:
        for member in archive:
            file_obj = archive.extractfile(member)
            print(file_obj)