代码之家  ›  专栏  ›  技术社区  ›  Anonymous Person

无法读取拼花文件

  •  0
  • Anonymous Person  · 技术社区  · 6 年前

    parquet 文件,我遇到了很多问题。

    我被抛出一个错误 OSError: Passed non-file path: \datasets\proj\train\train.parquet 每次我试图创造一个 df

    pq.read_pandas(r'E:\datasets\proj\train\train.parquet').to_pandas() 以及 od = pd.read_parquet(r'E:\datasets\proj\train\train.parquet', engine='pyarrow')

    我还更改了数据集所在驱动器的驱动器号,这是一样的!

    所有的引擎都是一样的。

    0 回复  |  直到 6 年前
        1
  •  8
  •   Uwe L. Korn    6 年前

    import pandas as pd
    
    with open(r'E:\datasets\proj\train\train.parquet', 'rb') as f:
        df = pd.read_parquet(f, engine='pyarrow')
    
        2
  •  0
  •   Udi Yosovzon    5 年前

    试着用fastparquet做引擎,对我有用。

    engine = "fastparquet"
    
    推荐文章