代码之家  ›  专栏  ›  技术社区  ›  asdf

使用Pig从文件中获取第二条记录

  •  0
  • asdf  · 技术社区  · 8 年前

    我的数据如下:

    (Alicia,2,Maths,Chemistry,Physics)
    (Mac,2,Maths,Chemistry,Botany)
    (Hardik,6,Maths,Chemistry,Zoology)
    (Maneesh,9,Hindi,Chemistry,Physics)
    

    我想建立一个只包含第二个记录数据的关系,(Mac,2,数学,化学,植物学),然后我想执行进一步的运算。 我尝试使用LIMIT命令,但我会得到一些记录,而不是特定的记录。

    2 回复  |  直到 8 年前
        1
  •  0
  •   nobody    8 年前

    使用筛选器获取特定记录。假设您与样本数据集有关系a,那么下面的Pig语句将为您获取您要查找的记录。

    B = FILTER A BY (A.$0 == 'Mac');
    
        2
  •  0
  •   Joseph M. Dion    8 年前

    这可能会起作用。

    a = load '<your data>';
    b = rank a;
    c = filter b by $0 == 2;
    

    希望这有帮助!