代码之家  ›  专栏  ›  技术社区  ›  Reddevil

使用Java实现Spark中的类型安全连接

  •  2
  • Reddevil  · 技术社区  · 6 年前

    我有两个数据集,我使用java将它们连接起来,如下所示

    Dataset<Row> joineddata = ds1.join(ds2, col("col1").equalTo(col("col2")), "inner");
    

    谁能告诉我如何使用java以类型安全的方式在apacespark中连接两个数据集。我可以在scala中找到类型安全连接的例子。但是我用java找不到同样的方法。

    有人能给我推荐一个链接或与此相关的东西吗

    1 回复  |  直到 6 年前
        1
  •  0
  •   linehrr    6 年前

    伊莫,我想你到目前为止还做不到。

    scala社区实现了以下目标: https://github.com/typelevel/frameless . 但由于它使用的是Cats,所以很难将其移植到Java中。即使使用这个lib,您也不再处理本机Spark,因此并非所有sparkapi都支持无框架。

    row.getAs 基本上是类型转换,所以RT异常是不可避免的。