代码之家  ›  专栏  ›  技术社区  ›  Brian

不能在EMR火花簇上使用Tableau

  •  0
  • Brian  · 技术社区  · 7 年前

    我有一个客户想要在他们的EMR Spark集群上使用Tableau。

    文档看起来很简单,但是当我尝试连接时会出错。

    设置如下:

    1. emr cluster的master没有公共IP,但通过Tableau桌面EC2实例,我可以ping和 telnet 进入港口10001 thrift 正在运行
    2. 我可以测试 节俭 具有 beeline 它连接得很好
    3. 我没有使用ssl或身份验证,因为群集具有限制访问权限。
    4. 我已经安装了data direct 8.0和simbaodc

    我在用 emr-5.13.0 Hadoop发行版是Amazon2.8.3,Spark版本是2.3.0。

    错误是

    Unable to connect to the ODBC Data Source. Check that the necessary drivers are installed and that the connection properties are valid.
    
    [Simba][ThriftExtension] (5) Error occurred while contacting server: No more data to read.. This could be because you are trying to establish a non-SSL connection to an SSL-enabled server.
    
    Unable to connect to the server "IP". Check that the server is running and that you have access privileges to the requested database."
    

    我只是简单地按照Tableau提供的文档进行操作,该文档说只安装驱动程序(不要弄乱ODBC),然后将其放到Tableau中。在尝试连接之前,我已经验证了我没有设置任何SSL和身份验证。我还通过运行数据报和从TableauEC2实例执行查询进行了验证,该实例按预期工作。

    1 回复  |  直到 7 年前
        1
  •  0
  •   Brian    7 年前

    通过忽略文档并设置ODBC驱动程序,然后选择它而不是SparkSQL作为源,解决了这个问题。

    推荐文章