我有一个客户想要在他们的EMR Spark集群上使用Tableau。
文档看起来很简单,但是当我尝试连接时会出错。
设置如下:
-
emr cluster的master没有公共IP,但通过Tableau桌面EC2实例,我可以ping和
telnet
进入港口10001
thrift
正在运行
-
我可以测试
节俭
具有
beeline
它连接得很好
-
我没有使用ssl或身份验证,因为群集具有限制访问权限。
-
我已经安装了data direct 8.0和simbaodc
我在用
emr-5.13.0
Hadoop发行版是Amazon2.8.3,Spark版本是2.3.0。
错误是
Unable to connect to the ODBC Data Source. Check that the necessary drivers are installed and that the connection properties are valid.
[Simba][ThriftExtension] (5) Error occurred while contacting server: No more data to read.. This could be because you are trying to establish a non-SSL connection to an SSL-enabled server.
Unable to connect to the server "IP". Check that the server is running and that you have access privileges to the requested database."
我只是简单地按照Tableau提供的文档进行操作,该文档说只安装驱动程序(不要弄乱ODBC),然后将其放到Tableau中。在尝试连接之前,我已经验证了我没有设置任何SSL和身份验证。我还通过运行数据报和从TableauEC2实例执行查询进行了验证,该实例按预期工作。