代码之家  ›  专栏  ›  技术社区  ›  Felipe

我可以在Raspberry Pi上运行Apache Drill并发现查询计划的物理成本吗?

  •  0
  • Felipe  · 技术社区  · 7 年前

    https://www.youtube.com/watch?time_continue=14&v=0rurIzOkTIg )这意味着我可以在集群的节点上安装DrillBit,而演练引擎将评估执行查询的最佳物理计划。那我就可以跑了 explain plan https://drill.apache.org/docs/query-plans/ )我将看到drill在哪里决定是否在内存中进行数据局部性处理,以及其他成本决定。这是我在读的另一篇参考文献( Apache Drill vs Spark ).

    我还看到Drill有一个用于文件系统的插件。所以我想象我可以在3台计算机上安装Drill并在它们上查询日志文件。

    我想知道是否有可能在具有各种连接(有线、无线、无线电等)的Raspberry Pi上安装Drill,并对这些Pi上的日志文件执行查询。这也是训练的目的吗?

    1 回复  |  直到 7 年前
        1
  •  1
  •   Vitalii Diravka    7 年前

    Drill确实可以从不同的存储中查询日志文件,但我不确定Raspberry Pi的规范是否符合Drill资源要求:

    钻头的默认内存为8G,但根据工作负载的不同,钻头首选16G或更多

    https://drill.apache.org/docs/configuring-drill-memory/

    无论如何,在内存较少的机器上运行钻头是可能的,但它不足以处理大数据集。

    推荐文章