您当前的位置:首页 > 计算机 > 编程开发 > Other

在 Tachyon 上启动和运行 Shark

时间:12-14来源:作者:点击数:

Shark 0.7 增加了一种新的存储格式来支持高效地从 Tachyon 读取数据,从而实现跨 Shark 实例的数据共享和隔离。我们的聚会 幻灯片 很好地概述了使用 Tachyon 缓存 Shark 表的好处。总结起来,主要有以下四点:

  • 跨多个 Shark 实例的内存数据共享(即更强的隔离)
  • 即时恢复内存表
  • 减少堆大小 => 在 shark 中更快的 GC
  • 如果表大于内存大小,只有热列会缓存在内存中

设置

Shark / Tachyon 兼容性: Shark 0.7.x 可与 Tachyon 0.2.1 配合使用,Shark 0.8.1 可与 Tachyon 0.3.0 配合使用,Shark 0.9.0 可与 Tachyon 0.4.0 配合使用。更多 Tachyon 相关信息,请访问 Tachyon 网站

为了在 Tachyon 上使用 Spark,您需要先设置 Local Mode 或 Cluster Mode

然后,编辑 shark-env.sh 并添加

export TACHYON_MASTER="tachyon://TachyonMasterHost:TachyonMasterPort"export TACHYON_WAREHOUSE_PATH=/sharktables

在 Tachyon 中缓存 Shark 表

指定 TBLPROPERTIES(“shark.cache” = “tachyon”),例如:

CREATE TABLE data TBLPROPERTIES(“shark.cache” = “tachyon”) AS SELECT a, b, c from data_on_disk WHERE month=“May”;

指定以 _tachyon 结尾的表名,例如:

CREATE TABLE orders_tachyon AS SELECT * FROM orders;

在 Tachyon 中创建表后,您可以像查询普通表一样查询它。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
    无相关信息
栏目更新
栏目热门
本栏推荐