天天看点：Iceberg数据治理及查询加速实践

数据治理

Flink 实时写入 Iceberg 带来的问题

【资料图】

在实时数据源源不断经过 Flink 写入的 Iceberg 的过程中，Flink 通过定时的 Checkpoint 提交 snapshot commit 操作到 Iceberg，将已写入到 Iceberg 的数据文件通过 Snapshot 组织暴露出来。如果不对流实时写入 Iceberg 的文件进行治理，久而久之 Iceberg 下的小文件会越来越多，Snapshot 版本也越来越多，查询速度大打折扣。

数据治理方案

基于上述问题，我们需要对 Iceberg 的元数据和数据文件定期进行治理。治理方向主要有俩点：

清理快照合并小文件

因为我们查询引擎用 Trino，于是我们选用 Trino 对 Iceberg 进行优化。Trino-Iceberg Connetor 提供了优化方法：

--清理快照ALTER TABLE testtable EXECUTE removeorphanfiles(retentionthreshold =>"7d")--合并小文件ALTER TABLE testtable EXECUTE optimize(filesizethreshold =>"10MB")

使用 Trino SQL 便可以对 Iceberg 表进行优化，很方便。我们基于 Trino SQL 上，做了一个自动自助的 Iceberg 表优化工具，实现了定时对某个 Catalog 下的表进行优化，省去了人工运维优化的成本。除了快照清理和合并小文件外，Trino 提供了清理无效数据的方法，可以删掉一些已经不被 Iceberg 管理的无用的数据文件。我们是每周对 Iceberg 执行一次无效数据清理。

--清理无效文件ALTER TABLE testtable EXECUTE removeorphanfiles(retentionthreshold =>"7d")

查询加速

我们都知道对 Iceberg Partition 列进行查询速度都很快，因为其过滤掉很多文件，只读取符合查询分区的数据文件。单读到底层的 ORC 数据文件时，Iceberg 提供了 min/max 等数据元信息，通过元信息可以快速得知所找的数据是否在此文件内。

Bloom Filter

在最新的 Iceberg 1.1.0版本中，Iceberg 支持在 ORC 数据文件内设置 bloom filters。而新版 Trino 也跟上 Iceberg 适配 bloom filter，我们需要在 trino-iceberg 的配置文件里配置，来开启 Trino 查询时使用 bloom filter 查询

hive.orc.bloom-filters.enabled = true

除此之外，我们还需要设置 Iceberg 表属性，对列配置上 bloom filter

CREATE TABLE icebergtable ( tokenaddress varchar, fromaddress varchar, toaddress varchar, blocktimestamp timestamp(6) with time zone,)WITH ( orcbloomfiltercolumns = ARRAY["tokenaddress","fromaddress","toaddress"], orcbloomfilterfpp =0.05, partitioning = ARRAY["day(blocktimestamp)"])

因为 bloom filter 是生效于 ORC 文件中，如果想要应用在旧表上，需要将旧表数据重写到新表上，这样底层的数据文件才带有 bloom filter。

举例：

假如我们有一张 tokentransfer 表，表内大概有四个字段

fromaddress 买方地址toaddress 卖家地址tokenaddress 交易代币blocktimestamp 日期

我们对该表 fromaddress、toaddress、tokenaddress 应用 bloom filter，对 timestamp 进行分区。该表每天的数据量假设有100w 条数据。此时有俩类查询过来：

查询热门 token 今天发生的交易

select * from tokentransfer where tokenaddress ="热门token" and blocktimestamp >today

查询冷门 token 今天发生的交易

select * from tokentransfer where tokenaddress ="冷门token" and blocktimestamp >today

此时俩类查询的 bloom filter 产生的效果是不一样的，因为热门的 token 会存在大部分数据文件里，冷门的 token 大概率只存在于少部分数据文件内。对于热门 token，bloom filter 的加速效果不佳，但对于冷门 token，bloom filter 帮助其快速过滤掉了很多数据文件，快速找到有冷门 token 的数据文件，加速效果极佳。所以得到的结论是，bloom filter 对一些不重复，特征值很高的数据有比较好的加速效果。

Order & Z-Order

上文提到，ORC数据文件内有 min/max 值，查询引擎可以根据 min/max 值判断数据是否在此文件内。可是日常在写入 Iceberg 的数据一般都是无序写入的，无序写入会导致每个数据文件也是无序的，不能发挥 min/max 过滤的效果。

Order

Spark 提供了一个压缩文件并排序的方法，可以将无序的文件按指定列排好序。排序策略不仅可以优化文件大小，还可以对数据进行排序以对数据进行聚类以获得更好的性能。将相似数据聚集在一起的好处是更少的文件可能具有与查询相关的数据，这意味着 min/max 的好处会更大（扫描的文件越少，速度越快）。

CALL catalog.system.rewritedatafiles( table =>"db.teams", strategy =>"sort", sortorder =>"team ASC NULLS LAST, name DESC NULLS FIRST")

Z-Order

虽然 Order 排序可以同时对多列进行排序，但其列与列之间的排序是有先后顺序之分的，像是 MySQL 里的联合索引，先对字段A 排序再对字段B 排序。如果只是的查询的谓词只包含字段B，则上述索引失效（先对字段A 排序再对字段B 排序)。而 Z-Order 能解决上面的问题，使用 Z-Order 对多列排序，列与列之间的排序权重相同。所以使用 Z-Order 对多字段进行排序，查询中只要谓词命中了 Z-Order 中其中任何一字段，都能加速查询。Spark 提供了使用 Z-Order 的方法

CALL catalog.system.rewritedatafiles( table =>"db.people", strategy =>"sort", sortorder =>"zorder(heightincm, age)")

差异

我们测试过对100G 的表分别进行 Order 和 Z-Order，命中 Order 最高能带来10倍的性能提升，命中 Z-Order 能带来2 倍的性能提升。粗步得到的结论是，Order 比 Z-Order 大致快2 倍。所以在实践应用上不能盲目选择 Z-Order，得根据这张表的热门查询SQL、字段特征、数量来做：

查询字段是数据连续且范围小的，选 Order查询字段具有高基数特征，选 Z-Order频繁查询此表多个字段的，选 Z-Order，否则 Order 的性能会更好

小结

Iceberg 做了很多功夫去加速查询，本文中提到的小文件合并、快照清理、Bloom Filter、Order、Z-Order 都是为了在查询时跳过无用的文件，通过减少磁盘 IO 操作来加速查询。Trino 和 Spark 提供许多便利的方法给开发者维护治理 Iceberg；数据治理这块成本比较低，可以写好自动化脚本每天执行数据治理；查询加速这里的维护成本比较高，都是需要重写元数据和数据文件的操作，一般每月做一次重写操作。

关键词： Iceberg

天天看点：Iceberg数据治理及查询加速实践

哈利波特20周年-天天热点评

最后一页

相关阅读

天天看点：Iceberg数据治理及查询加速实践

数据治理Flink实时写入Iceberg带来的问题在实时数据源源不断经过Flink写入的Iceberg的过程中，Flink通过定时的Check

哈利波特20周年-天天热点评

1、华纳传媒于2021年11月16日宣布，在《哈利·波特与魔法石》公映20周年之际，该系列的卡司要重聚了。2、重聚篇《哈

每日速递：封面视频｜妈妈给女儿停掉抗抑郁药换成维生素引热议，抑郁症无需吃药？

封面视频｜妈妈给女儿停掉抗抑郁药换成维生素引热议，抑郁症无需吃药？

美国“毒列车”污水将被运往休斯敦附近处理 当地居民多为少数族裔_每日短讯

海外网2月26日电据英国《卫报》2月25日报道，美国“毒列车”事故产生的废水将被运往休斯敦附近处理，当地居民多为少数族裔居民。美国环境保护

韦博

1、韦博英语创立于1998年，是韦博教育旗下的英语培训机构，为6周岁以上人群提供以实用为导向的中外教结合英语课程及相关服

看热讯：房子施工知识：警惕游击队装修的五大骗术

作为消费者，更应以理性、成熟的心态和观念来对待家庭装修这一人生的大事，不要贪小廉价吃大亏。陷阱1单项面积容易做手脚一般业

杀出侏罗纪 报资讯

1、《杀出侏罗纪》由导演王鑫执导，王婉中、李宁等实力演员主演的中国首部恐龙题材网络电影正式定档2020年3月6日于腾讯视

每日信息：广汽本田VE-1

1、广汽本田VE-1作为广汽本田的首款纯电动车车型，基于HondaSUV平台开发，延续车型缤智（VEZEL）。2、

关于幽灵行动4未来战士的问题_关于幽灵行动4未来战士的问题怎么解决

1、我更喜欢玩单机游戏。当然，《幽灵行动4》这种未来派游戏一定不能放过，游戏本身可能存在很多问题。在这里，我将自己目前遇

焦点热议:减肥科学计划_科学减肥方案

1、朋友好！★试试男女老少皆宜的跳绳减肥法★★跳绳是一种最佳的减肥瘦身操，有测试显示，跳5分钟，每分钟跳140次的运动效

一路上有你电影-世界时快讯

1、《一路上有你》是一部非常不错的美国影片。2、金·凯瑞、阿什莉·朱迪、大卫·斯特雷泽恩主演。3、于1998年9月11日

环球最新：生完孩子怎么减肥_三点教你瘦出好身材

欢迎观看本篇文章，小升来为大家解答以上问题。生完孩子怎么减肥，三点教你瘦出好身材很多人还不知道，现在让我们一起来看看吧！

【建行河北省分行原党委书记、行长李秀昆被查】据中央纪委国家监委驻中国建设银行纪检监察组、河北省纪委监委消息：中国建设银行

全球快资讯丨团体操表演

1、集体表演的体操项目。2、这种体操由几十、几百甚至成千上万的男女青少年在不同的场地上，随着音乐做各种体操动作，变换各种

环球即时：香港顶流男团成员活动上突然晕倒！俩壮汉搀扶，多名保镖护送离开

2月25日，据媒体报道，香港顶流男团MIRROR出席活动时，成员之一的AnsonLo（卢瀚霆）突然晕倒，需要俩壮汉搀扶着离开，随后紧急入院检查。MIRRO

龙江滑雪名将孔凡钰世锦赛获1金1银 世界报资讯

龙江滑雪名将孔凡钰世锦赛获1金1银

世界速讯：李宗瑞月事妹是第几部

1、月事妹。2、是李宗瑞案的受害者。文章到此就分享结束，希望对大家有所帮助。

环球快报:学历认证报告的报告编号怎么获取_学历认证的报告编号怎么获取

1、学历认证报告编号是需要你去做学历认证以后。2、在学历认证结果上面就有有个学历认证编号学历认证需要自己去学信网申请。本

乌鸡红枣粥_全球新资讯

1、乌鸡又名乌骨鸡、药鸡，是江西泰和的特产。2、乌鸡不仅清炖好吃，若将它同红枣混在一起煮粥吃，是非常滋养身体的。文章

山东省公路规费征收管理条例

1、（1997年12年13日）山东省第八届人民代表大会常务委员会第31次会议通过。本文到此分享完毕，希望对大家有所帮

生活知识 2019年北京限号时间

湖北十堰市三个重大林业项目可行性研究报告获发改委批复

湖北天门生物医药产业在创新绿色发展新赛道上加速迭代

权威百科知识 军运会门票什么时候可以购买

中文百科 新年祝福语简短8字

美国“毒列车”污水将被运往休斯敦附近处理当地居民多为少数族裔_每日短讯

杀出侏罗纪报资讯

龙江滑雪名将孔凡钰世锦赛获1金1银世界报资讯

权威百科知识军运会门票什么时候可以购买

中文百科新年祝福语简短8字