阿里巴巴开源了Fluss项目,旨在提升Apache Flink在实时数据分析中的能力。
原文标题:阿里重磅开源 Fluss: Flink Unified Streaming Storage
原文作者:阿里云开发者
冷月清谈:
怜星夜思:
2、Fluss和传统的Kafka + Flink组合相比,最大的优势是什么?
3、你如何看待阿里巴巴对开源生态的推动?
原文内容
Fluss: 面向分析的实时流存储
-
实时读写:支持毫秒级的流式读写能力。
-
列式裁剪:以列存格式存储实时流数据,通过列裁剪可提升 10 倍读取性能并降低网络成本。
-
流式更新:支持大规模数据的实时流式更新。支持部分列更新,实现低成本宽表拼接。
-
CDC订阅:更新会生成完整的变更日志(CDC),通过 Flink 流式消费 CDC,可实现数仓全链路数据实时流动。
-
实时点查:支持高性能主键点查,可作为实时加工链路的维表关联。
-
湖流一体:无缝集成 Lakehouse,并为 Lakehouse 提供实时数据层。这不仅为 Lakehouse 分析带来了低延时的数据,更为流存储带来了强大的分析能力。
加入 Fluss 开源社区


