Apache Beam是一个开源统一编程模型,用于定义和执行数据处理管道,包括ETL、批处理和流(连续)处理。[2] Beam流水线是使用提供的SDK之一定义的,并在Beam支持的一个运行器(分布式处理后端)中执行,包括Apache Apex、Apache Flink、Apache Gearpump(孵化中)、Apache Samza、Apache Spark和Google Cloud Dataflow。[3]
它被称为“大数据的超级API”。[4]
历史
Apache Beam[3]是数据流模型文件的一种实现。[5]数据流模型基于以前关于Google的分布式处理抽象的工作,特别是FlumeJava[6]和Millwheel。[7][8]
Google于2014年发布了数据流模型的开放式SDK,以及在本地(非分布式)和Google云平台服务中执行数据流的环境。
2016年,Google向Apache软件基金会捐赠了核心SDK以及本地运行程序的实现,以及用于访问Google云平台数据服务的一组IO(数据连接器)。其他公司和社区成员为现有的分布式执行平台提供了运行器,以及新的将Beam Runners与现有数据库、键值存储和消息系统集成的IO。此外,还提出了新的DSL,以支持Beam模型之上的特定领域需求。
版本 | 释放日期 |
---|---|
2.19.0 | 2020-02-04 |
2.18.0 | 2020-01-23 |
2.17.0 | 2020-01-06 |
2.16.0 | 2019-10-07 |
2.15.0 | 2019-08-22 |
2.14.0 | 2019-08-01 |
2.13.0 | 2019-05-22 |
2.12.0 | 2019-04-25 |
2.11.0 | 2019-02-26 |
2.10.0 | 2019-02-01 |
2.9.0 | 2018-12-13 |
2.8.0 | 2018-10-29 |
2.7.0 | 2018-10-03 |
2.6.0 | 2018-08-08 |
2.5.0 | 2018-06-26 |
2.4.0 | 2018-03-20 |
2.3.0 | 2018-01-30 |
2.2.0 | 2017-12-02 |
2.1.0 | 2017-08-23 |
2.0.0 | 2017-05-17 |
0.6.0 | 2017-03-11 |
0.5.0 | 2017-02-02 |
0.4.0 | 2016-12-29 |
0.3.0 | 2016-10-31 |
0.2.0 | 2016-08-08 |
0.1.0 | 2016-06-15 |
格式: 旧版本 旧版本,仍被支持 当前版本 最新的预览版 未来版本 |
参见
- Apache软件基金会的项目列表
参考文献
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.