Apache Beam是一个开源统一编程模型,用于定义和执行数据处理管道,包括ETL批处理流(连续)处理[2] Beam流水线是使用提供的SDK之一定义的,并在Beam支持的一个运行器(分布式处理后端)中执行,包括Apache Apex英语Apache ApexApache Flink、Apache Gearpump(孵化中)、Apache Samza英语Apache SamzaApache Spark和Google Cloud Dataflow。[3]

事实速览 开发者, 首次发布 ...
Apache Beam
Thumb
开发者Apache软件基金会
首次发布2016年6月15日,​8年前​(2016-06-15
当前版本
  • 2.61.0(2024年11月14日;稳定版本)[1]
编辑维基数据链接
原始码库 编辑维基数据链接
编程语言Java, Python, Go
操作系统跨平台
许可协议Apache许可证 2.0
网站beam.apache.org
关闭

它被称为“大数据的超级API”。[4]

faviconfaviconfaviconfavicon
4 sources

历史

Apache Beam[3]是数据流模型文件的一种实现。[5]数据流模型基于以前关于Google的分布式处理抽象的工作,特别是FlumeJava[6]和Millwheel。[7][8]

Google于2014年发布了数据流模型的开放式SDK,以及在本地(非分布式)和Google云平台服务中执行数据流的环境。

2016年,Google向Apache软件基金会捐赠了核心SDK以及本地运行程序的实现,以及用于访问Google云平台数据服务的一组IO(数据连接器)。其他公司和社区成员为现有的分布式执行平台提供了运行器,以及新的将Beam Runners与现有数据库、键值存储和消息系统集成的IO。此外,还提出了新的DSL,以支持Beam模型之上的特定领域需求。

faviconfaviconfavicon
4 sources

时间线

更多信息 版本, 释放日期 ...
版本 释放日期
当前版本: 2.19.0 2020-02-04
旧版本,不再支持: 2.18.0 2020-01-23
旧版本,不再支持: 2.17.0 2020-01-06
旧版本,不再支持: 2.16.0 2019-10-07
旧版本,不再支持: 2.15.0 2019-08-22
旧版本,不再支持: 2.14.0 2019-08-01
旧版本,不再支持: 2.13.0 2019-05-22
旧版本,不再支持: 2.12.0 2019-04-25
旧版本,不再支持: 2.11.0 2019-02-26
旧版本,不再支持: 2.10.0 2019-02-01
旧版本,不再支持: 2.9.0 2018-12-13
旧版本,不再支持: 2.8.0 2018-10-29
旧版本,不再支持: 2.7.0 2018-10-03
旧版本,不再支持: 2.6.0 2018-08-08
旧版本,不再支持: 2.5.0 2018-06-26
旧版本,不再支持: 2.4.0 2018-03-20
旧版本,不再支持: 2.3.0 2018-01-30
旧版本,不再支持: 2.2.0 2017-12-02
旧版本,不再支持: 2.1.0 2017-08-23
旧版本,不再支持: 2.0.0 2017-05-17
旧版本,不再支持: 0.6.0 2017-03-11
旧版本,不再支持: 0.5.0 2017-02-02
旧版本,不再支持: 0.4.0 2016-12-29
旧版本,不再支持: 0.3.0 2016-10-31
旧版本,不再支持: 0.2.0 2016-08-08
旧版本,不再支持: 0.1.0 2016-06-15
格式:
旧版本
旧版本,仍被支持
当前版本
最新的预览版
未来版本
关闭

参见

  • Apache软件基金会的项目列表

参考文献

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.