在并行计算中,分叉会合模型是设置和执行并行程序的一种方式,使得程序在指定一点上“分叉”(fork)而开始并行执行,在随后的一点上“会合”(join)并恢复顺序执行。并行区块可以递归的fork,直到达到特定的任务粒度(granularity)。Fork–join可以被视为是一种并行设计模式[1]:209 ff.,它最早由马尔文·康威公式化于1963年[2][3]。
概述
通过递归的嵌套fork–join计算,可以获得并行版本的分治范型,表达为如下一般性伪代码[4]:
解决(问题): if 问题足够小: 直接解决问题 (顺序算法) else: for 部份 in 细分(问题) fork 子任务来解决(部份) join 在前面的循环中生成的所有子任务 return 合并的结果
例子
mergesort(A, lo, hi): if lo < hi: // 至少有一个输入元素 mid = ⌊lo + (hi - lo) / 2⌋ fork mergesort(A, lo, mid) // 分叉出子任务处理第一个递归调用,它(潜在的) 并行于主任务 mergesort(A, mid, hi) // 主任务处理第二个递归调用 join merge(A, lo, mid, hi)
第一个递归调用是“分叉出”的(forked off),这意味着它可以在单独的线程中的执行,从而并行于这个函数的后续部分,直到join导致所有线程同步化。尽管join看起来很像一个屏障(barrier),但二者并不相同,因为各个线程在一个屏障之后将继续工作,而在join之后只有一个线程继续工作[1]:88。
在上述伪码中第二个递归调用不是分叉的;这是故意为之的,因为分叉任务是要付出代价的。如果把二个递归调用都设置为子任务,主任务在被阻塞在join之前将没有任何额外的工作可以进行[1]。
实现
在fork–join模型的实现中,fork的典型的是任务、纤程即轻量级线程,而非操作系统级别的“重量级”线程或进程,并使用线程池来执行这些任务:fork原语(primitive)允许编程者指定“潜在的”并行,由实现机制接着把它们映射(map)到实际的并行执行之上[1]。这么设计的原因是建立新线程趋于导致很大的开销[4]。
在fork–join编程中用到的轻量级线程,典型的有它们自己的调度器,调度器典型的采用工作抢断策略,并将这些线程映射到底层的线程池。这种调度器比全特征的抢占式操作系统调度器要简单的: 通用的线程调度器必须处理针对锁的阻塞,而在fork–join范型中,线程只阻塞在join点上[4]。
在OpenMP框架中,Fork–join是主要的并行执行模型,尽管OpenMP实现可以支持也可以不支持并行段落的嵌套[6]。支持它的还有:Java concurrency框架[7]、微软.NET的任务并行库[8]和Intel的线程建造块(TBB)[1]。Cilk编程语言有对fork和join的语言级别支持,其形式为spawn
和sync
关键字[4]或Cilk Plus中的cilk_spawn
和cilk_sync
[1]。
参见
- 并行编程模型
- Fork (系统调用)
- 共享内存并行的矩阵乘法算法
- 工作抢断
引用
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.