Remove ads
来自维基百科,自由的百科全书
粒子群优化(Particle Swarm Optimization, PSO),又称粒子群演算法、微粒群算法,是由 J. Kennedy 和 R. C. Eberhart 等[1]于1995年开发的一种演化计算技术,来源于对一个简化社会模型的模拟。其中“群(swarm)”来源于微粒群符合 M. M. Millonas 在开发应用于人工生命(artificial life)的模型时所提出的群体智能的5个基本原则。“粒子(particle)”是一个折衷的选择,因为既需要将群体中的成员描述为没有质量、没有体积的,同时也需要描述它的速度和加速状态。
此條目需要精通或熟悉计算机科学的编者参与及协助编辑。 (2010年3月22日) |
PSO 算法最初是为了图形化地模拟鸟群优美而不可预测的运动。而通过对动物社会行为的观察,发现在群体中对信息的社会共享提供一个演化的优势,并以此作为开发算法的基础[1]。通过加入近邻的速度匹配、并考虑了多维搜索和根据距离的加速,形成了 PSO 的最初版本。之后引入了惯性权重w来更好的控制开发(exploitation)和探索(exploration),形成了标准版本。为了提高粒群算法的性能和实用性,中山大学、(英国)格拉斯哥大学等又开发了自适应(Adaptive PSO)版本[2]和离散(discrete)版本[3]。
PSO 算法屬於一種萬能啟發式演算法,能夠在沒有得知太多問題資訊的情況下,有效的搜尋具有龐大解空間的問題並找到候選解,但同時不保證其找到的最佳解為真實的最佳解。
PSO 算法是基于群体的,根据对环境的适应度将群体中的个体移动到好的区域。然而它不对个体使用演化算子,而是将每个个体看作是 D 维搜索空间中的一个没有体积的微粒(点),在搜索空间中以一定的速度飞行,这个速度根据它本身的飞行经验和同伴的飞行经验来动态调整。第 i 个微粒表示为 Xi =(xi1, xi2, …, xiD) ,它经历过的最好位置(有最好的适应值)记为 Pi = (pi1, pi2, …, piD),也称为 pbest。在群体所有微粒经历过的最好位置的索引号用符号 g 表示,即 Pg,也称为 gbest 。微粒 i 的速度用 Vi = (vi1, vi2, …, viD) 表示。对每一代,它的第 d+1 维(1 ≤ d+1 ≤ D)根据如下方程进行变化:
vid+1 = w∙vid+c1∙rand()∙(pid-xid)+c2∙Rand()∙(pgd-xid) (1a) xid+1 = xid+vid+1 (1b)
其中w为惯性权重(inertia weight),c1和c2为加速常数(acceleration constants),rand() 和 Rand() 为两个在[0,1]范围里变化的随机值。
此外,微粒的速度 Vi 被一个最大速度 Vmax 所限制。如果当前对微粒的加速导致它的在某维的速度 vid 超过该维的最大速度 vmax,d,则该维的速度被限制为该维最大速度 vmax,d。
对公式(1a),第一部分为微粒先前行为的惯性,第二部分为“认知(cognition)”部分,表示微粒本身的思考;第三部分为“社会(social)”部分,表示微粒间的信息共享与相互合作。
“认知”部分可以由 Thorndike 的效应法则(law of effect)所解释,即一个得到加强的随机行为在将来更有可能出现。这里的行为即“认知”,并假设获得正确的知识是得到加强的,这样的一个模型假定微粒被激励着去减小误差。
“社会”部分可以由 Bandura 的替代强化(vicarious reinforcement)所解释。根据该理论的预期,当观察者观察到一个模型在加强某一行为时,将增加它实行该行为的几率。即微粒本身的认知将被其它微粒所模仿。
PSO 算法使用如下心理学假设:在寻求一致的认知过程中,个体往往记住自身的信念,并同时考虑同事们的信念。当其察觉同事的信念较好的时候,将进行适应性地调整。
标准 PSO 的算法流程如下:
PSO 参数包括:群体规模 m ,惯性权重 w ,加速常数 c1 和 c2 ,最大速度 Vmax,最大代数 Gmax。
Vmax 决定在当前位置与最好位置之间的区域的分辨率(或精度)。如果 Vmax 太高,微粒可能会飞过好解,如果 Vmax 太小,微粒不能进行足够的探索,导致陷入局部优值。该限制有三个目的:防止计算溢出;实现人工学习和态度转变;决定问题空间搜索的粒度。
惯性权重w使微粒保持运动的惯性,使其有扩展搜索空间的趋势,有能力探索新的区域。
加速常数 c1 和 c2 代表将每个微粒推向 pbest 和 gbest 位置的统计加速项的权重。低的值允许微粒在被拉回来之前可以在目标区域外徘徊,而高的值导致微粒突然的冲向或者越过目标区域。
如果没有后两部分,即 c1 = c2 = 0,微粒将一直以当前的速度飞行,直到到达边界。由于它只能搜索有限的区域,将很难找到好的解。
如果没有第一部分,即 w = 0,则速度只取决于微粒当前的位置和它们历史最好位置 pbest 和 gbest ,速度本身没有记忆性。假设一个微粒位于全局最好位置,它将保持静止。而其它微粒则飞向它本身最好位置 pbest 和全局最好位置 gbest 的加权中心。在这种条件下,微粒群将统计的收缩到当前的全局最好位置,更像一个局部算法。
在加上第一部分后,微粒有扩展搜索空间的趋势,即第一部分有全局搜索的能力。这也使得w的作用为针对不同的搜索问题,调整算法全局和局部搜索能力的平衡。
如果没有第二部分,即 c1 = 0,则微粒没有认知能力,也就是“只有社会(social-only)”的模型。在微粒的相互作用下,有能力到达新的搜索空间。它的收敛速度比标准版本更快,但是对复杂问题,比标准版本更容易陷入局部优值点。
如果没有第三部分,即 c2 = 0,则微粒之间没有社会信息共享,也就是“只有认知(cognition-only)”的模型。因为个体间没有交互,一个规模为m的群体等价于m个单个微粒的运行。因而得到解的几率非常小。
收敛性的数学证明帮助了 PSO 的发展和应用[4],但此类分析具有很大的局限性[5]。为 PSO 加入正交学习后,算法的全局收敛、收敛精度及穩健可靠性都得到了提高[6]。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.