倒立振子 (とうりつしんし 英 : inverted pendulum )とは、支点 よりも重心 が高い位置にある振り子 をいう。写真に示すように、支点を台車に載せて実装する、台車駆動型倒立振子がよく知られている[1] 。ほとんどの応用例において振り子はある回転軸 まわりにのみ運動するよう固定されており、自由度 は1に制限されている。振り子は吊り下げられた状態が安定であり、したがって倒立振子は本質的に不安定であるため倒立状態を保つためには常に能動的に制御する必要がある。このためには支軸に直接トルクを加えたり、支点を水平方向もしくは鉛直方向に移動させることにより振り子の錘の回転速度を変化させることにより総トルクを変化させたりしてフィードバック 系を構築する。支点を動かす型の倒立振子の一番簡単な例は、箒を手の上に立たせる系である。倒立振子は動力学 と制御論 における古典的な問題であり、制御戦略の試験用ベンチマークとして用いられる。また、パーソナルモビリティ 分野において二輪倒立振子(例: セグウェイ )や自立安定一輪車 (例: ホンダ・U3-X )などの形式で応用されつつある。
この項目「
倒立振子 」は翻訳されたばかりのものです。不自然あるいは曖昧な表現などが含まれる可能性があり、このままでは読みづらいかもしれません。(原文:
en:Inverted pendulum )
修正、加筆に協力し、現在の表現をより自然な表現にして下さる方を求めています。
ノートページ や
履歴 も参照してください。
(2016年11月 )
単純なロボティクス 系、台車駆動型倒立振子。1976年。
別の種類の倒立振子として、高層建築に用いられる傾斜計が挙げられる。建築物の基部にワイヤの一端を固定し、他端につけた浮きを建築物の最上部に油で浮かべ、浮きの平衡位置の変化を測定することで傾斜を検出する[2] [3] 。
倒立振子は動力学 および制御論 における古典的な問題であり、制御アルゴリズム(PID制御 、状態空間表示 、ニューラルネットワーク 、ファジィ制御 、遺伝的アルゴリズム など)の試験用ベンチマークとして広く用いられている。この問題はリンク の追加や台車への移動指令、台車をシーソーの上に載せるなどの様々な拡張が可能である。また、ロケットやミサイルは空気抵抗の力の中心が重心よりも前側にあるため空気力学 的に不安定であり、その誘導制御問題 と倒立振子問題は関連している[4] 。このような問題を理解するため、単純なロボット台車の上に載せた倒立振子が用いられることが多い。手の上に箒を立てる遊びや、自律平衡型の輸送機械であるセグウェイ などもこの問題の解である。
フィードバックに頼らず倒立振子を安定化する別の方法として、支点を上下に高速に振動させる方法がある。このような装置をカピッツァの振り子 (英語版 ) と呼ぶ。支点を(加速度と振幅の意味で)十分に強く振動させることにより、直感には強く反するが倒立振子に加えられた擾乱から回復することが可能となる。支点が単振動 する場合は、振り子の動きはマシュー方程式 により記述することができる。
倒立振子の運動方程式 は、倒立振子に課せられる拘束によって変化する。倒立振子の構成には様々なものがありうるため、それらを記述する運動方程式も数多く存在する。
支点固定型
振り子の支点が空間的に固定されている場合、運動方程式は非倒立振子 (英語版 ) のものと同一となる。次に示す方程式は運動に抗する摩擦力がなく、棒は質量のない剛体と見做すことができ、平面内 に運動が制限されているという仮定をおいた場合の運動方程式である。
θ
¨
−
g
ℓ
sin
θ
=
0
{\displaystyle {\ddot {\theta }}-{g \over \ell }\sin \theta =0}
ここで、· · θ は角加速度 を、g は重力加速度 を、ℓ は振り子の長さを、θ は平衡位置からの変位角を表わす。
片々足し合わせることにより角加速度項と重力項が同符号となるように変形することもできる。
θ
¨
=
g
ℓ
sin
θ
{\displaystyle {\ddot {\theta }}={g \over \ell }\sin \theta }
したがって、倒立振子は不安定平衡点からみた初期位置の方向に向かって、長さに反比例した加速度で遠ざかることがわかる。したがって、振り子は長い方が短い振り子よりも遅く落ちる。
トルクと慣性モーメントを用いた導出
質量 m の質点を、長さ ℓ の質量のない剛体棒の支点と逆側に固定した構成の振り子を考える。
系の総トルク は慣性モーメント と角加速度をかけた値に等しくなる。
τ
n
e
t
=
I
θ
¨
{\displaystyle {\boldsymbol {\tau }}_{\mathrm {net} }=I{\ddot {\theta }}}
重力による総トルクは以下のように書ける。
τ
n
e
t
=
m
g
ℓ
sin
θ
{\displaystyle {\boldsymbol {\tau }}_{\mathrm {net} }=mg\ell \sin \theta \,\!}
ここで、θ は倒立平衡点から測った変位角である。
したがって、次の運動方程式を得る。
I
θ
¨
=
m
g
ℓ
sin
θ
{\displaystyle I{\ddot {\theta }}=mg\ell \sin \theta \,\!}
質点の慣性モーメントは次のように得られる。
I
=
m
R
2
{\displaystyle I=mR^{2}}
倒立振子の場合、動径は棒の長さ ℓ に等しい。
I = mℓ 2 を代入すると以下が得られる。
m
ℓ
2
θ
¨
=
m
g
ℓ
sin
θ
{\displaystyle m\ell ^{2}{\ddot {\theta }}=mg\ell \sin \theta \,\!}
mℓ 2 で辺々割って次を得る。
θ
¨
=
g
ℓ
sin
θ
{\displaystyle {\ddot {\theta }}={g \over \ell }\sin \theta }
台車駆動型倒立振子
台車上の倒立振子を表わす模式図。棒は質量を持たないものとする。台車の質量と棒の端点の質量はそれぞれ M および m とする。棒の長さは ℓ とする。
台車駆動型倒立振子は図のように、質量 m の質点を長さ ℓ の棒の先に付け、逆側を水平に動ける台につけた構成である。台車は線形運動 (英語版 ) しかしないものとし、運動を起こさせたり妨げたりするような力がはたらくものとする。
安定化の要点
倒立振子を安定化するための要点は定性的に三つのステップにまとめることができる。
もし傾き角 θ が右向きならば台車は右に加速する必要があり、逆もまたなりたつ。
軌条中心からの相対台車位置 x を安定させるには、ヌル角度(制御系がゼロにしようとする角度誤差)を位置で変調すればよい。具体的にはヌル角度を θ + kx とする。ただし、k は小さくとる。これにより、台車が軌条中心から外れているなら棒は中心に向けてわずかに傾こうとするので、台車は中心向きに加速する。軌条中心では棒が鉛直に立つことで安定となる。傾きセンサのオフセットや軌条の傾きなどの不安定要素は安定位置のオフセットとして表われる。さらにオフセットを追加すると位置制御ができる。
クレーンで荷を運ぶときのように、運動する支点に吊り下げられた非倒立振子の応答には振り子の角振動数 ω p = √ g /ℓ にピークがある。制御不能な振動を防ぐため、ω p に近い支点運動の周波数スペクトルを抑制する必要がある。倒立振子でも、安定化のために同じようなフィルタが必要となる。
ヌル角度変調戦略の結果として、位置フィードバックは正のフィードバックとなり、突然右に動くよう指令すると台車はまず左へ動いてから右へ傾いた振り子を再び平衡にするため右へと移動する。倒立振子の不安定性と、正の位置フィードバックによる不安定性との相互作用により系は安定となっており、これを数学的に解析することは興味深く奥の深い問題となっている。
ワイングラスを載せた台車の単純な安定化制御系
ラグランジュ方程式
ラグランジュ方程式 から運動方程式を導出することもできる。前掲の図のように、θ (t ) を長さ ℓ の振り子の直立位置からの変位角とし、作用する力は重力および x 方向への外力 F とする。 x (t ) を台車の位置と定義すると、系のラグランジアン L = T − V は以下のように書ける。
L
=
1
2
M
v
1
2
+
1
2
m
v
2
2
−
m
g
ℓ
cos
θ
{\displaystyle L={\frac {1}{2}}Mv_{1}^{2}+{\frac {1}{2}}mv_{2}^{2}-mg\ell \cos \theta }
ここで v 1 は台車の速度、 v 2 は質量 m の質点の速度とする。v 1 および v 2 は x と θ の導関数を用いて次のように書ける。
v
1
2
=
x
˙
2
{\displaystyle v_{1}^{2}={\dot {x}}^{2}}
v
2
2
=
(
d
d
t
(
x
−
ℓ
sin
θ
)
)
2
+
(
d
d
t
(
ℓ
cos
θ
)
)
2
{\displaystyle v_{2}^{2}=\left({\frac {\mathrm {d} }{\mathrm {d} t}}{\left(x-\ell \sin \theta \right)}\right)^{2}+\left({\frac {\mathrm {d} }{\mathrm {d} t}}{\left(\ell \cos \theta \right)}\right)^{2}}
v 2 の表式を展開すると以下のようになる。
v
2
2
=
x
˙
2
−
2
ℓ
x
˙
θ
˙
cos
θ
+
ℓ
2
θ
˙
2
{\displaystyle v_{2}^{2}={\dot {x}}^{2}-2\ell {\dot {x}}{\dot {\theta }}\cos \theta +\ell ^{2}{\dot {\theta }}^{2}}
すると、ラグランジアンは次のように書ける。
L
=
1
2
(
M
+
m
)
x
˙
2
−
m
ℓ
x
˙
θ
˙
cos
θ
+
1
2
m
ℓ
2
θ
˙
2
−
m
g
ℓ
cos
θ
{\displaystyle L={\frac {1}{2}}\left(M+m\right){\dot {x}}^{2}-m\ell {\dot {x}}{\dot {\theta }}\cos \theta +{\frac {1}{2}}m\ell ^{2}{\dot {\theta }}^{2}-mg\ell \cos \theta }
ここで、オイラー・ラグランジュの運動方程式 は次の表式である。
d
d
t
∂
L
∂
x
˙
−
∂
L
∂
x
=
F
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} t}}{\partial {L} \over \partial {\dot {x}}}-{\partial {L} \over \partial x}=F}
d
d
t
∂
L
∂
θ
˙
−
∂
L
∂
θ
=
0
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} t}}{\partial {L} \over \partial {\dot {\theta }}}-{\partial {L} \over \partial \theta }=0}
この方程式系における L に上の表式を代入すると、倒立振子の運動を記述する方程式系が次のように得られる。
(
M
+
m
)
x
¨
−
m
ℓ
θ
¨
cos
θ
+
m
ℓ
θ
˙
2
sin
θ
=
F
{\displaystyle \left(M+m\right){\ddot {x}}-m\ell {\ddot {\theta }}\cos \theta +m\ell {\dot {\theta }}^{2}\sin \theta =F}
ℓ
θ
¨
−
g
sin
θ
=
x
¨
cos
θ
{\displaystyle \ell {\ddot {\theta }}-g\sin \theta ={\ddot {x}}\cos \theta }
この方程式系は非線形であるが、制御系の目標は振り子を直立に保つことなので、θ ≈ 0 近傍で線形化することが多い。
ニュートンの第二法則
ラグランジュ方程式 の代わりに、ニュートンの第二法則 を用いる方が利点が多いことが多い。ニュートン方程式を用いれば、振り子と台車の間の結節点における反力が得られる。すると、それぞれの物体について x 方向と y 方向のあわせて二つの方程式が得られる。台車の運動方程式は次のようになる。ただし、左辺は合力、右辺は加速度を表わす。
F
−
R
x
=
M
x
¨
{\displaystyle F-R_{x}=M{\ddot {x}}}
F
N
−
R
y
−
M
g
=
0
{\displaystyle F_{N}-R_{y}-Mg=0}
ここで、R x および R y は結節点における反力を表わす。F N は台車にかかる垂直抗力である。二つ目の方程式は鉛直方向の反力にしか依存しないので、垂直抗力を解くのに用いることができる。一つ目の方程式は水平方向の反力を解くのに用いることができる。この運動方程式系を完成させるには、振り子に固定された質点の加速度を計算する必要がある。慣性座標系における質点の位置は次のように表わすことができる。
r
→
P
=
(
x
−
ℓ
sin
θ
)
x
^
I
+
ℓ
cos
θ
y
^
I
{\displaystyle {\vec {r}}_{P}=(x-\ell \sin \theta ){\hat {x}}_{I}+\ell \cos \theta {\hat {y}}_{I}}
二階微分をとることにより慣性系における加速度ベクトルを得る。
a
→
P
/
I
=
(
x
¨
+
ℓ
θ
˙
2
sin
θ
−
ℓ
θ
¨
cos
θ
)
x
^
I
+
(
−
ℓ
θ
˙
2
cos
θ
−
ℓ
θ
¨
sin
θ
)
y
^
I
{\displaystyle {\vec {a}}_{P/I}=({\ddot {x}}+\ell {\dot {\theta }}^{2}\sin \theta -\ell {\ddot {\theta }}\cos \theta ){\hat {x}}_{I}+(-\ell {\dot {\theta }}^{2}\cos \theta -\ell {\ddot {\theta }}\sin \theta ){\hat {y}}_{I}}
第二運動法則を用いて、 x 方向と y 方向の二つの方程式を得る。質点にかかる反力は台車にかかる反力と逆符号になることに注意されたい。これはニュートンの第三法則 から帰結する。
R
x
=
m
(
x
¨
+
ℓ
θ
˙
2
sin
θ
−
ℓ
θ
¨
cos
θ
)
{\displaystyle R_{x}=m({\ddot {x}}+\ell {\dot {\theta }}^{2}\sin \theta -\ell {\ddot {\theta }}\cos \theta )}
R
y
−
m
g
=
m
(
−
ℓ
θ
˙
2
cos
θ
−
ℓ
θ
¨
sin
θ
)
{\displaystyle R_{y}-mg=m(-\ell {\dot {\theta }}^{2}\cos \theta -\ell {\ddot {\theta }}\sin \theta )}
一つ目の方程式から、外力 F によらず水平方向の反力を計算する方法が得られる。 二つ目の方程式は鉛直方向の反力の計算に用いることができる。一つ目の運動方程式は
F
−
R
x
=
M
x
¨
{\displaystyle F-R_{x}=M{\ddot {x}}}
を
R
x
=
m
(
x
¨
+
ℓ
θ
˙
2
sin
θ
−
ℓ
θ
¨
cos
θ
)
{\displaystyle R_{x}=m({\ddot {x}}+\ell {\dot {\theta }}^{2}\sin \theta -\ell {\ddot {\theta }}\cos \theta )}
に代入して次のように得られる。
(
M
+
m
)
x
¨
−
m
ℓ
θ
¨
cos
θ
+
m
ℓ
θ
˙
2
sin
θ
=
F
{\displaystyle \left(M+m\right){\ddot {x}}-m\ell {\ddot {\theta }}\cos \theta +m\ell {\dot {\theta }}^{2}\sin \theta =F}
この方程式をよく見れば、ラグランジュ法による方程式と同じであることがわかる。二つ目の方程式を得るには、振り子の運動方程式と、常に振り子に直交する単位ベクトルとのドット積をとる必要がある。このベクトルは物体系の x 座標と呼ばれることが多い。慣性座標系ではこのベクトルは単純な二次元座標変換を用いて以下のように表わされる。
x
^
B
=
cos
θ
x
^
I
+
sin
θ
y
^
I
{\displaystyle {\hat {x}}_{B}=\cos \theta {\hat {x}}_{I}+\sin \theta {\hat {y}}_{I}}
ベクトル表記で書いた振り子の運動方程式は
∑
F
→
=
m
a
→
P
/
I
{\displaystyle \sum {\vec {F}}=m{\vec {a}}_{P/I}}
のようになる。この両辺と ˆ x B とのドット積を取ると、求める運動方程式の左辺は次のようになる(転置をとってかけるとドット積になることに注意)。
(
x
^
B
)
T
∑
F
→
=
(
x
^
B
)
T
(
R
x
x
^
I
+
R
y
y
^
I
−
m
g
y
^
I
)
=
(
x
^
B
)
T
(
R
p
y
^
B
−
m
g
y
^
I
)
=
−
m
g
sin
θ
{\displaystyle ({\hat {x}}_{B})^{T}\sum {\vec {F}}=({\hat {x}}_{B})^{T}(R_{x}{\hat {x}}_{I}+R_{y}{\hat {y}}_{I}-mg{\hat {y}}_{I})=({\hat {x}}_{B})^{T}(R_{p}{\hat {y}}_{B}-mg{\hat {y}}_{I})=-mg\sin \theta }
上の式展開においては反力の物体系成分と慣性系成分との関係式が用いられている。質点と台車を繋ぐ棒が質量を持たないという仮定から、この棒は自身に垂直な負荷をまったく伝えないと考えられる。したがって、反力の物体系成分は単に R p ˆ y B のように書け、棒に沿った成分しか存在しないことがいえる。このことから、棒の張力に関して次の方程式が得られる。
R
p
=
R
x
2
+
R
y
2
{\displaystyle R_{p}={\sqrt {R_{x}^{2}+R_{y}^{2}}}}
同様に、先に示した加速度 a → P/I の式と ˆ x B とのドット積を取ることで、求める運動方程式の右辺も計算することができる。その結果は(少々整理すると)以下のようになる。
m
(
x
^
B
)
T
(
a
→
P
/
I
)
=
m
(
x
¨
cos
θ
−
ℓ
θ
¨
)
{\displaystyle m({\hat {x}}_{B})^{T}({\vec {a}}_{P/I})=m({\ddot {x}}\cos \theta -\ell {\ddot {\theta }})}
左辺と右辺を繋いで m で割ると以下を得る。
ℓ
θ
¨
−
g
sin
θ
=
x
¨
cos
θ
{\displaystyle \ell {\ddot {\theta }}-g\sin \theta ={\ddot {x}}\cos \theta }
これもまた、ラグランジュ法による方程式と同一である。ニュートン法を用いる利点は、全ての反力が明らかであり、損壊がないことを保証できる点にある。
支点の振動する振り子
質量の無い、振動する台に繋がれた振り子の運動方程式は台車に繋がれた振り子と同じように導出することができる。質点の位置はこの場合は次のように表わされる。
(
−
ℓ
sin
θ
,
y
+
ℓ
cos
θ
)
{\displaystyle \left(-\ell \sin \theta ,y+\ell \cos \theta \right)}
そして、位置の一階微分をとることにより速度が得られる。
v
2
=
y
˙
2
−
2
ℓ
y
˙
θ
˙
sin
θ
+
ℓ
2
θ
˙
2
{\displaystyle v^{2}={\dot {y}}^{2}-2\ell {\dot {y}}{\dot {\theta }}\sin \theta +\ell ^{2}{\dot {\theta }}^{2}}
この系のラグランジアン は次のように書ける。
L
=
1
2
m
(
y
˙
2
−
2
ℓ
y
˙
θ
˙
sin
θ
+
ℓ
2
θ
˙
2
)
−
m
g
(
y
+
ℓ
cos
θ
)
{\displaystyle L={\frac {1}{2}}m\left({\dot {y}}^{2}-2\ell {\dot {y}}{\dot {\theta }}\sin \theta +\ell ^{2}{\dot {\theta }}^{2}\right)-mg\left(y+\ell \cos \theta \right)}
そして、オイラー・ラグランジュ方程式
d
d
t
∂
L
∂
θ
˙
−
∂
L
∂
θ
=
0
{\displaystyle {\mathrm {d} \over \mathrm {d} t}{\partial {L} \over \partial {\dot {\theta }}}-{\partial {L} \over \partial \theta }=0}
から次の運動方程式が得られる。
ℓ
θ
¨
−
y
¨
sin
θ
=
g
sin
θ
{\displaystyle \ell {\ddot {\theta }}-{\ddot {y}}\sin \theta =g\sin \theta }
ここで、y が単振動 y = A sin ω t で表わされる場合、次の微分方程式 を得る。
θ
¨
−
g
ℓ
sin
θ
=
−
A
ℓ
ω
2
sin
ω
t
sin
θ
{\displaystyle {\ddot {\theta }}-{g \over \ell }\sin \theta =-{A \over \ell }\omega ^{2}\sin \omega t\sin \theta }
この方程式は閉形式の基本解を持たないが、様々な方法で調べることができる。たとえば、振幅が小さい場合はマシュー方程式 により精度よく近似することができる。解析により、振動が速ければ振り子が直立を保つことがわかる。下図のプロットの一つ目は y の振動が遅い場合には振り子を直立状態からずらすとすぐに倒れてしまうことを示している。短時間で θ は 90°を超えており、つまり振り子は倒れてしまっている。y の振動が速ければ振り子は直立位置の周りで安定に保たれる。二つ目のプロットは振り子が直立位置 (θ = 0 ) からずれてもその近傍で振動することを示している。直立位置からのずれは小さくたもたれ、倒れてしまうことはない。
振動する台に載せられた倒立振子のプロット。左のプロットは遅い振動に対する振り子の応答を、二つ目のプロットは速い振動に対する応答を示す。
倒立振子を安定させることは広く取り組まれている工学的課題である[5] 。台車駆動型倒立振子にも、棒を載せただけのものから振り子が複数の節に分かれているものまで様々な変種がある。その他にも、倒立振子の棒もしくは節分けされた棒を回転部品の端にとりつける種類のものがある。台車型と回転型のいずれの場合でも、倒立振子は平面内でしか運動しない。平衡位置にある倒立振子を維持するのが課題である場合もあれば、自律的に平衡位置を達成することが求められる場合もある。また、二輪倒立振子という別のプラットフォームもある。二輪倒立振子では一点での回転が可能であり、格段に高い操作性を実現できる[6] 。その他にも、一点上での平衡をとるものもある。コマ や 一輪車 、ボール上の倒立振子はすべて一点上で平衡をとる。上で説明したように、鉛直に振動する台によっても倒立振子を安定化することができる。
倒立振子には人造のものも自然のものも含めて様々な例がある。
最も身近な倒立振子はヒト であるといわれる。直立した体を持つヒトは、常に平衡を保つための調整を行なっていなければ立つことも歩くことも走ることもできない。
単純な例として、箒や定規を手の上で直立させる遊びが挙げられる。
倒立振子は様々な装置に組込まれており、また特異的な工学的問題として研究されている[6] 。倒立振子は本質的に不安定なので擾乱に対して計測可能な応答を示すため、初期の地震計 の設計における中心的要素として採用されていた[7] 。
倒立振子模型はいくつかのパーソナルモビリティ にも採用されている。二輪車椅子やその他の二輪モーター車両により高い移動性を確保することができる。