Loading AI tools
ウィキペディアから
生存分析(せいぞんぶんせき、英: survival analysis)または生存時間解析とは、生物の死や機械システムの故障など、1つの事象(event、イベント)が発生するまでの予想される期間を分析する統計学の一分野である。このトピックは、工学では、信頼性理論または信頼性分析と呼ばれ、経済学では、継続時間分析または継続時間モデリング、社会学ではイベント履歴分析と呼ばれる。
生存分析を用いて答えられる質問には、たとえば、ある時間を過ぎて生存する人々の割合はどのくらいか、生き残った人々のうち、彼らはどのくらいの割合で死亡または故障するのか、複数の死因または故障を考慮に入れることができるか、特定の状況または特性は、生存 (英語版) の確率をどのように増加または減少させるのか、などが挙げられる。
このような質問に答えるためには、「寿命」(lifetime、ライフタイム)を定義する必要がある。 生物学的な生存の場合の死は明確であるが、機械的な信頼性の場合では故障は明確に定義されないことがある。これは、故障が部分的だったり、程度の問題だったり、時間的に局所化されていない機械システムが存在するためである。生物学的な問題においても、いくつかの事象(たとえば、心臓発作やその他の臓器不全)は、同じように曖昧さを持つ可能性もある。
以下に概説する理論は、特定の時間で明確に定義された事象を想定している。他のケースについては、曖昧な事象を明示的に説明するモデルによって、より適切に扱われる場合もある。
一般的に、生存分析には、事象までの時間データのモデリングが含まれる。この文脈において、生存分析の文献では、死亡または故障は「事象」と見なされる。慣例上、各被験者(または研究の主体)に1つの事象のみが発生し、その後、この生物または機械は死亡または故障する。反復事象モデル(Recurring event models)または繰り返し事象モデル(repeated event models)では、この仮定は緩められる。反復事象の研究は、システムの信頼性、および社会科学や医学研究の多くの分野に関わっている。
生存分析は、次に挙げるような手法を用いて行われる。
生存分析では一般的に、次の用語が使用される。
この例では、R言語の「survival」パッケージの急性骨髄性白血病生存データセット「aml」を使用している。このデータセットはMiller(1997)の研究からのもので[1]、標準的な化学療法のコースをさらに延長(維持)すべきかどうかが問題となっている。
生存時間でソートしたamlデータセットを図に示す。
最後の観察(observation 11)は、161週目で打ち切られている。打ち切りは、その患者に事象がなかった(aml癌の再発がなかった)ことを示している。別の被験者である観察3(observation 3)は、13週目で打ち切られた(status=0の表示)。この被験者は13週間しか研究に参加しておらず、その13週間の間にaml癌は再発しなかった。この患者は、研究の終了間際に登録されたために、13週間しか観察できなかったかもしれない。または、この患者は研究の初期に登録されたが、追跡調査を受けなかったか、研究を辞退したのかもしれない。この表では、他の被験者が16週、28週、45週で打ち切られたことを示している(status=0の観察17、6、9)。残りの被験者は全て、研究に参加している間に事象(aml癌の再発)を経験した。関心のある問題は、維持療法を受けた患者が、維持療法を受けていない患者に比べて再発が遅くなるかどうかである。
生存関数 S(t) は、被験者が時間 t よりも長く生存する確率である。S(t) は、理論的には滑らかな曲線であるが、通常はカプラン=マイヤー(KM)曲線を用いて推定される(下のグラフを参照)。このグラフは、amlデータのKMプロットで、次のように解釈できる。
生命表(life table)は、生存データを、事象の数と各事象の時点で生存している割合の観点から要約したものである。R言語を使用して作成されたamlデータの生命表を次に示す。
生命表は、イベントと各イベントの時点で生存している割合をまとめたものである。生命表の列は、次のように解釈する。
ログランク検定(log-rank test)は、2つ以上のグループの生存期間を比較する。この例では、amlデータ上で維持療法群(Maintained)と非維持療法群(Non-maintained)での生存率の差についてのログランク検定を使用する。このグラフは、治療群ごとに分類されたamlデータのカプラン=マイヤープロットである。治療群は、データ中の変数「x」で示されている。
ログランク検定の帰無仮説は、両治療群の生存率が同じであるというものである。それぞれの各時点で生存している被験者の期待数を、各事象の時間に治療群内で危険(risk)を抱えている被験者の数に合わせて調整する。ログランク検定では、各治療群で観察された事象数が期待数と有意に異なるかどうかを判定する。正式な検定は、カイ二乗分布に基づいてなされる。ログランク検定統計量が大きければ、治療群間の生存期間に差があることの証拠となる。ログランク検定統計量は、自由度が 1 のカイ二乗分布に近似しており、p値はカイ二乗分布を使用して計算される。
例題のデータでは、生存期間の差に関するログランク検定の p値 は p=0.0653 で、有意水準αレベルを 0.05 と仮定した場合、治療群の生存期間に有意差がないことを示している。 被験者 23 人というサンプルサイズは控えめであるため、治療群間の差を検出する力はほとんどない。 カイ二乗検定は漸近近似法に基づいているため、サンプルサイズが小さい場合は p値 を慎重に検討する必要がある。
カプラン=マイヤー曲線とログランク検定は、予測変数がカテゴリー的(例:薬剤と偽薬)またはカテゴリー的に扱える少数の値(例:薬剤の投与量0、20、50、100 mg/日)をとる場合に最も有用である。一方、ログランク検定およびカプラン=マイヤー曲線は、遺伝子発現、白血球数、または年齢などの定量的予測変数では簡単に機能しない。定量的予測変数の場合、代替法としてCox比例ハザード回帰分析(Cox proportional hazards regression analysis、Cox PH)がある。Cox PHモデルは、{0,1} の指標またはダミー変数としてコード化されたカテゴリー的予測変数でも機能する。ログランク検定は、Cox PH分析の特殊なケースであり、Cox PHソフトウェアを使用して実行できる。
この例では、Dalgaard第14章の黒色腫データセット(メラノーマ・データセット)を使用する[2]。
データはRパッケージのISwRに含まれている。Rを使用したCox比例ハザード回帰で、次の図で示すような結果が得られる。
このCox回帰の結果は、次のように解釈される。
要約出力では、ハザード比の95%信頼区間の上限と下限も表示される。下側95%境界=1.15、上側95%境界=3.26。
最後に、モデルの全体的な有意性に関する3つの代替検定の p値 が出力される。
これらの3つの検定は、漸近的に同等である。Nが十分に大きい場合、これらは同様の結果になる。Nが小さい場合、それらは多少異なる場合がある。最終行の「スコア(ログランク)検定」 は、ログランク検定の結果で、p=0.011 である。ログランク検定はCox PH回帰の特殊なケースなので、ログランク検定と同じ結果になる。尤度比検定は、サンプルサイズが小さいほど動作が優れているため、一般的にはこちらが好ましい。
Coxモデルは、追加の共変量を含めることで、ログランク検定を拡張することができる。この例では、予測変数に連続共変量である腫瘍の厚さ(変数名 = thick)が含まれる黒色腫データセットを使用する。
ヒストグラムでは、厚さの値は正規分布に従っていないように見える。Coxモデルを含む回帰モデルは一般的に、正規分布変数の方がより信頼性の高い結果を得る。この例では、対数変換を使用する。腫瘍の厚さの対数は、より正規分布に従っているように見えるため、Coxモデルは厚さの対数を使用する。Cox PH分析では、図に示す結果が得られる。
3つの総合検定(尤度、ワルド、スコア)の p値 はすべて有意であり、モデルが有意であることを示している。log(thick) の p値 は 6.9e-07 で、ハザード比 HR = exp(coef) = 2.18 となり、腫瘍の厚さと命の危険の増加との間に強い関係があることを示している。
一方、性別の p値 は p=0.088 となる。ハザード比 HR = exp(coef) = 1.58 で、95%信頼区間は 0 .934 から 2.68 である。HRの信頼区間には 1 が含まれているので、これらの結果は、腫瘍の厚さを制御した後の、性別がHRの差に与える影響は小さく、有意な傾向があるのみということを示している。性別による log(thickness) のグラフと、性別による log(thickness) の t検定 を調べると、どちらも最初にクリニックを受診した時の腫瘍の厚さに男女の間で有意な差があることがわかる。
Coxモデルは、ハザードが比例することを前提としている。比例ハザードの仮定は、R関数の cox.zph() を使用して検定できる。p値 が 0.05 未満の場合は、ハザードが比例していないことを示している。黒色腫データの場合は p=0.222 であり、ハザードが少なくとも近似的に比例していることを示している。Coxモデルを検討するためのその他の検定やグラフについては、引用した教科書に記載されている。
Coxモデルを拡張して、単純な分析のバリエーションを扱うことができる。
Cox PH回帰モデルは、線形モデルである。これは、線形回帰およびロジスティック回帰に類似している。具体的には、これらの手法は、群(生存または死亡)を分離したり、量的応答(生存期間)を推定するには、単一の線、曲線、平面、または表面で十分であると仮定する。
場合によっては,代替パーティションにより、より正確な分類または定量的な推定が与えられる。代替手法の1つは、生存ランダムフォレストを含む木構造の生存モデルである。木構造の生存モデルは、Coxモデルよりも正確な予測を与えることもある。所与のデータセットで両方のタイプのモデルを検討することは合理的な戦略である。
この生存木分析(survival tree analysis)の例は、Rパッケージ「rpart」を使用している。この例は、rpartのデータセットstagecに含まれる計146人のステージC前立腺がん患者に基づいている。Rpartとstagecの例は、PDFドキュメント「An Introduction to Recursive Partitioning Using the RPART Routines」で説明されている[3]。
このステージの変数は次のとおりである。
この解析で得られた生存木を図に示す。
木の各枝は、変数の値による分岐を示す。例えば、木の根(root)では、グレードが2.5未満の被験者と、グレードが2.5以上の被験者を分割する。末端ノードは、ノード内の被験者の数、事象が発生した被験者の数、および根と比較した相対的な事象発生率を示す。左端のノードでは、1/33 という値は、ノード内の33人の被験者のうち1人が事象を有しており、相対事象率が0.122であることを示している。右端下のノードでは、11/15という値は、ノード内の15人の被験者のうち11人に事象が発生し、相対事象率は2.7であることを示す。
単一の生存木を構築する代わりに、多くの生存木を構築することもできる。各木がデータのサンプルを用いて構築され、木を平均化して生存を予測する。これは、生存ランダムフォレストモデル(survival random forest models)の基礎となる方法である。生存ランダムフォレスト分析は、Rパッケージ「randomForestSRC」で利用できる。
randomForestSRCパッケージには、データセットpbcを使用した生存ランダムフォレスト分析の例が含まれている。このデータは、1974年から1984年にかけてメイヨークリニックで実施された原発性胆汁性肝硬変(PBC)の肝臓治験からのものである。この例では、ランダムフォレスト生存モデルがCox PHモデルよりも正確な生存の予測を行う。予測誤差は、ブートストラップ・リサンプリング法によって推定される。
生存率曲線(せいぞんりつきょくせん、英: survival curve)は、治療を行った後の患者の生存率をグラフにしたものである。生存期間中央値やn年生存率を総合的に読み取ることが可能で、治療方法別の生存率曲線を同一平面にプロットすることにより、治療方法の優劣を評価する事もできる。
なお、確率モデルなどから導出される生存率曲線は滑らかではあるが、実際に観測値を元にしたグラフでは被験者数が限られるため、階段状か、折れ線になり滑らかではない。
ここで主な関心の対象となる生存関数(survival function)は、慣習的に S と表記され、
と定義される。ここで、t はある時間、T は死亡時間を示す確率変数、Pr は確率を表す。つまり、生存関数とは、死亡時間がある特定の時間 t よりも後になる確率である。生存関数は、生物学的な生存問題では生存関数(survivor function, or survivorship function)と呼ばれ、機械的な生存問題では信頼性関数(reliability function)と呼ばれる。後者の場合、信頼性関数は R(t) と表記される。
通常、S(0) = 1 と仮定されるが、即時の死亡または故障の可能性がある場合は 1 未満になることがある。
生存関数は非増加でなければならず、u ≥ t ならば S(u) ≤ S(t) である。この性質は、T>u が T>t を暗示することから直接導かれる。これは、若い年齢がすべて達成された場合に限って、その後の年齢での生存が可能であるという概念を反映している。この特性が与えられることで、生存時間分布関数と事象密度(以下の F と f )は明確に定義される。
生存関数は、通常、年齢が無制限に増加するにつれてゼロに近づくと仮定されるが(すなわち、S(t) → 0 as t → ∞)、永遠の命が可能であれば、その限界はゼロよりも大きくなるであろう。たとえば、生存分析を炭素の安定同位体と不安定同位体の混合物に適用することができる。不安定同位体は遅かれ早かれ崩壊しても、安定同位体は無期限に存続する。
関連する量は、生存関数の観点から定義される。
生存時間分布関数(lifetime distribution function)は、慣習的に F と表記され、生存関数の補数として定義される。
F が微分可能の場合、その微分は生存時間分布の密度関数であり、慣習的に f で表される。
この関数 f は、事象密度(event density)と呼ばれることもあり、単位時間当たりの死亡または故障事象の割合である。
同様に、生存事象密度関数(survival event density function)は次のように定義できる。
統計物理学などの他の分野では、生存事象密度関数は初通過時間密度(first passage time density)と呼ばれている。
ハザード関数(hazard function)は、慣習的に (ラムダ)または と表され、時間 t 以降(すなわち T ≥ t)まで生存していることを条件とした時間 t における事象率(event rate)と定義される。あるアイテムが時間 t まで生存していたとして、さらに時間 dt まで生存しない確率を求めると仮定する。
死力(force of mortality)は、特に人口統計学および保険数理で使用されるハザード関数の同義語で、(ミュー)で表わされる。ハザード率(hazard rate)という用語は別の同義語である。
生存関数の死力 は、次の式で定義される。
死力は故障力(force of failure)とも呼ばれる。これは、死亡率の分布の確率密度関数である。
保険数理では、ハザード率は、x 歳の生命の死亡率である。x 歳の生命の場合、t 年後の死力は、(x + t) 歳の死力となる。ハザード率は故障率とも呼ばれる。ハザード率と故障率は、信頼性理論で使われる名前である。
任意の関数 h は、次の特性を満たしている場合に限り、ハザード関数となる。
実際、ハザード率は通常、生存時間分布の他の表現よりも、故障の根本的な機構についてより多くの情報を提供する。
ハザード関数は、非負で、λ(t) ≥ 0 であること、 での積分が無限大であることが必要で、それ以外の制約はない。それは増加または減少、非単調、または不連続になるだろう。例として、バスタブ曲線ハザード関数は、tの値が小さいときに大きく、ある最小値まで減少し、その後再び増加する。これは、機械システムが導入後すぐに故障するか、あるいはシステムの経年劣化に伴って故障するという特性をモデル化したものである。
あるいは、ハザード関数は、慣習的に (ラムダ)または と呼ばれる累積ハザード関数(cumulative hazard function)で表現することもでき、
符号を入れ替えて指数をとるか、
(連鎖律を使用して)微分することができる。
「累積ハザード関数」という名称は、時間の経過に伴うハザードの「蓄積」であるという事実に由来する。
の定義から、t が無限大に近づくにつれて、 は無制限に増加することがわかる(S(t) がゼロに近づくと仮定する)。これは、定義上、累積ハザードが発散しなければならないため、 が急激に減少してはならないことを意味する。たとえば、は 、その積分が 1 に 収束するため、どの生存分布のハザード関数でもない。
生存関数 S(t)、累積ハザード関数 Λ(t)、密度 f(t)、ハザード関数 λ(t)、および生存時間分布関数 F(t) は、次のとおり関連付けられる。
所与の時間 における余寿命(future lifetime)は、 歳まで生存した場合の死亡までの残り時間である。したがって、現在の表記では となる。期待余寿命(expected future lifetime)とは、余寿命の期待値である。 歳まで生存している場合、 歳以前に死亡する確率は、ちょうど次のとおりとなる。
したがって、余寿命の確率密度は、
となり、期待余寿命は、
となる。2番目の式は部分積分を用いて得られる。
、つまり出生時の場合、これは期待寿命まで減少する。
信頼性問題では、期待寿命を平均故障時間(mean time to failure、MTTF)と呼び、期待余寿命を平均残留寿命(mean residual lifetime)と呼ぶ。
ある個体が t 歳以降まで生存する確率を S(t) とすると、すべての個体の生存関数が同一であると仮定したとき、定義上、 n 人の新生児の初期集団から t 歳時点での生存者の期待数は n × S(t) となる。したがって、期待される生存者の割合は S(t) となる。異なる個体の生存が独立している場合、 t 歳の生存者数はパラメータ n と S(t) を持つ二項分布となり、生存者の割合の分散は S(t) × (1-S(t))/n となる。
特定の割合の生存者が残る年齢は、S(t) = q for t, という方程式を解くことで求めることができる。ここで、 q は当該分位数である。一般的には、 q = 1/2 となる寿命中央値や、 q = 0.90、q = 0.99 などの分位数に関心がある。
打ち切り(censoring)とは、事象が観察されないデータ欠損問題の一つであり、採用されたすべての被験者が関心のある事象を経験する前に研究を終了した場合や、被験者が事象を経験する前に研究を離れたなどの理由で、事象までの時間が観察されない。生存分析では、打ち切りは一般的である。
真の事象時間 T の下限 l のみが T > l となるように分かっている場合、これは右側打ち切り(right censoring)と呼ばれる。右側打ち切りは、たとえば、生年月日がわかっていても、追跡調査が中止されたときや研究が終了したときに、まだ生きている被験者に対して起こる。右側打ち切りのデータは通常見られる。
被験者が研究に参加する前に関心のある事象がすでに起こっていて、それがいつ起こったかがわからない場合、そのデータは左側打ち切り(left-censored)と呼ばれる[4]。事象が2つの観察または検査の間に起こったとしか言えない場合、これは区間打ち切り(interval censoring)である。
左側打ち切りは、たとえば、永久歯の萌出分布を推定することを目的とした歯科研究の開始前に、永久歯がすでに萌出している場合に起こる。同じ研究において、永久歯が今回の検査では口腔内に存在しているが、前回の検査ではまだ存在していない場合、萌出時間は区間打ち切りであう。区間打ち切りは、HIV/AIDS研究でよく行われる。実際、HIV抗体陽転までの時間は、通常、医師の診察後に開始される検査室評価によってのみ決定することができる。そうすると、2回の検査の間にHIV抗体陽転が起こったと結論づけることしかできない。臨床症状に基づくAIDSの診断についても同様で、健康診断で確認する必要がある。
また、寿命がある閾値以下の被験者がまったく観察されないこともあり、これは切り捨て(truncation)と呼ばれる。切り捨ては左側打ち切りとは異なることに注意を要する。左側打ち切りのデータでは対象者の存在を知ることができるのに、切り捨てられたデータでは対象者の存在を全く認識しない場合がある。切り捨ても一般的である。いわゆる遅延参加研究(delayed entry study)では、被験者がある年齢に達するまでまったく観察されない。たとえば、学校に入学する年齢に達するまで人々は観察されない場合がある。就学前の年齢層で死亡した被験者は不明である。左側切り捨てデータ(left-truncated data)は、生命保険および年金など保険数理計算でよく見られる[5]。
左側打ち切りデータ(left-censored data)は、ある人の生存時間が、その人の追跡期間の左側で不完全になったときに起こりうる。たとえば、疫学では、ある感染症の患者を、その感染症の検査で陽性になった時点から監視することがある。関心のある期間の右側はわかっても、感染性病原体に曝露された正確な時間は決して知ることができないこともある[6]。
生存モデル(survival models)は、目的変数が時間である通常の回帰モデルと見なすことができる。しかし、尤度関数の計算(パラメータの適合や他の種類の推論に必要な)は、打ち切りによって複雑になる。打切りデータがある場合の生存モデルの尤度関数は、次のように定式化される。定義によれば、尤度関数は、モデルのパラメータが与えられた場合の、データの条件付き確率である。通常、パラメータが与えられると、データは独立であると仮定する。その場合、尤度関数は、各データの尤度の積である。データを4つのカテゴリー(打ち切り無し、左側打ち切り、右側打ち切り、区間打ち切り)に分けると便利である。これらは下の式でそれぞれ「unc.」、「l.c.」、「r.c.」、「i.c.」と示されている。
が死亡時の年齢に等しい打ち切り無しデータの場合、次の式を得る。
死亡時の年齢が 未満であることがわかっているような左側打ち切りデータの場合、次の式を得る。
死亡時の年齢が より大きいことがわかっているような右側打ち切りデータの場合、次の式を得る。
死亡時の年齢が 未満で より大きいことがわかっているような区間打切りデータの場合、次の式を得る。
区間打ち切りデータが発生する重要なアプリケーションは現在の状況データであり、事象 は、ある観測時間以前には発生しておらず、次の観測時間以前には発生していることがわかっている。
カプラン=マイヤー推定量は、生存関数の推定に使用できる。ネルソン=アーラン推定量は、累積ハザード率関数のノンパラメトリックな推定に使用できる。
Kleinbaumの教科書[7][8]には、SAS、R、およびその他のパッケージを使用した生存分析の例が載っている。Brostrom[9], Dalgaard[2], Tableman, Kim[10]の教科書には、Rを使用した(あるいはSを使ってRで実行した)生存分析の例が示されている。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.