En mathématiques, plus précisément en théorie des probabilités, le théorème de Cochran concerne la projection d'un vecteur aléatoire gaussien sur des sous-espaces vectoriels orthogonaux de dimensions finies[1]. Il établit la loi et l'indépendance de ces projections et de leurs normes euclidiennes. Ce théorème est utilisé en statistique pour justifier la convergence en loi de tests statistiques et est l'argument clé pour des résultats de base du modèle linéaire.
La version générale de ce théorème est la suivante :
Théorème de Cochran — Soient X un vecteur aléatoire gaussien de de loi (où , σ > 0 et Idn est la matrice identité de taille n), ainsi que F1, ..., Fm des sous-espaces vectoriels de , orthogonaux deux à deux et de somme .
Alors, si l'on note pour 1 ≤ i ≤ m, PFi la matrice de la projection orthogonale sur Fi et di la dimension de Fi :
- les vecteurs aléatoires PF1X, ...,PFmX sont deux à deux indépendants et de lois respectives ;
- les variables aléatoires réelles sont deux-à-deux indépendantes et sont de lois respectives χ2(d1), ...,χ2(dm).
Une version simplifiée mais équivalente est l'énoncé suivant :
Théorème de Cochran (simplifié) — Soit X un vecteur aléatoire gaussien de de loi et F un sous-espace vectoriel de de dimension d, F⊥ son orthogonal et PF,PF⊥ les matrices des projections orthogonales sur F, F⊥. Alors :
- les vecteurs aléatoires PFX,PF⊥X sont indépendants et de lois respectives ;
- les variables aléatoires réelles |PFX|2,|PF⊥X|2 sont indépendantes et de lois respectives χ2(d),χ2(n – d).
On peut passer de la version simplifiée à la version générale du théorème en appliquant une récurrence sur le nombre de sous-espaces vectoriels (qui interviennent dans l'énoncé) et en effectuant le changement de variable . Il suffit donc de démontrer la version simplifiée.
On note avec . Alors et par conséquent, PFX et PF⊥X sont des vecteurs gaussiens. On a . En effet :
- car est une projection
- car est une projection
- car et sont orthogonaux.
Ainsi, comme est diagonale par blocs, les vecteurs aléatoires PFX et PF⊥X sont indépendants et ont pour lois respectives et .
Pour la norme de la projection, il suffit de prendre (u1,...,ud) une base orthonormée de F et (ud + 1,...,un) une base orthonormée de F⊥. Alors
On écrit avec U la matrice de passage de la base canonique à la base (u1,...,un). Ainsi car U est orthogonale. Donc les variables aléatoires sont normales centrées et puisque la matrice de covariance est diagonale elles sont indépendantes. Par définition de la loi du χ2,
.
Estimateur non biaisé de la variance
On se donne un échantillon X = (X1,...,Xn)T de loi normale .
On note la moyenne empirique et la variance empirique non biaisée Alors
Remarque : on a perdu un degré pour la loi du khi deux.
Démonstration
On applique le théorème de Cochran avec le sous-espace vectoriel F = Vect(1n) (où 1n est le vecteur colonne de constitué uniquement de 1) au vecteur aléatoire Y = 1/σ(X1 – μ, ..., Xn – μ)t = 1/σ(X – μ1n) de loi .
- La matrice de projection sur F est PF = 1n (1t
n 1n)−1 1t
n = 1/n 1n 1t
n et celle sur F⊥ est par conséquent PF⊥ = Idn – PF.
- La projection de Y sur F est
PFY = 1/σ(PFX – μ PF1n) = 1/σ(Xn – μ, ..., Xn – μ)t.
- La projection de Y sur est .
D'après le théorème de Cochran, .