Teorema del límit central

En matemàtiques, el Teorema del límit central (o Teorema central del límit) diu que la distribució de la suma estandarditzada de variables aleatòries independents amb variància finita tendeix a una distribució normal estàndard quan el nombre de termes de la suma creix indefinidament. Com a conseqüència d'aquest teorema, s'explica el fet que moltes variables aleatòries siguin aproximadament normals i justifica la importància teòrica i pràctica de la distribució normal.

Aquest teorema, pertanyent a la Teoria de la probabilitat, troba aplicació en molts camps relacionats, com ara l'Estadística inferencial o la Teoria de renovació.

Teorema

Enunciat

Existeixen diverses versions del teorema (segons les hipòtesis escollides). L'enunciat més simple és aquest:

Teorema de Lindeberg-Lévy:

Donada una successió ( X n ) n N {\displaystyle (X_{n})_{\,n\,\in \,\mathbb {N} ^{\ast }}} de variables aleatòries ( N = { 1 , 2 , } {\displaystyle \mathbb {N} ^{*}=\{1,2,\dots \}} ) independents i idènticament distribuïdes (abreujadament i.i.d.), amb variància finita, es posa:

μ = E ( X n ) i σ = Var ( X n ) , {\displaystyle \mu =\operatorname {E} (X_{n})\quad {\text{i}}\quad \sigma ={\sqrt {\operatorname {Var} (X_{n})}},}
on se suposa que σ > 0 {\displaystyle \sigma >0} .

Si es defineix per a tot n:

X n ¯ = X 1 + + X n n {\displaystyle {\overline {X_{n}}}={\frac {X_{1}+\cdots +X_{n}}{n}}}
i
X n ¯ = X n ¯ E ( X n ¯ ) Var ( X n ¯ ) = X n ¯ μ σ / n , {\displaystyle {\overline {X_{n}}}\,^{\ast }={\frac {{\overline {X_{n}}}-\operatorname {E} \left({\overline {X_{n}}}\right)}{\sqrt {\operatorname {Var} \left({\overline {X_{n}}}\right)}}}={\frac {{\overline {X_{n}}}-\mu }{\sigma /{\sqrt {n}}}},}
(variable aleatòria estandarditzada associada a X n ¯ {\displaystyle {\overline {X_{n}}}} ), aleshores la successió ( X n ¯ ) n N {\displaystyle {\Big (}{\overline {X_{n}}}\,^{\ast }{\Big )}_{\,n\,\in \,\mathbb {N} ^{\ast }}} convergeix en distribució cap a una variable aleatòria normal estàndard,
X n ¯ D N ( 0 , 1 ) . {\displaystyle {\overline {X_{n}}}\,^{*}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\mathcal {N}}(0,1).}

Altrament dit: t R , {\displaystyle \forall \,t\in \mathbb {R} ,}
lim n P ( X n ¯ t ) = Φ ( t ) . {\displaystyle \lim _{n\to \infty }\mathbb {P} \left({\overline {X_{n}}}\,^{\ast }\leq t\right)=\Phi (t).}
(Vegeu límit d'una successió),

on Φ {\displaystyle \Phi } és la funció de la distribució normal estàndard N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} : per a tot nombre t R {\displaystyle t\in \mathbb {R} } ,

  Φ ( t ) = 1 2 π t e u 2 2 d u . {\displaystyle \ \Phi (t)={\frac {1}{\sqrt {2\,\pi }}}\int _{-\infty }^{t}e^{-{\frac {u^{2}}{2}}}\,du.}
Remarques:

1. L'expressió variable aleatòria normalitzada vol dir que és una variable amb esperança 0 i variància 1. Concretament,

E [ X n ¯ ] = 0 i Var ( X n ¯ ) = 1. {\displaystyle E{\big [}{\overline {X_{n}}}\,^{*}{\big ]}=0\quad {\text{i}}\quad {\text{Var}}{\big (}{\overline {X_{n}}}\,^{*}{\big )}=1.}

2. Un enunciat lleugerament diferent (però equivalent) és aquest, amb les mateixes hipòtesis: Si es defineix per a tot n {\displaystyle n} :

S n = X 1 + + X n i S n = S n E ( S n ) Var ( S n ) = S n n μ σ n , {\displaystyle S_{n}=X_{1}+\cdots +X_{n}\quad {\text{i}}\quad S_{n}^{\ast }={\frac {S_{n}-\operatorname {E} \left(S_{n}\right)}{\sqrt {\operatorname {Var} \left(S_{n}\right)}}}={\frac {S_{n}-n\,\mu }{\sigma \,{\sqrt {n}}}},}
( S n {\displaystyle S_{n}^{*}} és la variable aleatòria estandarditzada associada a S n {\displaystyle S_{n}} ), aleshores la successió ( S n ) n N {\displaystyle \left(S_{n}^{\ast }\right)_{\,n\,\in \,\mathbb {N} ^{\ast }}} convergeix en distribució cap a una variable aleatòria normal estàndard.

Altrament dit: t R , {\displaystyle \forall \,t\in \mathbb {R} ,}

lim n P ( S n t ) = Φ ( t ) . {\displaystyle \lim _{n\to \infty }\mathbb {P} \left(S_{n}^{\ast }\leq t\right)=\Phi (t).}

En efecte, és clar que per a tot n {\displaystyle n} , S n = X n ¯ {\displaystyle S_{n}^{\ast }={\overline {X_{n}}}\,^{\ast }} .

3. Atès que la funció de distribució Φ {\displaystyle \Phi } és contínua, per a s < t {\displaystyle s<t} tenim

lim n P ( s X n ¯ t ) = lim n P ( s < X n ¯ t ) = lim n P ( s < X n ¯ < t ) = lim n P ( s X n ¯ < t ) = Φ ( t ) Φ ( s ) . {\displaystyle \lim _{n\to \infty }\mathbb {P} \left(s\leq {\overline {X_{n}}}\,^{\ast }\leq t\right)=\lim _{n\to \infty }\mathbb {P} \left(s<{\overline {X_{n}}}\,^{\ast }\leq t\right)=\lim _{n\to \infty }\mathbb {P} \left(s<{\overline {X_{n}}}\,^{\ast }<t\right)=\lim _{n\to \infty }\mathbb {P} \left(s\leq {\overline {X_{n}}}\,^{\ast }<t\right)=\Phi (t)-\Phi (s).}

Interpretació

En estadística, el teorema del límit central s'interpreta i s'utilitza així: sigui X 1 {\displaystyle X_{1}} , X 2 {\displaystyle X_{2}} , ..., X n {\displaystyle X_{n}} una mostra aleatòria de mida n d'una distribució amb mitjana μ i variància σ² finites (σ ≠ 0).

Llavors, si n és suficientment gran (una condició freqüent és: n 30 {\displaystyle n\geq 30} ):

  • la variable aleatòria X ¯ = 1 n i = 1 n X i {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}} (mitjana mostral) té aproximadament una distribució (o llei) normal amb mitjana μ X ¯ = μ {\displaystyle \mu _{\overline {X}}=\mu } i variància σ X ¯ 2 = σ 2 / n {\displaystyle \sigma _{\overline {X}}^{2}=\sigma ^{2}/n} . Es diu que X ¯ {\displaystyle {\overline {X}}} és asimptòticament normal [1] amb mitjana μ {\displaystyle \mu } i variància σ 2 / n {\displaystyle \sigma ^{2}/n} , i s'escriu
    X n ¯ és A N ( μ , σ 2 n ) . {\displaystyle {\overline {X_{n}}}\quad {\text{és}}\quad {\mathcal {AN}}(\mu ,{\frac {\sigma ^{2}}{n}}).}
  • També es compleix que la variable aleatòria S n = X 1 + + X n {\displaystyle S_{n}=X_{1}+\cdots +X_{n}} té aproximadament una distribució normal amb mitjana μ S = n μ {\displaystyle \mu _{S}=n\,\mu } i variància σ S 2 = n σ 2 {\displaystyle {\sigma _{S}}^{2}=n\sigma ^{2}}  ; amb la notació anterior
    S n és A N ( n μ , n σ 2 ) . {\displaystyle S_{n}\quad {\text{és}}\quad {\mathcal {AN}}(n\mu ,n\sigma ^{2}).}

Com més gran sigui el valor de n, millor serà l'aproximació. L'aproximació entre les dues distribucions és, en general, major en el centre que en els extrems o cues, motiu pel qual s'anomena "Teorema del límit central" ("central" fa referència al límit de la successió estandarditzada, més que no al teorema).

Importància pràctica

Aquesta propietat d'aproximació té aplicacions pràctiques importants. Sovint, no es coneix la distribució "exacta" d'una variable aleatòria, però es pot aproximar per una distribució normal; fins i tot quan es coneix la distribució exacta, pot resultar més senzill aproximar-la per una distribució normal — sempre que sigui justificat; vegeu més avall el Teorema de De Moivre-Laplace.

Demostració del teorema de Lindeberg-Lévy

Per demostrar aquest teorema, s'utilitzen les funcions característiques i el teorema de continuïtat de Lévy.

Prova del teorema
Per a tota variable aleatòria X es nota per φ X : R C {\displaystyle \varphi _{X}:\mathbb {R} \to \mathbb {C} } la seva funció característica.

Se sap que si el moment d'ordre m de X existeix (finit), aleshores:

t R , φ X ( t ) = ( k = 0 m i k E ( X k ) k ! t k ) + t m ε m ( t ) {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{X}(t)=\left(\sum _{k=0}^{m}{\frac {i^{k}\,\operatorname {E} (X^{k})}{k\,!}}\,t^{k}\right)+t^{m}\,\varepsilon _{m}(t)} , on ε m ( t ) 0  quan  t 0 {\displaystyle \varepsilon _{m}(t)\to 0{\text{ quan }}t\to 0} .

En particular, si   E ( X ) = 0 {\displaystyle \ \operatorname {E} (X)=0} i   Var ( X ) = 1 {\displaystyle \ \operatorname {Var} (X)=1} , aleshores:

t R , φ X ( t ) = 1 t 2 2 + t 2 ε ( t ) {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{X}(t)=1-{\frac {t^{2}}{2}}+t^{2}\,\varepsilon (t)} , on ε ( t ) 0  quan  t 0 {\displaystyle \varepsilon (t)\to 0{\text{ quan }}t\to 0} .

Per a tota variable aleatòria T amb variància finita i no nul·la, es nota per T {\displaystyle T^{\ast }} la variable aleatòria estandarditzada associada:

T = T E ( T ) Var ( T ) {\displaystyle T^{\ast }={\frac {T-\operatorname {E} (T)}{\sqrt {\operatorname {Var} (T)}}}} .

Ara es comença la demostració pròpiament dita. Per a tot n:

S n = S n n μ σ n = X n + + X n n μ σ n = 1 n k = 1 n X k μ σ {\displaystyle S_{n}^{\ast }={\frac {S_{n}-n\,\mu }{\sigma \,{\sqrt {n}}}}={\frac {X_{n}+\cdots +X_{n}-n\,\mu }{\sigma \,{\sqrt {n}}}}={\frac {1}{\sqrt {n}}}\,\sum _{k=1}^{n}{\frac {X_{k}-\mu }{\sigma }}} ,

és a dir:

S n = 1 n k = 1 n X k {\displaystyle S_{n}^{\ast }={\frac {1}{\sqrt {n}}}\,\sum _{k=1}^{n}X_{k}^{\ast }} ;

d'on:

t R , φ S n ( t ) = E ( e i t S n ) = E ( e i t n ( X 1 + + X n ) ) = E ( k = 1 n e i t n X k ) {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)=\operatorname {E} \left(\mathrm {e} ^{\,i\,t\,S_{n}^{\ast }}\right)=\operatorname {E} \left(\mathrm {e} ^{i\,{\frac {t}{\sqrt {n}}}\,(X_{1}^{\ast }+\cdots +X_{n}^{\ast }\,)}\right)=\operatorname {E} \left(\,\prod _{k=1}^{n}\mathrm {e} ^{i\,{\frac {t}{\sqrt {n}}}X_{k}^{\ast }}\right)} .

A més, com que X 1 {\displaystyle X_{1}} , X 2 {\displaystyle X_{2}} , ..., X n {\displaystyle X_{n}} són independents i idènticament distribuïdes, també ho són les variables aleatòries X 1 {\displaystyle X_{1}^{\ast }} , X 2 {\displaystyle X_{2}^{\ast }} , ..., X n {\displaystyle X_{n}^{\ast }} ; per tant:

t R , φ S n ( t ) = k = 1 n E ( e i t n X k ) = k = 1 n φ X k ( t n ) {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)=\prod _{k=1}^{n}\operatorname {E} \left(\mathrm {e} ^{i\,{\frac {t}{\sqrt {n}}}X_{k}^{\ast }}\right)=\prod _{k=1}^{n}\varphi _{X_{k}^{\ast }}\left({\frac {t}{\sqrt {n}}}\right)} (per independència de X 1 {\displaystyle X_{1}^{\ast }} , X 2 {\displaystyle X_{2}^{\ast }} , ..., X n {\displaystyle X_{n}^{\ast }} ) i
t R , φ S n ( t ) = [ φ X 1 ( t n ) ] n {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)=\left[\varphi _{X_{1}^{\ast }}\left({\frac {t}{\sqrt {n}}}\right)\right]^{n}} (tots els factors són iguals, car corresponen a variables aleatòries idènticament distribuïdes).

D'altra part:

t R , φ X 1 ( t ) = 1 t 2 2 + t 2 ε ( t ) {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{X_{1}^{\ast }}(t)=1-{\frac {t^{2}}{2}}+t^{2}\,\varepsilon (t)} , on ε ( t ) 0  quan  t 0 {\displaystyle \varepsilon (t)\to 0{\text{ quan }}t\to 0}
(recordem que   E ( X 1 ) = 0 {\displaystyle \ \operatorname {E} (X_{1}^{\ast })=0} i   Var ( X 1 ) = 1 {\displaystyle \ \operatorname {Var} (X_{1}^{\ast })=1} ).

Per consegüent:

t R , φ S n ( t ) = [ φ X 1 ( t n ) ] n = [ 1 t 2 2 n + t 2 n ε ( t n ) ] n {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)=\left[\varphi _{X_{1}^{\ast }}\left({\frac {t}{\sqrt {n}}}\right)\right]^{n}=\left[1-{\frac {t^{2}}{2\,n}}+{\frac {t^{2}}{n}}\,\varepsilon \left({\frac {t}{\sqrt {n}}}\right)\right]^{n}} .

Se'n dedueix que quan n + {\displaystyle n\to +\infty } ,

t R , φ S n ( t ) e t 2 2 ; {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)\to \mathrm {e} ^{-{\frac {t^{2}}{2}}}\,;}
en efecte, si ( u n ) n N {\displaystyle \left(u_{n}\right)_{\,n\,\in \,\mathbb {N} ^{\ast }}} és una successió real o complexa tal que u n α {\displaystyle u_{n}\to \alpha } , on α {\displaystyle \alpha } és un nombre real o complex, aleshores:
( 1 + u n n ) n e α {\displaystyle \left(1+{\frac {u_{n}}{n}}\right)^{n}\to \mathrm {e} ^{\alpha }} quan n + {\displaystyle n\to +\infty } .

Ara bé, si una variable aleatòria T és normal estàndard, la seva funció característica φ T {\displaystyle \varphi _{T}} és tal que:

t R , φ T ( t ) = e t 2 2 ; {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{T}(t)=\mathrm {e} ^{-{\frac {t^{2}}{2}}}\,;}

finalment hem provat que:

t R , φ S n ( t ) φ T ( t )  quan  n + {\displaystyle \forall \,t\in \mathbb {R} ,\,\varphi _{S_{n}^{\ast }}(t)\to \varphi _{T}(t){\text{ quan }}n\to +\infty } .
Segons el teorema de continuïtat de Lévy, la convergència en distribució equival a la convergència puntual de les funcions característiques: per tant, la successió ( S n ) n N {\displaystyle \left(S_{n}^{\ast }\right)_{\,n\,\in \,\mathbb {N} ^{\ast }}} convergeix en distribució cap a una variable aleatòria normal estàndard. Això acaba la prova del teorema de Lindeberg-Lévy.

Exemple

Basat en un exemple de Richard Durrett.[2] Considerem una ruleta europea (és a dir, amb els nombres del 0 al 36; la ruleta americana utilitza, a més, el 00). Estudiarem l'aposta més senzilla que consisteix a apostar 10 € que sortirà un nombre parell; el zero no es considera ni parell ni senar. Si surt un nombre parell ( 2 , 4 , , 36 {\displaystyle 2,4,\dots ,36} ), el jugador guanya 10 € i si surt un nombre senar o el zero, aleshores perd 10 €. El joc és favorable al casino, perquè el 0 desequilibra les apostes: és més probable obtenir 0 o senar (19 resultats favorables) que parell (18 resultats favorables) . Quantifiquem probabilísticament els guanys i pèrdues del jugador i del casino. Suposem un jugador que està jugant diverses partides, i designem per X 1 {\displaystyle X_{1}} el guany o la pèrdua de la primera partida, per X 2 {\displaystyle X_{2}} el corresponent a la segona, i així successivament. Tenim una successió X 1 , X 2 , , {\displaystyle X_{1},\,X_{2},\dots ,} de variables aleatòries independents, i totes amb la mateixa distribució:

X i = {       10 , amb probabilitat    18 37 (surt parell) , 10 , amb probabilitat    19 39 (surt 0 o senar) . {\displaystyle X_{i}={\begin{cases}~~~10,&{\text{amb probabilitat }}\ {\dfrac {18}{37}}\quad {\text{(surt parell)}},\\\\-10,&{\text{amb probabilitat }}\ {\dfrac {19}{39}}\quad {\text{(surt 0 o senar)}}.\end{cases}}}
L'esperança d'aquestes variables és
E ( X i ) = 10 18 37 10 19 37 = 10 37 0 , 27. {\displaystyle E(X_{i})=10\cdot {\frac {18}{37}}-10\cdot {\frac {19}{37}}=-{\frac {10}{37}}\approx -0,27.}
D'acord amb la llei dels grans nombres,

lim n 1 n i = 1 n X i = 0 , 27   quasi segurament . {\displaystyle \lim _{n\to \infty }{\frac {1}{n}}\sum _{i=1}^{n}X_{i}=-0,27\ {\text{quasi segurament}}.}
Això vol dir que si el jugador juga n {\displaystyle n} vegades ( n {\displaystyle n} gran), pot tenir bona sort unes quantes partides, però, si insisteix, en mitjana haurà perdut aproximadament 0,27 € per partida. Més concretament, si, posem, juga 100 partides, aleshores haurà perdut, aproximadament, 27 €. Amb les notacions anteriors, si escrivim
S n = i = 1 n X i , {\displaystyle S_{n}=\sum _{i=1}^{n}X_{i},}
tenim
S 100 27   euros . {\displaystyle S_{100}\approx -27\ {\text{euros}}.}

Amb ajuda del teorema del límit central podem estimar la probabilitat que el jugador, després de 100 partides, no hagi perdut diners, P ( S 100 0 ) {\displaystyle \mathbb {P} (S_{100}\geq 0)} . Amb aquest objectiu, necessitem calcular la desviació típica σ {\displaystyle \sigma } de X i {\displaystyle X_{i}} . Tenim que

E ( X i 2 ) = 10 2 18 37 + ( 10 ) 2 19 37 = 100 , {\displaystyle E(X_{i}^{2})=10^{2}\cdot {\frac {18}{37}}+(-10)^{2}\cdot {\frac {19}{37}}=100,}
d'on
σ 2 = E ( X i 2 ) ( E ( X i ) ) 2 = 100 ( 10 37 ) 2 = 99 , 97. {\displaystyle \sigma ^{2}=E(X_{i}^{2})-{\big (}E(X_{i}){\big )}^{2}=100-{\Big (}{\frac {10}{37}}{\Big )}^{2}=99,97.}

Així,

σ = 99 , 97 10. {\displaystyle \sigma ={\sqrt {99,97}}\approx 10.}
Aleshores, normalitzant la variable S 100 {\displaystyle S_{100}} ,
S 100 100 μ σ 100 = S 100 + 27 100 . {\displaystyle {\frac {S_{100}-100\mu }{\sigma {\sqrt {100}}}}={\frac {S_{100}+27}{100}}.}
Llavors,
P ( S 100 0 ) = P ( S 100 + 27 100 27 100 ) = P ( S 100 + 27 100 0 , 27 ) 1 Φ ( 0 , 27 ) 0 , 39. {\displaystyle \mathbb {P} {\big (}S_{100}\geq 0{\big )}=\mathbb {P} {\Big (}{\frac {S_{100}+27}{100}}\geq {\frac {27}{100}}{\Big )}=\mathbb {P} {\Big (}{\frac {S_{100}+27}{100}}\geq 0,27{\Big )}\approx 1-\Phi (0,27)\approx 0,39.}
(Per calcular aquest nombre s'utilitzen unes taules de la llei normal estàndard). Per tant, aproximadament el 39% de persones que juguen 100 partides guanyen alguna cosa, o, d'una altra manera, al contrari, el 61 % dels jugadors, després de 100 partides, perden diners.

De la mateixa manera podem calcular que la probabilitat que guanyi 200 € és

P ( S 100 200 ) = P ( S 100 + 27 100 200 + 27 100 ) = P ( S 100 + 27 100 2 , 27 ) 1 Φ ( 2 , 27 ) 0 , 01. {\displaystyle \mathbb {P} {\big (}S_{100}\geq 200{\big )}=\mathbb {P} {\Big (}{\frac {S_{100}+27}{100}}\geq {\frac {200+27}{100}}{\Big )}=\mathbb {P} {\Big (}{\frac {S_{100}+27}{100}}\geq 2,27{\Big )}\approx 1-\Phi (2,27)\approx 0,01.}

i així, és pràcticament impossible que el jugador guany 200 €, que no seria guany excessiu, ja que per apostar 100 cops 10 € necessita un bon capital (tenint en compte que a vegades guanya i a vegades perd).

D'altra banda, si ara considerem el casino, que té diverses taules de ruleta i nombrosos jugadors a cada taula, quan s'han fet 10000 jugades, el guany total dels jugadors serà S 10000 {\displaystyle S_{10000}} . Repetim els càlculs anteriors i calculem la probabilitat que S 10000 700 {\displaystyle S_{10000}\leq -700}  :

P ( S 10000 700 ) = P ( S 10000 + 2700 10 10000 700 + 2700 10 10000 ) = P ( S 10000 + 2700 10 10000 2 ) Φ ( 2 ) 0 , 98. {\displaystyle \mathbb {P} {\big (}S_{10000}\leq -700{\big )}=\mathbb {P} {\Big (}{\frac {S_{10000}+2700}{10{\sqrt {10000}}}}\leq {\frac {-700+2700}{10{\sqrt {10000}}}}{\Big )}=\mathbb {P} {\Big (}{\frac {S_{10000}+2700}{10{\sqrt {10000}}}}\leq 2{\Big )}\approx \Phi (2)\approx 0,98.}
Així, el casino, de forma lenta però pràcticament segura, haurà guanyat almenys 700 €.

Il·lustració gràfica

Una densitat de probabilitat

Densitat de probabilitat inicial

La densitat de probabilitat f 1 {\displaystyle f_{1}} representada aquí és discontínua i no té cap simetria. Si una variable aleatòria segueix la distribució definida per aquesta densitat, aleshores la seva mitjana és 0 i la seva variància és 1.

Considerem aquí variables aleatòries independents i idènticament distribuïdes X 1 {\displaystyle X_{1}} , X 2 {\displaystyle X_{2}} , X 3 {\displaystyle X_{3}} ... que segueixen la distribució definida per aquesta densitat.

Densitat de la suma de dues variables

Suma de dues variables aleatòries

Després determinem la densitat f 2 {\displaystyle f_{2}} de S 2 = X 1 + X 2 {\displaystyle S_{2}=X_{1}+X_{2}} (per convolució de f 1 {\displaystyle f_{1}} per f 1 {\displaystyle f_{1}} ).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S 2 {\displaystyle S_{2}^{\ast }} associada a S 2 {\displaystyle S_{2}} .

Aquesta densitat ja és més regular (més "llisa") que la densitat inicial. Tanmateix, s'hi veuen punts angulosos.

Densitat de la suma de tres variables

Suma de tres variables aleatòries

Després determinem la densitat f 3 {\displaystyle f_{3}} de S 3 = X 1 + X 2 + X 3 {\displaystyle S_{3}=X_{1}+X_{2}+X_{3}} (per convolució de f 1 {\displaystyle f_{1}} per f 2 {\displaystyle f_{2}} ).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S 3 {\displaystyle S_{3}^{\ast }} associada a S 3 {\displaystyle S_{3}} .

Aquesta densitat és encara més regular que la precedent.

Densitat de la suma de quatre variables

Suma de quatre variables aleatòries

Finalment, determinem la densitat f 4 {\displaystyle f_{4}} de S 4 = X 1 + X 2 + X 3 + X 4 {\displaystyle S_{4}=X_{1}+X_{2}+X_{3}+X_{4}} (per convolució de f 1 {\displaystyle f_{1}} per f 3 {\displaystyle f_{3}} ).

La densitat de probabilitat representada és la de la variable aleatòria estandarditzada S 4 {\displaystyle S_{4}^{\ast }} associada a S 4 {\displaystyle S_{4}} .

A ull nu, no es pot distingir aquesta densitat de la densitat normal estàndard.

Cas particular: el teorema de De Moivre-Laplace

Aquest cas particular del teorema del límit central en va ser històricament la primera atestació.

S'enuncia així:

Sigui una successió ( X n ) n N {\displaystyle (X_{n})_{\,n\,\in \,\mathbb {N} ^{\ast }}} de variables aleatòries de Bernoulli independents amb paràmetre (comú) p, on 0 < p < 1 {\displaystyle 0<p<1} . Per a tot n,

E ( X n ) = p  i  Var ( X n ) = p ( 1 p ) {\displaystyle \operatorname {E} (X_{n})=p\,{\text{ i }}\,\operatorname {Var} (X_{n})=p\,(1-p)}
són finites.

Llavors, el teorema del límit central és aplicable. En aquest cas, S n = X 1 + + X n {\displaystyle S_{n}=X_{1}+\cdots +X_{n}} és una variable aleatòria binomial de paràmetres n {\displaystyle n} i p {\displaystyle p} , i per tant, amb esperança n p {\displaystyle np} i variància n p ( 1 p ) {\displaystyle np(1-p)} . Aleshores, si designem per B ( n , p ) {\displaystyle B(n,p)} una distribució binomial de paràmetres n {\displaystyle n} i p {\displaystyle p} , amb les noacions que hem introduit abans,

B ( n , p ) és A N ( n p , n p ( 1 p ) ) . {\displaystyle B(n,p)\quad {\text{és}}\quad {\mathcal {AN}}{\big (}np,np(1-p){\big )}.}
Remarques:

  1. Aquesta aproxiamció s'acepta per a n p ( 1 p ) > 18 {\displaystyle np(1-p)>18} . La qualitat de l'aproximació millora amb la simetria de la funció de probabilitat de la binomial: com més propera sigui p {\displaystyle p} a 1/2, millor serà l'aproximació.
  2. Correcció per continuïtat. Siguin a b {\displaystyle a\leq b} dos nombres naturals. A l'utilitzar l'aproximació normal per calcular
    P ( a B ( n , p ) b ) ) {\displaystyle \mathbb {P} {\big (}a\leq B(n,p)\leq b){\big )}}
    es recomana canviar l'interval [ a , b ] {\displaystyle [a,b]} per ( a 0 5 , b + 0 5 ) {\displaystyle (a-0'5,b+0'5)} , en altres paraules, per n {\displaystyle n} gran,
    P ( a B ( n , p ) b ) ) Φ ( ( b + 0 5 n p ) / n p ( 1 p ) ) Φ ( ( a 0 5 n p ) / n p ( 1 p ) ) . {\displaystyle \mathbb {P} {\big (}a\leq B(n,p)\leq b){\big )}\approx \Phi {\big (}(b+0'5-np)/{\sqrt {np(1-p)}}{\big )}-\Phi {\big (}(a-0'5-np)/{\sqrt {np(1-p)}}{\big )}.}

    Quan l'aproximació es fa d'aquesta manera es diu que s'ha fet una correcció per continuïtat.
  3. De Moivre va estudiar el cas de les variables aleatòries de Bernoulli amb paràmetre p = 1 / 2 {\displaystyle p=1/2} (joc de cara o creu) l'any 1714 i Laplace el va generalitzara qualsevol p {\displaystyle p} l'any 1812 .
  4. Si n és suficientment gran, la variable aleatòria X n ¯ {\displaystyle {\overline {X_{n}}}} té aproximadament una distribució normal amb mitjana   p {\displaystyle \ p} i variància p ( 1 p ) n {\displaystyle {\frac {p\,(1-p)}{n}}} . En estadística inferencial, es pot utilitzar aquesta aproximació per construir intervals de confiança per a una proporció desconeguda p .

Aplicació: simulació de la distribució normal estàndard

Sigui una successió ( X n ) n N {\displaystyle (X_{n})_{\,n\,\in \,\mathbb {N} ^{\ast }}} de variables aleatòries independents i idènticament distribuïdes amb distribució uniforme contínua sobre l'interval [0, 1]. Se sap que per a tot n,

E ( X n ) = 1 2  i  Var ( X n ) = 1 12 {\displaystyle \operatorname {E} (X_{n})={\frac {1}{2}}\,{\text{ i }}\,\operatorname {Var} (X_{n})={\frac {1}{12}}} són finites.

El teorema del límit central és aplicable. Si es defineix per a tot n:

S n = X 1 + + X n {\displaystyle S_{n}=X_{1}+\cdots +X_{n}} i
T n = S n = S n E ( S n ) Var ( S n ) = S n n 2 n 12 {\displaystyle T_{n}=S_{n}^{\ast }={\frac {S_{n}-\operatorname {E} \left(S_{n}\right)}{\sqrt {\operatorname {Var} \left(S_{n}\right)}}}={\frac {S_{n}-{\frac {n}{2}}}{\sqrt {\frac {n}{12}}}}} ,

aleshores la successió ( T n ) n N {\displaystyle (T_{n})_{\,n\,\in \,\mathbb {N} ^{\ast }}} convergeix en distribució cap a una variable aleatòria normal estàndard. Tenint en compte la simetria de la distribució uniforme contínua sobre l'interval [0, 1], la convergència és molt ràpida: es considera que a partir del valor n = 12, l'aproximació de la distribució de T n {\displaystyle T_{n}} per la distribució normal estàndard és excel·lent; en particular, es pot considerar que la distribució de

T 12 = S 12 6 = X 1 + + X 12 6 {\displaystyle T_{12}=S_{12}-6=X_{1}+\cdots +X_{12}-6}

és pràcticament normal estàndard.

En un llenguatge de programació on existeix un generador de nombres pseudoaleatoris (sovint anomenat "random") simulant una variable aleatòria amb distribució uniforme contínua sobre l'interval [0, 1], és fàcil simular una variable aleatòria (pràcticament) normal estàndard. Heus aquí un algorisme en Pascal:

T := - 6.0;
for k := 1 to 12 do T : = T + random;

La variable T, que simula la variable aleatòria T 12 {\displaystyle T_{12}} , és (pràcticament) normal estàndard.

Contraexemple quan no existeix l'esperança

En totes les versions del teorema del límit central, se suposa l'existència de la variància (finita) de cadascuna de les variables aleatòries de la successió.

Sigui una successió ( X n ) n N {\displaystyle (X_{n})_{\,n\,\in \,\mathbb {N} ^{\ast }}} de variables aleatòries independents i idènticament distribuïdes amb distribució de Cauchy simètrica C ( 0 , γ ) {\displaystyle {\mathcal {C}}(0,\,\gamma )} ; no tenen ni mitjana ni variància.

Aleshores, per a tot n, la variable aleatòria

X n ¯ = X 1 + + X n n {\displaystyle {\overline {X_{n}}}={\frac {X_{1}+\cdots +X_{n}}{n}}}

segueix la mateixa distribució de Cauchy C ( 0 , γ ) {\displaystyle {\mathcal {C}}(0,\,\gamma )} que cadascuna de les variables aleatòries X 1 , X 2 , {\displaystyle X_{1},\,X_{2},\dots } (és fàcil demostrar-ho mitjançant les funcions característiques): no hi ha convergència cap a una distribució normal.

Teorema del límit central multidimensional

Sigui ( X n ) n N {\displaystyle ({\boldsymbol {X}}_{n})_{n\in \mathbb {N} ^{*}}} una successió de vectors aleatoris independents i idènticament distribuïts, tals que totes les components tinguin variància finita, amb vector d'esperances μ {\displaystyle {\boldsymbol {\mu }}} i matriu de variàncies covariàncies Σ {\displaystyle {\boldsymbol {\Sigma }}} . Aleshores

n ( 1 n i = 1 n X i μ ) D N ( 0 , Σ ) , {\displaystyle {\sqrt {n}}{\Big (}{\frac {1}{n}}\sum _{i=1}^{n}{\boldsymbol {X}}_{i}-{\boldsymbol {\mu }}{\Big )}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\mathcal {N}}({\boldsymbol {0}},{\boldsymbol {\Sigma }}),}
on N ( 0 , Σ ) {\displaystyle {\mathcal {N}}({\boldsymbol {0}},{\boldsymbol {\Sigma }})} és una distribució normal multidimensional centrada amb matriu de variàncies covariàncies Σ {\displaystyle {\boldsymbol {\Sigma }}} .[3]

Bibliografia

  • De Moivre (Abraham) — The Doctrine of Chances, or a Method of Calculating the Probabilities of Events in Play. — London, 1756
  • Laplace (Pierre-Simon) — Théorie analytique des probabilités. — Paris, 1812
  • Feller (William)An Introduction to Probability Theory and Its Applications. (vol. 2) — New York, 1971. John Wiley & Sons

Referències

  1. Una successió de variables aleatòries Y 1 , Y 2 , {\displaystyle Y_{1},Y_{2},\dots } tal que ( Y n m n ) / r n {\displaystyle (Y_{n}-m_{n})/r_{n}} convergeix en distribució a una variable normal estàndard es diu que és asimptòticament normal i s'escriu Y n {\displaystyle Y_{n}} és A N ( m n , r n 2 ) {\displaystyle {\mathcal {AN}}(m_{n},r_{n}^{2})} . Vegeu Serfling, R. J., Approximation theorems of mathematical statistics, Wiley, 1980,isbn=0-471-02403-1, pàgina 20}}
  2. Durrett, Richard. Probability : theory and examples. Pacific Grove, Calif.: Wadsworth & Brooks/Cole Advanced Books & Software, 1991. ISBN 0-534-13206-5. 
  3. Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 28. ISBN 0-471-21927-4. 

Enllaços externs

  • Animated examples of the CLT (una il·lustració gràfica de la convergència en el cas de la distribució uniforme contínua sobre l'interval [0, 1]; vegeu supra el paràgraf relatiu a un mètode de simulació de la distribució normal estàndard)
  • Central Limit Theorem Java Arxivat 2007-09-17 a Wayback Machine.
  • Central Limit Theorem interactive simulation to experiment with various parameters
Registres d'autoritat
Bases d'informació