Centralne twierdzenie graniczne
Z Wikipedii
Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.
Spis treści |
[edytuj] Teza
[edytuj] Sformułowanie szczególne
Centralne twierdzenie graniczne to twierdzenie matematyczne mówiące, że jeśli Xi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie, takiej samej wartości oczekiwanej μ i skończonej wariancji σ2, to zmienna losowa o postaci
zbiega według rozkładu do standardowego rozkładu normalnego gdy n rośnie do nieskończoności.
[edytuj] Sformułowanie ogólne
Centralne twierdzenie graniczne znane też pod nazwą Twierdzenie Lindeberga-Lévy'ego orzeka:
Niech (Xn,k) będzie schematem serii, w którym EXn,k = 0 dla i dla każdego n mamy . Jeśli spełniony jest warunek Lindeberga, tj. dla każdego ε > 0 zachodzi , wtedy .
[edytuj] Dowód
Dowodów Centralnego Twierdzenia Granicznego w wersji ogólnej jest kilka. Wszystkie są dość skomplikowane i wymagają korzystania z wielu zaawansowanych narzędzi matematycznych. Poniżej znajduje się jeden z prostszych dowodów, nie dający jednak oszacowania wartości błędu.
Pierwszym krokiem dowodu jest sformułowanie i udowodnienie użytecznych lematów.
Lemat 1
Niech będzie funkcją trzykrotnie różniczkowalną taką, że zachodzi oraz . Wówczas:
- a)
- b) .
Dowód
Oznaczmy . Wówczas .
Ustalmy dowolne y > 0. Wówczas zgodnie z twierdzeniem Lagrange'a istnieją takie z,t,w > 0, że:
Na tej samej zasadzie:
- .
Lemat 2
Jeżeli X˜N(0,1), to
Dowód
Dokonujemy podstawienia :
Teraz całkujemy przez części:
- .
Drugi krok polega na oszacowaniu pewnej wartości:
Niech będzie funkcją trzykrotnie różniczkowalną taką, że oraz .
Rozważamy niezależne zmienne (Gn,k) o rozkładzie normalnym takie, że oraz D2Gn,k = D2Xn,k.
Wówczas :
- .
Przy czym ostatnia nierówność to nierówność trójkąta.
Drugi ze składników daje się na podstawie Lematu 1 oszacować w sposób następujący:
- .
Tymczasem , gdzie G˜N(0,1). W związku z tym (korzystając z Lematu 2):
- .
Wobec tego
- .
Pierwszy ze składników można natomiast oszacować w sposób następujący:
- .
Z kolei szacujemy:
oraz
- .
Ostatnia nierówność wynika z Lematu 1.
Zatem mamy następujące oszacowanie:
- | Ef(x + Xn,k) − Ef(x + Gn,k) | .
Trzeci krok polega na wielokrotnym zastosowaniu oszacowania uzyskanego powyżej.
- .
Rozpatrzmy k-ty z powyższych wyrazów.
Podstawiamy
- .
Zmienna Y jest niezależna od Xn,k i Gn,k. Wobec tego:
- − Ef(y + Gn,k) | dμY(y).
Zatem:
. Pierwszy i ostatni składnik z warunku Lindeberga zbiegają do zera, gdy n dąży do nieskończoności. W związku z tym:
- .
Oznacza to, że:
- , gdzie G˜N(0,1).
Czwarty krok polega na wyliczenie dystrybuanty granicznej na podstawie powyższych oszacowań.
Weźmy funkcję spełniającą warunek dla pewnych .
Wówczas:
- .
Ale:
oraz
- .
W związku z tym:
oraz podobnie
- .
Otrzymujemy więc
- .
Ale z ciągłości dystrybuanty rozkładu normalnego wnioskujemy, że
- .
Ponieważ punktowa zbieżność dystrybuant w punktach ciągłości dystrybuanty granicznej jest równoważna zbieżności według rozkładu, więc ostatecznie:
- .
[edytuj] Częste nieporozumienia
- Centralne twierdzenie graniczne nie sprawi, by przy dostatecznie dużej próbie rozkład stał się normalny. Jedynie rozkład średniej z tej próby upodabnia się do normalnego.
- Centralne twierdzenie graniczne jest prawdziwe tylko dla rozkładów o skończonej wariancji. Zobacz stabilność struktury.