Web - Amazon

We provide Linux to the World


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Model statystyczny - Wikipedia, wolna encyklopedia

Model statystyczny

Z Wikipedii

Model statystycznyHipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami ekonomicznymi.

Bardziej formalnie jest to parametryzowana rodzina rozkładów łącznych rozważanych zmiennych, stąd druga nazwa przestrzeń statystyczna.

Modele statystyczne używane w ekonometrii noszą nazwę modeli ekonometrycznych.

Spis treści

[edytuj] Formalna definicja matematyczna

Niech

\mathcal{P}=\{P_\theta \colon \theta \in \Theta\}

będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby \mathcal{X}, indeksowaną parametrem \theta\; (w szczególności może to być wektor parametrów rzeczywistych). P_\theta\; opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie X\;.

Formalnie model statystyczny to para:

(\mathcal{X},\{P_\theta \colon \theta \in \Theta\})

Niech próba opisywana przez rozkład Pθ będzie wektorem X=(X_1,X_2,\dots,X_n) niezależnych zmiennych losowych z których każda ma rozkład P_\theta^\prime a jej zbiorem wartości jest \mathcal{X}^\prime. X nazywany jest n-elementową próbą z rozkładu P_\theta^\prime.

W takim przypadku stosowany jest również zapis

(\mathcal{X}^\prime,\{P_\theta^\prime \colon \theta \in \Theta\})^n

W praktycznych zastosowaniach podaje się po prostu warunek, jaki spełniają rozkłady z rodziny \mathcal{P}. Zmienne losowe występujące w tym warunku determinują przestrzeń próby \mathcal{X}, a parametry tworzą wektor θ.

[edytuj] Model nieparametryczny

Model nieparametryczny to model w którym nie istnieje skończenie wymiarowa parametryzacja rodziny rozkładów, czyli nie da się go zapisać w takiej postaci, że

\Theta\subseteq \mathbb{R}^k, k\in\mathbb{N}

Nie oznacza to braku jakiejkolwiek parametryzacji – to byłoby sprzeczne z definicją modelu statystycznego – np. \Theta\; może być rodziną dystrybuant.

[edytuj] Model identyfikowalny

Jeśli zachodzi:

\theta_1 \ne \theta_2 \Rightarrow P_{\theta_1}\ne P_{\theta_2}

to model nazywany jest identyfikowalnym. Oznacza to, że parametr \theta\; jest jednoznacznie wyznaczony przez rozkład P_\theta\;.

[edytuj] Modele liniowe

Ogólna postać liniowego modelu o G równaniach łącznie współzależnych i tylu zmiennych endogenicznych (objaśnianych) oraz K dodatkowych zmiennych egzogenicznych (objaśniających) przy liczbie t obserwacji:

Y_{1t}=\alpha_{10}+\alpha_{11}X_{1t}+\alpha_{12}X_{2t}+...+\alpha_{1K}X_{Kt}+\beta_{12}Y_{2t}+\beta_{13}Y_{3t}+...+\beta_{1G}Y_{Gt}+\xi_{1t}\;

Y_{2t}=\alpha_{20}+\alpha_{21}X_{1t}+\alpha_{22}X_{2t}+...+\alpha_{2K}X_{Kt}+\beta_{21}Y_{1t}+\beta_{23}Y_{3t}+...+\beta_{2G}Y_{Gt}+\xi_{2t}\;

.....................................................................................................................\;

Y_{Gt}=\alpha_{G0}+\alpha_{G1}X_{1t}+\alpha_{G2}X_{2t}+...+\alpha_{GK}X_{Kt}+\beta_{G1}Y_{1t}+\beta_{G2}Y_{2t}+...+\beta_{G G-1}Y_{G-1 t}+\xi_{Gt}\;

[edytuj] Linia trendu

Najprostszym modelem stosowanym w prognozie jest linia trendu, w której zakładamy następującą zależność między zmienną objaśniającą t (oznaczającą czas) a zmienną objaśnianą Y:

Y=at+b+\varepsilon

gdzie:

[edytuj] Modele nieliniowe

Przykładowym równaniem nieliniowym może być znany w ekonomii model (typu) Cobba-Douglasa.

[edytuj] Systematyka

Modele statystyczne dzielą się m.in. na:

  • Jedno- i wielorównaniowe (z więcej niż jedną zmienną endogeniczną)
  • Przyczynowo-skutkowe i symptomatyczne
  • Statyczne i dynamiczne (autoregresyjne, trendu)
  • Proste, rekurencyjne i o równaniach łącznie współzależnych.
  • Liniowe i nieliniowe
  • Klasyczne i bayesowskie

Warto wyróżnić następujące typy modeli:

  • Modele klasy ARMA (auto-regression with moving average) i ARIMA (auto-regression integrated with moving average)
  • Modele korekty błędem (ECM - error correction model)
  • VAR (modele wektorowej autoregresji) i modyfikacje
    • VAR (vector auto-regression)
    • VARMA (vector autoregression with moving average)
    • VEC (vector error correction)
  • Modele panelowe
  • Modele równowagi ogólnej
    • CGE (Computable General Equilibrium)
    • DCGE (Dynamic Computable General Equilibrium)

[edytuj] Metody doboru zmiennych i postaci modelu

Powyższe metody wykorzystywane przy estymacji klasycznych modeli ekonometrycznych są kontrowersyjne a ich naukowość jest kwestionowana.

W praktyce przy doborze zmiennych objaśniających należy kierować się na wstępie zdrowym rozsądkiem i teorią dotyczącą badanego zagadnienia.
Dobór zmiennych zależy również od jakości oszacowania modelu przy danych zmiennych (wykazany brak spełnienia założeń użytej metody estymacji, takie jak dla KMNK heteroskedastyczność, autoregresyjność czy brak rozkładu normalnego reszt, wskazuje na konieczność użycia innego zestawu zmiennych objaśniających). W ten sposób budowa finalnego modelu ma charakter iteracyjny.

Specyficznym przypadkiem są modele trendu, których postać ustalana jest w sposób najbardziej techniczny, w oparciu o parametry dopasowania modelu oraz tak zwane kryteria informacyjne (najbardziej znane z nich: Akaike i Schwarza).

[edytuj] Metody estymacji parametrów modelu

Do estymacji parametrów modelu często stosowane są metody regresji statystycznej.

[edytuj] Badanie jakości modelu regresyjnego

W celu oceny jakości modelu stosuje się rozmaite testy statystyczne badające jego własności. Dobór testów powinien zależeć od przewidywanego zastosowania modelu (najczęstsze to wyjaśnianie oraz prognozowanie).

Najczęstszym zadaniem testów jest sprawdzenie spełnienia założeń przyjętych w użytej metodzie estymacji (najczęściej dotyczą one rozkładu błędów losowych). Inne testy mają za zadanie ocenę stabilności czy dopasowania modelu.

W szczególności, można wyróżnić następujące własności modelu najczęściej badane za pomocą testów statystycznych:

  • Rozkład błędów losowych
    • Autokorelacja
    • Homoskedastyczność
    • Niezależność
  • Dopasowanie
  • Postać modelu (np. liniowa)
  • Jakość prognoz
  • Stabilność

[edytuj] Mierniki dopasowania

[edytuj] Współczynnik determinacji

R^2  = {{\sum\limits_{t = 1}^n {\left( {\hat y_t  - \overline y } \right)^2 } } \over {\sum\limits_{t = 1}^n {\left( {y_t  - \overline y } \right)^2 } }},

gdzie:

y_t\, - wartość zmiennej Y w momencie t
\hat y_t - wartość teoretyczna zmiennej Y w momencie t
\overline y - wartość średnia zmiennej Y w szeregu czasowym

Współczynnik ten informuje o dopasowaniu liniowego modelu regresji do danych empirycznych. Przyjmuje wartości z przedziału [0;1]. Im wartość bliższa jedności, tym lepsze dopasowanie.

[edytuj] Skorygowany współczynnik determinacji

Kiedy wartość R2 chce się wykorzystać do porównywania jakości kilku modeli, w których liczba zmiennych objaśniających jest różna, stosuje się skorygowany współczynnik determinacji:

\tilde R^2  = 1 - {{n - 1} \over {n - m - 1}}\left( {1 - R^2 } \right)

gdzie:

R^2\, - współczynnik determinacji
n\, - liczba obserwacji
m\, - liczba zmiennych objaśniających (bez zmiennej przy wyrazie wolnym)

[edytuj] Odchylenie standardowe składnika resztowego

Wartość tego miernika informuje o przeciętnych odchyleniach wartości rzeczywistych zmiennej prognozowanej od teoretycznych. Im wartości mniejsze, tym lepszy model.

s = \sqrt {\left[ {{1 \over {n - m - 1}}\sum\limits_{t = 1}^n {\left( {y_t  - \hat y_t} \right)^2 } } \right]}

gdzie:

n\, - liczba obserwacji
m\, - liczba zmiennych objaśniających (bez zmiennej przy wyrazie wolnym)
y_t\, - wartość zmiennej Y w momencie t
\hat y_t - wartość teoretyczna zmiennej Y w momencie t

[edytuj] Współczynnik zmienności

V_e = {s \over {\overline y }} \cdot 100

gdzie:

s\, - odchylenie standardowe składnika resztowego
\overline y\, - wartość średnia zmiennej Y w szeregu czasowym

Współczynnik zmienności informuje o tym, jaką część wartości średniej zmiennej objaśnianej stanowi odchylenie standardowe składnika resztowego. Im mniejsza wartość tego współczynnika, tym model jest lepszy.

[edytuj] Badanie istotności parametrów modelu

Badanie istotności parametrów modelu jest próbą stwierdzenia istotności wpływu zmiennych objaśniających na zmienną objaśnianą. Zakładając, że składnik losowy ma rozkład normalny, należy zweryfikować hipotezę o istotności każdego parametru.

H_0 :\left[ {\alpha _i  = 0} \right]
H_1 :\left[ {\alpha _i  \ne 0} \right]

gdzie:

\alpha_i\, - parametr przy i-tej zmiennej objaśniającej
H_0\, - i-ta zmienna objaśniająca nieistotnie wpływa na zmienną objaśnianą i powinna być usunięta z modelu
H_1\, - i-ta zmienna objaśniająca istotnie wpływa na zmienną objaśnianą

Aby sprawdzić prawdziwość hipotezy zerowej wyznacza się statystykę testową:

t_i  = {{a_i } \over {D\left( {a_i } \right)}},i = 0,1,...,m

gdzie:

a_i\, - ocena parametru przy i-tej zmiennej objaśniającej
D(a_i)\, - błąd oceny i-tego parametru (pierwiastek odpowiedniego elementu macierzy D^2 \left( a \right))

Wartość ai wyznacza się ze wzoru:

a = (X^T X)^{ - 1} X^T y\,

gdzie:

X\, - macierz zmiennych objaśniających
X^T\, - transponowana macierz X
y\, - wektor obserwacji zmiennej objaśnianej

Błąd D(ai):

D^2 \left( a \right) = s^2 \left( {X^T X} \right)^{ - 1}

gdzie:

s^2\, - kwadrat odchylenia standardowego składnika resztowego

Następnie należy odczytać wartość krytyczną t_\alpha\, z tablic rozkładu t-Studenta dla zadanego z góry poziomu istotności α i nm − 1 stopni swobody. Jeżeli

\left| {t_i } \right| > t_\alpha

to hipotezę zerową odrzuca się na rzecz alternatywnej. Jeśli jednak

\left| {t_i } \right| \le t_\alpha  ,

wtedy nie ma podstaw do odrzucenia hipotezy zerowej.

Wymienione powyżej metody badania jakości modelu są najczęściej stosowanymi.

[edytuj] Bibliografia

  • Ryszard Zieliński: Siedem wykładów wprowadzających do statystyki matematycznej. Warszawa: 2004, s. 9.  http://www.impan.gov.pl/~rziel/7ALL.pdf (dostęp: 21 maja 2008)
  • Maria Cieślak: Prognozowanie gospodarcze. Metody i zastosowanie. Ss. 44-47. 

[edytuj] Zobacz też


Zalążek artykułu To jest tylko zalążek artykułu związanego z statystyką. Jeśli możesz, rozbuduj go.

Our "Network":

Project Gutenberg
https://gutenberg.classicistranieri.com

Encyclopaedia Britannica 1911
https://encyclopaediabritannica.classicistranieri.com

Librivox Audiobooks
https://librivox.classicistranieri.com

Linux Distributions
https://old.classicistranieri.com

Magnatune (MP3 Music)
https://magnatune.classicistranieri.com

Static Wikipedia (June 2008)
https://wikipedia.classicistranieri.com

Static Wikipedia (March 2008)
https://wikipedia2007.classicistranieri.com/mar2008/

Static Wikipedia (2007)
https://wikipedia2007.classicistranieri.com

Static Wikipedia (2006)
https://wikipedia2006.classicistranieri.com

Liber Liber
https://liberliber.classicistranieri.com

ZIM Files for Kiwix
https://zim.classicistranieri.com


Other Websites:

Bach - Goldberg Variations
https://www.goldbergvariations.org

Lazarillo de Tormes
https://www.lazarillodetormes.org

Madame Bovary
https://www.madamebovary.org

Il Fu Mattia Pascal
https://www.mattiapascal.it

The Voice in the Desert
https://www.thevoiceinthedesert.org

Confessione d'un amore fascista
https://www.amorefascista.it

Malinverno
https://www.malinverno.org

Debito formativo
https://www.debitoformativo.it

Adina Spire
https://www.adinaspire.com