Metoda Pawłowskiego

Z Wikipedii

Metoda Pawłowskiego - metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona przez Z. Pawłowskiego.

Załóżmy, że istnieje zbiór X = {X₁, X₂,..., X_j} potencjalnych zmiennych objaśniających dla zmiennej objaśnianej Y. Do modelu może wejść m zmiennych, gdzie m < p.

Wybieramy taką kombinację, która zapewnia z góry ustaloną dokładność opisu zmiennej Y oraz możliwie najmniejsze skorelowanie między m-elementową kombinacją zmiennych objaśniających.

Aby model był dokładny zakłada się, że wartość współczynnika korelacji wielorakiej między zmienną endogeniczną a m-elementowym zbiorem zmiennych objaśniających była nie mniejsza niż z góry zadana liczba δ > 0

Oznaczamy r_j jako współczynnik korelacji między zmienną objaśnianą Y a zmienną objaśniającą X_j, a także współczynnik korelacji r_jl między zmiennymi objaśniającymi X_j i X_l. Otrzymane współczynniki korelacji między zmiennymi objaśniającymi tworzą macierz korelacji R, natomiast współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi wektor korelacji R₀:

$R = \begin{bmatrix} 1 & r_12 & ... & r_1m \\ r_21 & 1 & ... & r_2m \\ ... & ... & ... & ... \\ r_m1 & r_m2 & ... & 1 \end{bmatrix}, R_0 = \begin{bmatrix} r_1 \\ r_2 \\ ... \\ r_m \end{bmatrix}$

Następnie budujemy tzw. macierz rozszerzoną R*:

$R = \begin{bmatrix} 1 & R_0^T \\ R_0 & R \end{bmatrix}$

Macierze R oraz R* wykorzystujemy do budowy współczynnika korelacji wielorakiej R, który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją zmiennych objaśniających. Obliczny jest ze wzoru:

$R = \sqrt{1 - \frac {|R^*|}{|R|}} \in [0,1],$

gdzie:

|R*| - wyznacznik macierzy korelacji m-elementowej kombinacji zmiennych objaśniających, do której dołączono wektor współczynników korelacji zmiennej endogenicznej ze zmiennymi objaśniającymi,
|R| - wyznacznik z macierzy korelacji m-elementowej kombinacji zmiennych objaśniających.

Współczynnik korelacji wielorakiej przyjmuje wartości z przedziału [0,1]. Jeżeli R=0, to nie ma zależności liniowej, natomiast gdy R=1, to między zmienną objaśniana, a liniową kombinacją zmiennych objaśniających zachodzi zależność funkcyjna liniowa. W związku z tym, im wyższa jest wartość współczynnika, to tym większa jest zależność funkcyjna.

Aby wybrać optymalną kombinację rozpatrujemy wszystkie m-elementowe kombinacje, jakie można utworzyć ze zbioru X potencjalnych zmiennych objaśniających. Następnie wybieramy te kombinacje, które spełniają warunek dokładności ( $R \geq \delta$ ), a tworzą one zbiór kombinacji dopuszczalnych. Wśród wybranych kombinacji poszukuję się najlepszej, czyli takiej, w której zmienne objaśniające są najsłabiej skorelowane między sobą.

Za najbardziej optymalną przyjmuję się taką kombinację j zmiennych, gdzie wyznacznik z macierzy korelacji jest największy (R = max), ponieważ im wyznacznik jest bliższy jedności, tym zmienne są słabiej skorelowane.

[edytuj] Bibliografia

A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X,
J. Dziechciarz, Ekonometria. Metody, przykłady, zadania., Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9

Kategorie: Ekonometria • Przygotowanie danych • Modelowanie statystyczne

We provide Linux to the World

Metoda Pawłowskiego

Z Wikipedii

[edytuj] Bibliografia

Views

nawigacja

zmiany

dla edytorów

Szukaj