Metoda Pawłowskiego
Z Wikipedii
Metoda Pawłowskiego - metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona przez Z. Pawłowskiego.
Załóżmy, że istnieje zbiór X = {X1, X2,..., Xj} potencjalnych zmiennych objaśniających dla zmiennej objaśnianej Y. Do modelu może wejść m zmiennych, gdzie m < p.
Wybieramy taką kombinację, która zapewnia z góry ustaloną dokładność opisu zmiennej Y oraz możliwie najmniejsze skorelowanie między m-elementową kombinacją zmiennych objaśniających.
Aby model był dokładny zakłada się, że wartość współczynnika korelacji wielorakiej między zmienną endogeniczną a m-elementowym zbiorem zmiennych objaśniających była nie mniejsza niż z góry zadana liczba δ > 0
Oznaczamy rj jako współczynnik korelacji między zmienną objaśnianą Y a zmienną objaśniającą Xj, a także współczynnik korelacji rjl między zmiennymi objaśniającymi Xj i Xl. Otrzymane współczynniki korelacji między zmiennymi objaśniającymi tworzą macierz korelacji R, natomiast współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi wektor korelacji R0:
Następnie budujemy tzw. macierz rozszerzoną R*:
Macierze R oraz R* wykorzystujemy do budowy współczynnika korelacji wielorakiej R, który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją zmiennych objaśniających. Obliczny jest ze wzoru:
gdzie:
- |R*| - wyznacznik macierzy korelacji m-elementowej kombinacji zmiennych objaśniających, do której dołączono wektor współczynników korelacji zmiennej endogenicznej ze zmiennymi objaśniającymi,
- |R| - wyznacznik z macierzy korelacji m-elementowej kombinacji zmiennych objaśniających.
Współczynnik korelacji wielorakiej przyjmuje wartości z przedziału [0,1]. Jeżeli R=0, to nie ma zależności liniowej, natomiast gdy R=1, to między zmienną objaśniana, a liniową kombinacją zmiennych objaśniających zachodzi zależność funkcyjna liniowa. W związku z tym, im wyższa jest wartość współczynnika, to tym większa jest zależność funkcyjna.
Aby wybrać optymalną kombinację rozpatrujemy wszystkie m-elementowe kombinacje, jakie można utworzyć ze zbioru X potencjalnych zmiennych objaśniających. Następnie wybieramy te kombinacje, które spełniają warunek dokładności (), a tworzą one zbiór kombinacji dopuszczalnych. Wśród wybranych kombinacji poszukuję się najlepszej, czyli takiej, w której zmienne objaśniające są najsłabiej skorelowane między sobą.
Za najbardziej optymalną przyjmuję się taką kombinację j zmiennych, gdzie wyznacznik z macierzy korelacji jest największy (R = max), ponieważ im wyznacznik jest bliższy jedności, tym zmienne są słabiej skorelowane.
[edytuj] Bibliografia
- A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X,
- J. Dziechciarz, Ekonometria. Metody, przykłady, zadania., Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9