Web - Amazon

We provide Linux to the World


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Wikipedysta:Loxley/Twierdzenie Greena - Wikipedia, wolna encyklopedia

Wikipedysta:Loxley/Twierdzenie Greena

Z Wikipedii

Ekstrema lokalne funkcji  zaznaczone na niebiesko (maksimum) i czerwono (minimum).
Ekstrema lokalne funkcji \scriptstyle{f(x)=2x^3-9x^2+12x-3} zaznaczone na niebiesko (maksimum) i czerwono (minimum).

Ekstremum – w analizie matematycznej największa lub najmniejsza wartość funkcji.

Jeżeli jest to wartość największa w otoczeniu pewnego punktu, to mówi się o maksimum lokalnym, jeżeli najmniejsza, to nazywa się ją minimum lokalnym; zbiorczo jeden z dwóch przypadków nazywa się ekstremum lokalnym. Jeżeli funkcja jest ograniczona, to ma sens pytanie o ekstrema dla całej dziedziny – największe maksimum i najmniejsze minimum nazywają się wówczas ekstremami globalnymi, bądź absolutnymi.

Ogólnie, o ekstremach można mówić dla dowolnej funkcji, której przeciwdziedzina jest zbiorem uporządkowanym – tylko wówczas da się porównywać jej wartość w danym punkcie z innymi jej wartościami. Zwykle jednak rozważa się ekstrema funkcji o wartościach w liczbach rzeczywistych.

Spis treści

[edytuj] Definicja

Funkcja f o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej (w szczególności po prostu na przedziale liczbowym) ma w punkcie x0 tej przestrzeni minimum lokalne, jeśli istnieje takie otoczenie U punktu x0, że

f(x)\geqslant f(x_0),\; x\in U.

Analogicznie, funkcja ma w punkcie x0 maksimum lokalne, gdy istnieje takie otoczenie U punktu x0, że

f(x)\leqslant f(x_0),\; x\in U.

Z powyższych definicji wynika, że w danym otoczeniu może istnieć więcej niż jedno ekstremum lokalne. Jeżeli w pewnym sąsiedztwie V punktu x0 (czyli zbiorze U \setminus \{x_0\}) spełniony jest jeden z warunków f(x) > f(x_0);\; f(x) < f(x_0) dla każdego x \in V, to istnieje w nim dokładnie jedno ekstremum lokalne i nazywa się je wówczas właściwym.

[edytuj] Funkcje rzeczywiste

Funkcja  nie ma w zerze ekstremum lokalnego, mimo zerowania się pochodnej w tym punkcie.
Funkcja \scriptstyle{g(x)=x^3} nie ma w zerze ekstremum lokalnego, mimo zerowania się pochodnej w tym punkcie.

Z twierdzenia Weierstrassa wiadomo, że funkcja ciągła o wartościach rzeczywistych, określona na zbiorze zwartym (a więc np. na przedziale domkniętym), osiąga ekstrema globalne w tym zbiorze.

W dalszej części sekcji rozważane będą funkcje f\colon [a,b] \to \mathbb R ciągłe oraz różniczkowalne w przedziale (a,b). Warunkiem koniecznym istnienia ekstremów funkcji f w pewnym punkcie x_0\in (a,b) jest

f^\prime (x_0)=0.

Jest to tzw. twierdzenie Fermata. Można je uzasadnić w taki sposób, że jeśli f ma w punkcie x0 np. maksimum lokalne, to licznik ilorazu różnicowego

\frac{f(x)-f(x_0)}{x-x_0}

jest w pewnym otoczeniu (x0 − δ,x0 + δ) niedodatni na prawo i na lewo od punktu x0, zatem iloraz jest nieujemny dla x < x0, a niedodatni dla x > x0. Granica lewostronna ilorazu jest więc nieujemna, a prawostronna niedodatnia. Obie te granice równają się pochodnej f^\prime(x_0), więc f^\prime(x_0)\geqslant 0 i f^\prime(x_0)\leqslant 0, skąd f^\prime(x_0)=0. Podobne rozumowania przeprowadza się w przypadku minimum lokalnego. Warunek ten nie jest jednak wystarczający. Np. funkcja g(x) = x3 nie ma ekstremum, chociaż jej pochodna g^\prime(x)=3x^2 zeruje się dla x0 = 0.

[edytuj] Warunek konieczny i wystarczający istnienia ekstremum

Funkcja f określona jak wyżej ma w punkcie x_0\in (a,b)

  • minimum lokalne wtedy i tylko wtedy, gdy f^\prime(x_0)=0 oraz f^\prime(x)<0 dla x > x0 i f^\prime(x)>0 dla x < x0,
  • maksimum lokalne wtedy i tylko wtedy, gdy f^\prime(x_0)=0 oraz f^\prime(x)>0 dla x > x0 i f^\prime(x)<0 dla x < x0,

[edytuj] Inne warunki wystarczające istnienia ekstremów

Jeśli o funkcji f założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale (a,b) oraz jej druga pochodna jest ciągła, to jeżeli f^\prime(x_0)=0 i f^{\prime\prime}(x_0)\neq 0, to funkcja f ma w punkcie x0 ekstremum, przy czym, gdy f^{\prime\prime}(x_0)<0, to jest to maksimum lokalne, a gdy f^{\prime\prime}(x_0)>0, to minimum lokalne.

Ze wzoru Taylora dla n = 2 wynika:

f(x_0+h)=f(x_0)+hf^\prime(x_0)+\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h), gdzie 0 < θ < 1), więc wobec tego, że f^\prime(x_0)=0 jest
f(x_0+h)-f(x_0)=\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h).

Dla h\neq 0 prawa strona ma ten sam znak, co f^{\prime\prime}(x_0+\theta h). Gdy  f^{\prime\prime}(x_0)<0, to z ciągłości f^{\prime\prime} wynika f^{\prime\prime}(x)<0 w pewnym otoczeniu punktu x0, więc w tym otoczeniu

f(x0 + h) − f(x0) = f(x) − f(x0) < 0 dla x\neq x_0,

zatem istnieje maksimum w punkcie x0. Analogicznie, istnieje minimum gdy f^{\prime\prime}(x_0)>0.

Powyższe kryterium nie rozstrzyga przypadku, gdy druga pochodna się zeruje. Jeżeli założy się dodatkowo o funkcji f, że jest n-krotnie razy różniczkowalna i n-ta pochoda jest ciągła w (a,b), to prawdziwe jest następujące twierdzenie:

[edytuj] Kryterium istnienia ekstremów funkcji n-krotnie różniczkowalnych

Jeżeli f^\prime(x_0)=f^{\prime\prime}(x_0)=\ldots=f^{(n-1)}(x_0), tj. wszystkie pochodne do (n − 1)-ej zerują się w punkcie x0, a n-ta pochodna jest różna od zera, to

  • gdy n jest liczbą parzystą, to f ma ekstremum w punkcie x0, przy czym jest to maksimum, gdy f(n)(x0) < 0 lub minimum, gdy f(n)(x0) > 0,
  • gdy n jest liczbą nieparzystą, ekstremum nie istnieje.

Z założenia zerowania się pochodnych do (n − 1), można wyprowadzić korzystając ze wzoru Taylora:

f(x_0+h)-f(x_0)=\frac{h^n}{n!}f^{(n)}(x_0+\theta h) dla pewnego 0 < θ < 1.

Jeśli n jest parzyste rozumowanie przebiega jak poprzednio. Gdy n jest nieparzyste, prawa strona równości zmienia znak, gdy h zmienia znak, a funkcja f(n) zachowuje w pewnym otoczeniu punktu x0 ten sam znak co x0. Czyli f(x0 + h) − f(x0) ma dla h < 0 inny znak niż dla h > 0, więc nie istnieje ekstremum w punkcie x0.

[edytuj] Proste zagadnienia optymalizacyjne

Siatka prostopadłościennego pudełka wykonana z kwadratu o boku długości .
Siatka prostopadłościennego pudełka wykonana z kwadratu o boku długości \scriptstyle{a}.

Okazuje się, że zagadnienie szukania ekstremów funkcji znajduje praktyczne zastosowanie nie tylko w matematyce (np. geometrii), ale także w fizyce czy technice. Oto przykładowe zagadnienia:

[edytuj] Pudełko o największej objętości

Problem 
Z kwadratowego arkusza blachy o boku a wycinane są przy wierzchołkach przystające kwadraty i po zagięciu brzegów tworzone jest prostopadłościenne pudełko. Jak otrzymać pudełko o największej objętości?
Rozwiązanie 
Jeśli przez x oznaczyć długość boku wyciętego kwadratu, to objętość V pudełka będzie równa V(x) = x(a − 2x)2, przy czym 0 \leqslant x \leqslant \tfrac{1}{2}a. Zadanie sprowadza się do znalezienia ekstremum funkcji V w przedziale [0, \tfrac{1}{2}a], przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki. Pochodna V^\prime(x) = (a-2x)(a-6x) zeruje się na tym przedziale w punktach x_0 = \tfrac{1}{6}a oraz x_1 = \tfrac{1}{2}a (wynik, który odrzucamy). Po sprawdzeniu, że x0 jest istotnie maksimum lokalnym, wiadomo że największa objętość pudełka wynosi V(x_0) = \tfrac{2}{27}a^3.

[edytuj] Koszt eksploatacji statku

Problem 
Wiadomo, że koszt eksploatacji statku w przeciągu godziny pływania wyraża się wzorem empirycznym a + bv3, gdzie v oznacza prędkość statku w węzłach[1] na godzinę, natomiast a i b są stałymi, które powinny być obliczone dla każdego statku z osobna (część stała kosztu a pochodzi od amortyzacji i kosztów utrzymania załogi, a część bv3 od kosztów paliwa). Przy jakiej prędkości statek przebędzie dowolną odległość z najmniejszymi kosztami?
Rozwiązanie 
Na przebycie 1 km potrzeba \tfrac{1}{1,85v} godziny; odpowiednie koszty wyniosą (są one funkcją prędkości):
f(v)=\tfrac{1}{1,85v}(a+bv^3)=\tfrac{1}{1,85v}\left(bv^2+\tfrac{a}{v}\right).
Przyrównując pochodną f^\prime do zera mamy:
2bv-\tfrac{a}{v^2}=0, skąd v=\sqrt[3]{\tfrac{a}{2b}}.
Ponieważ druga pochodna f^{\prime\prime}(v)=2b+2\tfrac{a}{v^3}>0, więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości v.

[edytuj] Rachunek wariacyjny

Zobacz więcej w osobnym artykule: Rachunek wariacyjny.

Ważnymi obiektami matematycznymi są funkcjonały, w szczególności te, które danej funkcji przypisują liczbę rzeczywistą, np. długość łuku jej wykresu. Funkcjonały same są szczególnymi przypadkami funkcji o wartościach rzeczywistych - są funkcjami, których argumentami są złożone obiekty matematyczne, takie jak inne funkcje. Badanie ich ekstremów jest szczególnie istotne ze względu na zastosowania w fizyce i technice - przykładowo jeśli funkcja będąca argumentem funkcjonału opisuje kształt śmigła samolotu, a wartości funkcjonału opisują wydajność śmigła, to znalezienie globalnego maksimum jest równoważne wyliczeniu jaki kształt śmigła zapewni największą wydajność.

Badania funkcjonałów zapoczątkował Leonard Euler. Klasycznym problemem, prowadzącym do znalezienia ekstremów pewnego funkcjonału jest zagadnienie brachistochrony, postawione w 1696 przez Jana Bernoulliego w periodyku Acta Eroditorium. Sprowadza się ono do znalezienia takiej krzywej łączącej dwa punkty A i B, aby ciało staczające się po niej od punktu A do B pokonało tę drogę w najkrótszym czasie[2].

Pewne wyniki związane z istnieniem ekstremów, otrzymane dla funkcji argumentów rzeczywistych, przenoszą się na funkcje określone na podzbiorach przestrzeni unormowanych, a więc w szczególności na pewne przestrzenie funkcyjne. Rachunek wariacyjny zajmuje się badaniem ekstremów funkcjonałów takich właśnie przestrzeni.

Paraboloida hiperboliczna - w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła, pewne jej przekroje pionowe są wypukłe w dół, inne w górę.
Paraboloida hiperboliczna - w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła, pewne jej przekroje pionowe są wypukłe w dół, inne w górę.

W dalszej części tego paragrafu przez X rozumiana jest dowolna przestrzeń unormowana, zaś przez D pewien jej otwarty[3] podzbiór. Funkcja f\colon D\to\mathbb{R} musi być różniczkowalna (w sensie Frécheta) w zbiorze D.

Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie x_0\in D jest zerowanie się pochodnej, tj.

f^\prime(x_0)=0.

Tak, jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Na przykład dla funkcji g\colon \mathbb{R}^2\to \mathbb{R} danej wzorem g(x,y) = xy, której wykresem jest paraboloida hiperboliczna, pochodne cząstkowe g^\prime_x(x,y)=x,\; g^\prime_y(x,y)=y są jednocześnie równe zeru tylko w punkcie (0,0), w którym f(x,y) = 0. Jednocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie jak i ujemne, a więc nie może być w nim ekstremum.

[edytuj] Definicje pomocnicze

W celu formułowania dalszych twierdzeń, potrzebne będzie wprowadzenie następujących definicji:

Funkcjonał dwuliniowy \varphi\colon X\times X\to \mathbb{R} jest nieujemny, niedodatni, dodatni, ujemny jeśli odpowiednio \varphi(h,h)\geqslant 0,\; \varphi(h,h)\leqslant 0,\; \varphi(h,h)> 0,\; \varphi(h,h)< 0 dla wszelkich 0\neq h\in X.

Dalej, funkcjonał dwuliniowy \varphi\colon X\times X\to \mathbb{R} jest

  • dodatnio określony, jeśli
\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\geqslant c\|h\|^2,
  • ujemnie określony, jeśli
\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\leqslant -c\|h\|^2.

W szczególności, każda macierz kwadratowa może być interpretowana jako macierz funkcjonału dwuliniowego przestrzeni X=\mathbb{R}^m (por. macierz dodatnio określona). Prawdzie jest twierdzenie, które mówi, że każdy dodatni (lub ujemny) funkcjonał dwuliniowy tej przestrzeni jest dodatnio określony (ujemnie określony). Do badania dodatniej (ujemnej) określoności macierzy służy kryterium Sylvestera.

[edytuj] Ekstrema a druga pochodna

Jeżeli funkcja f jest dwukrotnie różniczkowalna w pewnym otoczeniu E\subseteq D punktu x0, przy czym f^\prime(x_0)=0, a pochodna f^{\prime\prime} jest ciągła w x0, to

  • jeżeli f ma w x0 minimum lokalne, to f^{\prime\prime}(x_0) jest nieujemna,
  • jeżeli f ma w x0 maksimum lokalne, to f^{\prime\prime}(x_0) jest niedodatnia.

[edytuj] Warunek konieczny i wystarczający istnienia ekstremum

Niech, jak poprzednio, funkcja f będzie dwukrotnie różniczkowalna w pewnym otoczeniu U\subseteq D punktu x0, przy czym f^\prime(x_0)=0, a pochodna f^{\prime\prime} jest ciągła w x0.

  • Jeżeli f^{\prime\prime}(x_0) jest dodatnio określona, to f ma minimum lokalne właściwe w punkcie x0.
  • Jeżeli f^{\prime\prime}(x_0) jest ujemnie określona, to f ma maksimum lokalne właściwe w punkcie x0.

[edytuj] Funkcje określone na podzbiorach płaszczyzny

Szczególnym przypadkiem powyższego paragrafu są funkcje określone na podzbiorach X=\mathbb{R}^2. Przypadek ten zasługuje na wyróżnienie ponieważ funkcje tego typu szczególnie często pojawiają się w zastosowaniach. Korzystając z własności pochodnych cząstkowych takich funkcji można podać następujący algorytm badania istnienia ekstremów funkcji f\colon D\to \mathbb{R}, gdzie D jest otwartym podzbiorem płaszczyzny. O funkcji f wiadomo, że jest dwukrotnie różniczkowalna i jej druga pochodna jest ciągła.

  1. Wyznaczamy wszystkie punkty (x_0,y_0)\in D takie, że pochodne cząstkowe
    f^\prime_x(x_0,y_0)=0 i f^\prime_y(x_0,y_0)=0[4] (rozwiązując ten układ równań)
  2. Dla każdego punktu z osobna badamy znak wyznacznika Hessego
    \delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}_{xx}(x_0,y_0) & f^{\prime\prime}_{xy}(x_0,y_0) \\ f^{\prime\prime}_{yx}(x_0,y_0) & f^{\prime\prime}_{yy}(x_0,y_0)\end{array}\right|
    Na mocy lematu Schwarza, f^{\prime\prime}_{xy}(x_0,y_0)=f^{\prime\prime}_{yx}(x_0,y_0), więc

    \delta(x_0,y_0)=f^{\prime\prime}_{xx}(x_0,y_0)f^{\prime\prime}_{yy}(x_0,y_0)-(f^{\prime\prime}_{xy}(x_0,y_0))^2.
  3. Jeżeli w danym punkcie (x0,y0) wyznacznik δ(x0,y0) < 0, to w tym punkcie nie ma ekstremum, jeśli δ(x0,y0) = 0, to w pewnych przypadkach może istnieć ekstremum, a pewnych nie[5]. I ostatecznie, jeżeli δ(x0,y0) > 0, to istnieje ektremum lokalne w tym punkcie, przy czym jeśli f^{\prime\prime}_{xx}(x_0,y_0)>0 lub f^{\prime\prime}_{yy}(x_0,y_0)>0, to jest to minimum lokalne albo gdy f^{\prime\prime}_{xx}(x_0,y_0)<0 lub f^{\prime\prime}_{yy}(x_0,y_0)<0, to jest to maksimum lokalne.

[edytuj] Przykład

Wykres funkcji  z zaznaczonymi ekstremami lokalnymi i punktami siodłowymi.
Wykres funkcji \scriptstyle{f\left( {x,y} \right) = 2x^3  - y^3  + 12x^2  + 27y} z zaznaczonymi ekstremami lokalnymi i punktami siodłowymi.

Znaleźć ekstrema funkcji f\left( {x,y} \right) = 2x^3  - y^3  + 12x^2  + 27y.

Obliczamy pierwsze pochodne cząstkowe funkcji f i przyrównujemy do zera:


\left\{ \begin{matrix} 
 f^\prime_x(x,y) = 0 \Leftrightarrow 6x^2  + 24x = 0 \\ 
 f^\prime_y(x,y) = 0 \Leftrightarrow -3y^2  + 27 = 0 \\  
\end{matrix} \right.

Układ równań ma dokładnie 4 rozwiązania, którymi są punkty a = (0,3),b = (0, − 3),c = ( − 4, − 3),d = ( − 4,3).

δ(a) i δ(d) są ujemne, zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. punkty siodłowe funkcji f). δ(b) > 0 - w tym punkcie jest minimum lokalne (zaznaczono na czerowno). δ(c) > 0 - w tym punkcie jest maksimum lokalne (zaznaczono na zielono).

[edytuj] Ekstrema funkcji uwikłanej

Podobnie jak w poprzednim przypadku, o funkcji F zakładamy, że jest dwukrotnie różniczkowalna w pewnym otwartym podzbiorze D\subset\mathbb{R}^2 oraz E jest zbiorem punktów (x,y) obszaru, w których

F(x,y) = 0.

Na mocy twierdzenia o funkcji uwikłanej, wzór

y^\prime(x)=-\frac{F^\prime_x(x,y)}{F^\prime_y(x,y)}, gdzie y = y(x),

a w konsekwencji także

y^{\prime\prime}=-\frac{F^{\prime\prime}_{xx}(F^{\prime\prime}_{y})^2-2F^{\prime\prime}_{xy}F^\prime_xF^\prime_y+F^{\prime\prime}_{yy}F^\prime_x}{(F^\prime_y)^3}[6]

pozwala wyznaczyć ekstrema funkcji y uwikłanej w równaniu F(x,y) = 0. W tym celu należy wyznaczyć punkty, w których F(x,y)=0, y^\prime=0, y^{\prime\prime}\neq 0. Dwa ostatnie warunki równoważne są poniższym, tj.

F^\prime_x=0 i -\frac{F^{\prime\prime}_{xx}}{F^\prime_y}\neq 0.

[edytuj] Przykład

Znaleźć ekstrema funkcji y, określonej równaniem F(x) = x2 − 2xy − 3y2 + 4 = 0. Ponieważ F^\prime_x(x,y)=2x-2y=0 tylko gdy x = y, więc wstawiając do równania F(x,y) = 0 jedynymi rozwiązaniami są punkty (1,1),( − 1, − 1). F^\prime_y(x,y)=-2x-6y oraz F^{\prime\prime}_{xx}(x,y)=2, zatem w punkcie (1,1) druga pochodna y^{\prime}(x)=-\tfrac{2}{-8}=\tfrac{1}{4}>0, czyli w tym punkcie jest minimum lokalne, natomiast w punkcie ( − 1, − 1), y^{\prime\prime}(-1)=\tfrac{-2}{8}=-\tfrac{1}{4}<0, czyli w tym punkcie jest maksimum lokalne funkcji y.

[edytuj] Ekstrema warunkowe

W matematyce i fizyce zachodzi często potrzeba badania ekstremów funkcji przy pewnych dodatkowych warunkach. Chcąc np. znaleźć odległość punktu (x_0, y_0, z_0)\in\mathbb{R}^3 od hiperpowierzchni zadanej równaniem g(x,y,z) = 0 należy zbadać minima funkcji

f(x,y,z) = (xx0)2 + (yy0)2 + (zz0)2

przy warunku dodatkowym

g(x,y,z) = 0

W paragrafie tym podamy ogólną definicję ekstremum warunkowego i ogólne wyniki tej teorii, badanie ekstremów warunkowych funkcji tylko dwóch zmiennych zostanie omówione w następnym ustępie.

Jeśli X jest przestrzenią metryczną, Y przestrzenią liniową, G\colon X\to Y oraz M=\{x\in X\colon\; G(x)=0\}, to mówimy że funkcja f\colon X\to \mathbb{R} ma w punkcie x_0\in M minimum (maksimum) lokalne przy warunku M (albo związane zbiorem M), jeśli istnieje takie r > 0, że

f(x_0)\leqslant f(x) (względnie f(x_0)\geqslant f(x)) dla x\in k(x_0, r)\cap M.

[edytuj] Warunek konieczny istnienia ekstremum warunkowego

Zobacz więcej w osobnym artykule: Twierdzenie Lusternika (ekstrema warunkowe).

W dalszym ciągu będziemy zakładali spełnienie założeń twierdzenia Lusternika, tj.

  1. X i Yprzestrzeniami Banacha,
  2. G\colon X\to Y jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu x_0\in X,
  3. x_0\in X jest punktem regularnym zbioru M = G − 1(0), tj. G^\prime(x_0) jest suriekcją X na Y,
  4. X_1:=(G^\prime(x_0))^{-1}(0) (to znaczy X1 jest jądrem G^\prime(x_0)),
  5. X=X_1\oplus X_2 (rozkład przestrzeni X na topologiczną sumę prostą).

Niech f będzie funkcją określoną na otwartym podzbiorze U przestrzeni Banacha X o wartościach w \mathbb{R} oraz niech x_0\in X będzie punktem regularnym zbioru M = G − 1(0). Jeżeli funkcja f jest różniczowalna w punkcie x0 i ma w tym punkcie ekstremum warunkowe, to

f^\prime(x_0)x_1=0 dla każdego x_1\in X_1.

W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. drugie twierdzenie Lusternika, mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja f, określona jak wyżej, jest różniczkowalna w punkcie x_0\in M i ma w tym punkcie ekstremum warnukowe (związane warunkiem M), to istnieje funkcjonał liniowy \Lambda\in Y^\star taki, że

f^\prime(x_0)=\Lambda\circ G^\prime(x_0).

Funkcjonał Λ nazywamy funkcjonałem Lagrange'a i ma on ścisły związek z metodą szukania ekstremów warunkowych, zwaną metodą mnożników Lagrange'a, opisaną później.

[edytuj] Warunki wystarczające istnienia ekstremum warunkowego

W dalszym ciągu, podtrzymując powyższe założenia i zakładając dodatkowo, że funkcje f i G są dwukrotnie różniczkowalne w sposób ciągły w pewnych otoczeniach punktu x0, można sformułować warunek wystarczający istnienia ekstremum warunkowego. Mianowicie, jeżeli istnieje funkcjonał liniowy \Lambda\in Y^\star taki, że

f^\prime(x_0)=\Lambda\circ G^\prime(x_0)

oraz

(f^{\prime\prime}(x_0)-\Lambda\circ G^{\prime\prime}(x_0))(h)

jest dodatnio (ujemnie) określona dla h\in X_1=\ker G^\prime(x_0), to funkcja f ma w punkcie x0 minimum (maksimum) warunkowe.

Twierdzenie to można udowodnić korzystając z twierdzenia Lusternika i odpowiedniego wykorzystania twierdzenia Taylora. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów - w tym przypadku zakłada się by odwzorowania f i G były różniczkowalne 2n razy w sposób ciągły w pewnym otoczeniu punktu x0. Wówczas, jeżeli istnieje funkcjonał \Lambda\in Y^\star taki, że

f^{(k)}(x_0)=\Lambda\circ G^{(k)}(x_0) dla k=1,2,\ldots, 2n-1 oraz odwzorowanie
f^{(2n)}(x_0)-\Lambda\circ G^{(2n)}(x_0)

jest dodatnio[7] (ujemnie) określona, to funkcja f ma w punkcie x0 minimum (maksimum) warunkowe.

[edytuj] Ekstrema warunkowe w \mathbb{R}^n

Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, gdyż nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni[8]. Duża część zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku gdy X=\mathbb{R}^n,\; Y=\mathbb{R}^m,\; n\geqslant m, a odwzorowanie G\colon \mathbb{R}^n\to \mathbb{R}^m reprezentowane jest przez układ m funkcji o n zmiennych, tj. G=(G_1,\ldots, G_m).

Szukanie ekstremów warunkowych funkcji f\colon \mathbb{R}^n\to\mathbb{R}, będących zarazem punktami regularnymi[9], sprowadza się do rozwiązania układu równań operatorowych

\left\{\begin{array}{l}f^\prime(x)=\Lambda\circ G^\prime(x)\\G(x)=0\end{array}\right.,

gdzie \Lambda\in (\mathbb{R}^m)^\star. Wiadomo, że każdy taki funkcjonał Λ jest reprezentowany przez układ m liczb rzeczywistych \lambda_1,\ldots,\lambda_m, a pochodna G^\prime(x) jest macierzą wymiaru m\times n rzędu m[9]. Układ równań operatorowych sprowadza się więc do układu m + n równań skalarnych:

\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldots,n\\G_k(x_1,\ldots, x_n)=0,\; k=1,\ldots, m\end{array}\right.,

gdzie x=(x_1,\ldots,x_n) o n + m zmiennych \lambda_i, x_k, \; i\leqslant m, k\leqslant n. Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby λi spełniają tylko rolę pomocniczą i nazywany są często mnożnikami Lagrange'a. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)

f^{\prime\prime}(x)-\Lambda\circ G^{\prime\prime}(x) dla h\in X_1=\ker G^\prime(x_0), co sprowadza się do badania formy kwadratowej
\sum_{i,j=1}^n\left(\frac{\partial^2f(x)}{\partial x_i\partial x_j}-\sum_{k=1}^m\lambda_k\frac{\partial^2 G_k(x)}{\partial x_j\partial x_j}\right)h_ih_j,

gdzie h\in X_1, h=(h_1, \ldots, h_n). Warunek h\in X_1 jest równoważny równaniu G^\prime(x)h=0, które w postaci macierzowej przybiera formę

\sum_{i=1}^n\frac{\partial G_k(x)}{\partial x_i}h_i=0,\; k=1,2,\ldots, m.

Do badania określoności tej macierzy można stosować kryterium Sylvestera.

W praktyce, gdy X=\mathbb{R}^2, Y=\mathbb{R} wprowadzamy funkcję pomocniczą

F(x,y) = f(x,y) + λG(x,y)

i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych[10], tj. rozwiązaniu układu równań F^\prime_x=0, F^\prime_y=0, a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego λ. Do otrzymanego warunku dołączamy warunek G(x,y) = 0. Równoważnie, wszystkie punkty, które mogą być esktremami warunkowymi można wyznaczyć z układu równań

\left\{\begin{array}{l}\frac{D(f,G)}{D(x,y)}=0\\G(x,y)=0\end{array}\right.,

gdzie \tfrac{D(f,G)}{D(x,y)} oznacza jakobian funkcji f i G.

[edytuj] Ekstrema funkcji na okręgu

Wykresem funkcji  jest płaszczyzna. W przestrzeni trójwymiarowej, równanie  opisuje walec (u którego podstawy, na płaszczyźnie  leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprawadza się w tym wypadku do badania punktów ekstremalnych części wspólnej walca i płaszczyzny.
Wykresem funkcji \scriptstyle{f(x,y)=x+y} jest płaszczyzna. W przestrzeni trójwymiarowej, równanie \scriptstyle{x^2+y^2=1} opisuje walec (u którego podstawy, na płaszczyźnie \scriptstyle{xy} leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprawadza się w tym wypadku do badania punktów ekstremalnych części wspólnej walca i płaszczyzny.

Przykładowym zagadnieniem, ilustrującym zastosowanie metody mnożników Lagrange'a jest szukanie ekstremów funkcji f(x,y) = x + y na kole jednostkowym, tj. przy warunku x2 + y2 = 1. Zatem funkcja G jest postaci G(x,y) = x2 + y2 − 1, a więc funkcja F wyraża się wzorem:

F(x,y) = f(x,y) + λG(x,y) = x + y + λ(x2 + y2 − 1).

Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań

\left\{\begin{array}{ll}
F^\prime_x(x,y)= 1 + 2 \lambda x &= 0 \\
F^\prime_y(x,y)= 1 + 2 \lambda y &= 0 \\
G(x,y) = x^2 + y^2 - 1   &= 0\end{array}\right.

Wstawiając x=y, x\neq 0 do pierwszego równania: \lambda=-\tfrac{1}{2x}. Stosując podobne podstawienie do trzeciego równania, dostaje się warunek 2x2 = 1, skąd x=\pm\tfrac{\sqrt{2}}{2}. Funkcja f może zatem przyjmować ekstrema tylko w punktach (-\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}), (\tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}). Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli zwartym[11]), więc na mocy twierdzenia Weierstrassa, funkcja f osiąga w tych punktach ekstrema (warunkowe). f(-\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2})=-\sqrt{2} - minimum warunkowe, f(\tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2})=\sqrt{2} - maksimum warunkowe.

[edytuj] Problem maksymalnej entropii

Problem polega na znalezieniu rozkładu zmiennej losowej przy maksymalnej entropii. Funkcja entropii prawdopodobieństw p_1, \ldots, p_n wyraża się wzorem

f(p_1,p_2,\ldots,p_n) = -\sum_{k=1}^n p_k\log_2 p_k.

Oczywiście, prawdodpobieństwa p_1, \ldots, p_n sumują się do jedynki, więc warunek G przyjmuje postać

G(p_1,p_2,\ldots,p_n)=\sum_{k=1}^n p_k-1.

Stosując metodę mnożników Lagrange'a, dostajemy układ n równań:

\frac{\partial}{\partial p_k}(f(p_1,p_2,\ldots,p_n)+\lambda (G(p_1,p_2,\ldots,p_n)-1))=0,\;\; 1\leqslant k\leqslant n,

który sprowadza się do układu

\frac{\partial}{\partial p_k}\left(-\sum_{k=1}^n p_k \log_2 p_k + \lambda (\sum_{k=1}^n p_k - 1) \right) = 0,\;\; 1\leqslant k\leqslant n

Różniczkując każde równanie n-krotnie, powyższy układ sprowadza się do poniższego:

-\left(\frac{1}{\ln 2}+\log_2 p_k \right)  + \lambda = 0,\;\; 1\leqslant k\leqslant n.

Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj. p_1=\ldots=p_n, co biorąc pod uwagę, że sumują się one do jedynki, daje wniosek, iż dla każdego 1\leqslant k\leqslant n

p_k=\frac{1}{n}.

[edytuj] Bibliografia

  1. Franciszek Leja: Rachunek różniczkowy i całkowy. Warszawa: PWN, 1976. 
  2. Krzysztof Maurin: Analiza - Część I - Elementy. Warszawa: PWN, 1976. ISBN 9788301099398. 
  3. Grigorij Michajłowicz Fichtenholz: Rachunek różniczkowy i całkowy, t.1. Warszawa: PWN, 1966. 

Przypisy

  1. 1 węzeł \scriptstyle{\approx 1,85 \tfrac{\rm{km}}{\rm{h}}}
  2. Problem brachistochrony został rozwiązany przez Newtona, Leibniza, de l’Hospitala (ucznia Jana Bernoulliego) oraz Jakuba Bernoulliego.
  3. por. Różniczkowalność a otwartość zbioru
  4. W przypadku funkcji różniczkowalnej \scriptstyle{z=f(x,y)} równości te mają prosty sens geometryczny: płaszczyzna styczna do powierzchni \scriptstyle{z=f(x,y)} w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny \scriptstyle{xy}.
  5. np. funkcja \scriptstyle{f(x,y)=x^4+y^4} ma w punkcie \scriptstyle{(0,0)} minimum, natomiast funkcja \scriptstyle{g(x,y)=x^3+y^2} nie ma w punkcie \scriptstyle{(0,0)} ekstremum lokalnego
  6. Wzór ten można otrzymać różniczkując tożsamość \scriptstyle{F^\prime_x+F^\prime_yy^\prime(x)=0} dla \scriptstyle{x\in (x_0-\delta, x_0+\delta)}
  7. Uwaga: w tym wypadku rozszerzamy pojęcie dodatniej (ujemnej) określoności na funkcjonały \scriptstyle{n}-liniowe, tj. powiemy że funkcjonał \scriptstyle{n}-liniowy \scriptstyle{\varphi\colon X\times\ldots\times X\to \mathbb{R}} jest dodatnio (ujemnie) określony, jeśli istnieje takie \scriptstyle{c>0}, że \scriptstyle{\varphi(h,\ldots, h)\geqslant c\|h\|^n \; (\leqslant -c\|h\|^n)} dla wszelkich \scriptstyle{h\in X}.
  8. Da się to zrobić w przypadku przestrzeni Hilberta - twierdzenie o rozkładzie ortogonalnym mówi, że dla każdej domkniętej podprzestrzeni przestrzeni Hilberta istnieje dopełnienie ortogonalne. W szczególności, rozkład taki jest możliwy jeżeli \scriptstyle{X} jest przestrzenią skończenie wymiarową.
  9. 9,0 9,1 por. punkt regularny (szczególne przypadki).
  10. por. ustęp Funkcje określone na podzbiorach płaszczyzny
  11. twierdzenie Heinego-Borela

Our "Network":

Project Gutenberg
https://gutenberg.classicistranieri.com

Encyclopaedia Britannica 1911
https://encyclopaediabritannica.classicistranieri.com

Librivox Audiobooks
https://librivox.classicistranieri.com

Linux Distributions
https://old.classicistranieri.com

Magnatune (MP3 Music)
https://magnatune.classicistranieri.com

Static Wikipedia (June 2008)
https://wikipedia.classicistranieri.com

Static Wikipedia (March 2008)
https://wikipedia2007.classicistranieri.com/mar2008/

Static Wikipedia (2007)
https://wikipedia2007.classicistranieri.com

Static Wikipedia (2006)
https://wikipedia2006.classicistranieri.com

Liber Liber
https://liberliber.classicistranieri.com

ZIM Files for Kiwix
https://zim.classicistranieri.com


Other Websites:

Bach - Goldberg Variations
https://www.goldbergvariations.org

Lazarillo de Tormes
https://www.lazarillodetormes.org

Madame Bovary
https://www.madamebovary.org

Il Fu Mattia Pascal
https://www.mattiapascal.it

The Voice in the Desert
https://www.thevoiceinthedesert.org

Confessione d'un amore fascista
https://www.amorefascista.it

Malinverno
https://www.malinverno.org

Debito formativo
https://www.debitoformativo.it

Adina Spire
https://www.adinaspire.com