Ekstremum (l. mn. ekstrema; z łac. extrēmum – koniec) – w analizie matematycznej największa lub najmniejsza wartość funkcji.
przyjmuje w punkcie
maksimum lokalne (odpowiednio: minimum lokalne), jeśli w pewnym otwartym[1] otoczeniu tego punktu (np. w pewnym przedziale otwartym) funkcja nigdzie nie ma wartości większych (odpowiednio: mniejszych).
funkcja nie ma również wartości równych
to jest to maksimum (odpowiednio: minimum) lokalne właściwe.Obrazowo: Na powierzchni Ziemi maksimum globalne wysokości nad poziomem morza występuje na szczycie Mount Everestu, maksimum lokalnym jest szczyt każdego pagórka. Jeśli szczyt pagórka jest poziomy i płaski (a także niekiedy w innych przypadkach[2]), nie będzie to maksimum lokalne właściwe.
Istnieją funkcje nie posiadające ekstremów lokalnych ani globalnych, np. funkcja 
Poszukiwanie ekstremów jest ważne w praktycznych zastosowaniach matematyki, na przykład w technice i statystyce. Wiele zagadnień optymalizacyjnych sprowadza się do poszukiwania ekstremów odpowiednich funkcji, jak na przykład funkcji kosztu, albo miary jakości dla różnych parametrów danego urządzenia.
Teoria ekstremów w naturalny sposób ma silny związek z teorią nierówności: wiele problemów i twierdzeń można formułować równoważnie tak w języku ekstremów jak i nierówności, co rzuca światło na obie te dziedziny.
W matematyce wartością funkcji nie musi być koniecznie liczba – funkcją jest dowolne przyporządkowanie każdemu elementowi zbioru zwanego dziedziną po jednym elemencie zbioru zwanego przeciwdziedziną. Funkcją jest więc również przyporządkowanie każdemu łysemu aktorowi Teatru Wielkiego koloru włosów jego ulubionej peruki.
Pojęcie ekstremum wymaga, by wartości funkcji dało się ze sobą porównywać – w przeciwdziedzinie funkcji powinien być zatem zdefiniowany jakiś porządek. Zbiór uporządkowany, i to liniowo, tworzą np. liczby rzeczywiste. Nie ma natomiast powszechnie przyjętego uporządkowania kolorów, zwłaszcza porządku liniowego.
W przypadku ekstremum lokalnego konieczne jest ponadto sprecyzowanie pojęcia "lokalności". Dokonuje się to przez określenie dla każdego argumentu funkcji, które punkty z jej dziedziny są mu "bliskie". Formalizując to podejście określamy w każdym punkcie dziedziny funkcji tak zwaną bazę otoczeń punktu. Dla liczby rzeczywistej otoczeniem jest np. przedział otwarty, zawierający tę liczbę. Ogólnie, zbiór z systemem otoczeń, spełniającym pewne naturalne warunki tworzy tzw. przestrzeń topologiczną.
O ekstremach lokalnych można zatem mówić w przypadku dowolnej funkcji, której dziedzina jest przestrzenią topologiczną, a przeciwdziedzina zbiorem częściowo uporządkowanym. Ze względu na zastosowania najczęściej rozważa się szczególny przypadek – funkcje rzeczywiste, czyli funkcje o wartościach w liczbach rzeczywistych, których dziedzina jest podzbiorem skończeniewymiarowej przestrzeni euklidesowej.
Funkcja
o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej ma w punkcie
tej przestrzeni:
takie, że dla każdego 

wartości funkcji mniejsze od
(ani nieporównywalne), choć mogą występować wartości równe;
punktu
takie, że dla każdego 

wartości funkcji większe od
(ani nieporównywalne), choć mogą występować wartości równe;
punktu
funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości większe od
czyli nie ma wartości równych dla
formalnie:
dla każdego 
punktu
funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości mniejsze od
formalnie:
dla każdego 
Funkcja
o wartościach w zbiorze uporządkowanym[3] ma w punkcie
swojej dziedziny:
należącego do jej dziedziny:
należącego do jej dziedziny:
należącego do jej dziedziny:
wartości większe od 
należącego do jej dziedziny:
wartości mniejsze od 
Nie każda funkcja posiada ekstrema. Jeśli funkcja nie jest ograniczona (np.
), to nie ma maksimum ani minimum globalnego – jeżeli nie jest ograniczona od góry, to nie ma maksimum globalnego; a jeżeli od dołu, to nie ma minimum globalnego.
Można też mówić o maksimach i minimach w podzbiorze dziedziny – są to wówczas największe lub najmniejsze wartości funkcji dla argumentów z tego podzbioru.
Funkcja cosinus osiąga maksimum dla każdej parzystej wielokrotności π, czyli
oraz minimum dla każdej nieparzystej wielokrotności π, czyli
Są to lokalne ekstrema właściwe i jednocześnie ekstrema globalne (ale nie globalne ekstrema właściwe!).
Funkcja kwadratowa
osiąga właściwe minimum (lokalne i globalne) dla
Nie ma maksimum, nawet lokalnego. Dla każdego argumentu można w jego bezpośrednim sąsiedztwie wskazać punkt w którym funkcja przyjmuje większą wartość.
Funkcja entier osiąga w każdym punkcie maksimum lokalne niewłaściwe. Minimum lokalne występuje jednak tylko dla liczb niecałkowitych. W każdym otoczeniu liczby całkowitej z lewej strony występują mniejsze wartości funkcji. Nie ma ekstremów globalnych.
Niech funkcja f przyporządkowuje każdej liczbie wymiernej wartość mianownika wyrażającego ją ułamka skróconego. Formalnie:

gdzie NWD oznacza największy wspólny dzielnik.
Dla dowolnego wymiernego x istnieje otoczenie otwarte w którym wszystkie inne liczby wymierne mają większy mianownik, a więc większą wartość funkcji f[4]. A zatem funkcja ta ma dla każdej liczby wymiernej (czyli dla każdego punktu swojej dziedziny) właściwe minimum lokalne.
Z twierdzenia Weierstrassa wiadomo, że funkcja ciągła o wartościach rzeczywistych, określona na zbiorze zwartym (a więc np. na przedziale domkniętym), osiąga ekstrema globalne. Twierdzenie to jest prawdziwe w pełnej ogólności – a więc nie tylko dla funkcji liczbowych, a dla dowolnych funkcji ciągłych, określonych na zwartych podzbiorach dowolnych przestrzeni topologicznych.
W dalszej części sekcji rozważane będą funkcje
ciągłe oraz różniczkowalne w przedziale
Geometrycznie oznacza to, że ich wykres jest "nieprzerwany" i "gładki", czyli ma w każdym punkcie styczną.
Warunkiem koniecznym istnienia ekstremów lokalnych funkcji
w pewnym punkcie
jest

Geometrycznie oznacza to, że styczna do wykresu funkcji jest w tym punkcie prostą poziomą. Jest to tzw. twierdzenie Fermata. Udowodnijmy je:
jeśli
ma w punkcie
ekstremum lokalne, to istnieje takie
, że dla każdej liczby rzeczywistej
, spełniającej
, zachodzi:

a więc:

Po przejściu do granicy, dla
, otrzymujemy:

Zatem
. ∎
Warunek Fermata nie jest jednak wystarczający. Np. funkcja
nie ma ekstremum, chociaż jej pochodna
zeruje się dla
Ekstremum może natomiast istnieć w punktach, w których nie istnieje (obustronna) pochodna skończona – funkcja
ma na przykład, minimum w punkcie
podczas gdy jej pochodna lewostronna w tym punkcie równa się
a prawostronna
Podobnie funkcja wartość bezwzględna ma w punkcie
minimum globalne, chociaż w tym punkcie nie jest różniczkowalna.
Funkcja ciągła
różniczkowalna w przedziale
i mająca skończoną liczbę punktów stacjonarnych (tj. takich, w których zeruje się jej pierwsza pochodna)[5] ma w punkcie
:
że:

dla 
dla 
że

dla 
dla 
Jeśli o funkcji
określonej jak wyżej, założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale
oraz jej druga pochodna jest ciągła, to jeżeli
i
to funkcja
ma w punkcie
ekstremum, przy czym, gdy
to jest to maksimum lokalne, a gdy
to minimum lokalne[6]. Powyższe kryterium nie rozstrzyga przypadku, gdy druga pochodna jest równa zero.
Jeżeli założy się dodatkowo o funkcji
że jest
-krotnie razy różniczkowalna i
-ta pochodna jest ciągła w
to prawdziwe jest następujące twierdzenie:
Jeżeli

tj. wszystkie pochodne do
-ej zerują się w punkcie
a
-ta pochodna jest różna od zera, to
jest liczbą parzystą, to
ma ekstremum w punkcie
przy czym jest to maksimum, gdy
lub minimum, gdy 
jest liczbą nieparzystą, ekstremum nie istnieje.Z założenia zerowania się pochodnych do
można wyprowadzić korzystając ze wzoru Taylora:

dla pewnego 
Jeśli
jest parzyste, rozumowanie przebiega jak poprzednio. Gdy
jest nieparzyste, prawa strona równości zmienia znak, gdy
zmienia znak, a funkcja
zachowuje w pewnym otoczeniu punktu
ten sam znak co
Czyli
ma dla
inny znak niż dla
więc nie istnieje ekstremum w punkcie 
Zagadnienie wyznaczania ekstremów funkcji występuje często w fizyce i technice. Oto przykład:
wycinane są przy wierzchołkach przystające kwadraty i po zagięciu brzegów tworzone jest prostopadłościenne pudełko. Jak otrzymać pudełko o największej objętości?
przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki, a więc o zerowej (minimalnej) objętości.
oraz
(w tym przypadku objętość jest zerowa). Ponieważ funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach i ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest zarazem lokalne i globalne (twierdzenie Rolle'a); osiągane jest ono w x0. Dlatego największa objętość pudełka wynosi



gdzie
oznacza prędkość statku w węzłach (1 węzeł = 1 Mm/h ≈ 1,85 km/h), natomiast
i
są stałymi, które powinny być obliczone dla każdego statku z osobna (część stała kosztu
pochodzi od amortyzacji i kosztów utrzymania załogi, a część
od kosztów paliwa). Przy jakiej prędkości statek przebędzie dowolną odległość z najmniejszymi kosztami?
do zera mamy:
skąd ![v=\sqrt[3]{\tfrac{a}{2b}}](http://upload.wikimedia.org/wikipedia/pl/math/5/4/a/54a2e9bb88402f3a05c9d5de568c5f3d.png)


Pewne wyniki związane z istnieniem ekstremów, otrzymane dla funkcji argumentów rzeczywistych, przenoszą się na funkcje określone na podzbiorach przestrzeni unormowanych.
W dalszej części tego paragrafu przez
rozumiana jest dowolna przestrzeń unormowana, zaś przez
pewien jej otwarty[7] podzbiór. Funkcja
musi być różniczkowalna (w sensie Frécheta) w zbiorze
Przez zapis
lub
rozumie się różniczkę funkcji
która jest odwzorowaniem liniowym i ciągłym przestrzeni
o wartościach w
Pochodna
-tego rzędu funkcji (
-krotnie różniczkowalnej) jest odwzorowaniem
-liniowym przestrzeni
o wartościach rzeczywistych i oznaczana jest przez
lub 
Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie
jest, aby wartość funkcji będącej różniczką w
wynosiła zero dla wszystkich punktów w pewnym otoczeniu x0 (
). Punkt, w którym różniczka się zeruje (jest funkcją stale równą zero w pewnym otoczeniu x0), nazywany jest punktem stacjonarnym.
Tak jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Na przykład dla funkcji
danej wzorem
której wykresem jest paraboloida hiperboliczna, pochodne cząstkowe
są jednocześnie równe zeru[8] tylko w punkcie
w którym
Jednocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie jak i ujemne, a więc nie może być w nim ekstremum.
Na potrzeby dalszych twierdzeń, konieczne będzie wprowadzenie kilku definicji:
Funkcjonał dwuliniowy
jest nieujemny, niedodatni, dodatni, ujemny jeśli odpowiednio
dla wszelkich 
Funkcjonał dwuliniowy
jest


W szczególności, każda macierz kwadratowa może być interpretowana jako macierz funkcjonału dwuliniowego przestrzeni
(por. macierz dodatnio określona). Prawdziwe jest twierdzenie, które mówi, że każdy dodatni (lub ujemny) funkcjonał dwuliniowy tej przestrzeni jest dodatnio określony (ujemnie określony). Do badania dodatniej (ujemnej) określoności macierzy służy kryterium Sylvestera.
Jeżeli funkcja
jest dwukrotnie różniczkowalna w pewnym otoczeniu
punktu
przy czym
a pochodna
jest ciągła w
to
ma w
minimum lokalne, to
jest nieujemna,
ma w
maksimum lokalne, to
jest niedodatnia.Niech, jak poprzednio, funkcja
będzie dwukrotnie różniczkowalna w pewnym otoczeniu
punktu
przy czym
a pochodna
jest ciągła w 
jest dodatnio określona, to
ma minimum lokalne właściwe w punkcie 
jest ujemnie określona, to
ma maksimum lokalne właściwe w punkcie 
Ważnym przypadkiem są funkcje określone na podzbiorach
Przypadek ten zasługuje na wyróżnienie ponieważ funkcje tego typu szczególnie często pojawiają się w zastosowaniach. Korzystając z własności pochodnych cząstkowych takich funkcji można podać następujący algorytm badania istnienia ekstremów funkcji
gdzie
jest otwartym podzbiorem płaszczyzny. O funkcji
wiadomo, że jest dwukrotnie różniczkowalna i jej druga pochodna jest ciągła.
takie, że pochodne cząstkowe
(rozwiązując ten układ równań)[9]
więc
wyznacznik
to w tym punkcie nie ma ekstremum, jeśli
to w pewnych przypadkach może istnieć ekstremum, a pewnych nie[10]. I ostatecznie, jeżeli
to istnieje ekstremum lokalne w tym punkcie, przy czym:
co dla
jest równoważne
to jest to minimum lokalne,
co dla
jest równoważne
to jest to maksimum lokalne.Znaleźć ekstrema funkcji

Obliczamy pierwsze pochodne cząstkowe funkcji f i przyrównujemy do zera:

Układ równań ma dokładnie 4 rozwiązania, którymi są punkty

i
– zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. punkty siodłowe funkcji f).
– w tym punkcie jest minimum lokalne (zaznaczono na czerwono).
– w tym punkcie jest maksimum lokalne (zaznaczono na zielono).W tej sekcji rozważane będą ekstrema funkcji
dla której nie znamy jednak bezpośredniej zależności
od
mając jedynie równanie postaci 
Podobnie jak w poprzednim przypadku, o funkcji F zakładamy, że jest dwukrotnie różniczkowalna w pewnym otwartym podzbiorze
oraz
jest zbiorem punktów
obszaru, w których

Na mocy twierdzenia o funkcji uwikłanej, wzór

gdzie
a w konsekwencji także

pozwala wyznaczyć ekstrema funkcji
uwikłanej w równaniu
[11]. W tym celu należy wyznaczyć punkty, w których

Dwa ostatnie warunki równoważne są poniższym, tj.

Znaleźć ekstrema funkcji y, określonej równaniem

Ponieważ

tylko gdy x = y, więc wstawiając to do równania

otrzymujemy jako jedyne rozwiązania punkty (1,1),( − 1, − 1).
Ponieważ

oraz

zatem w punkcie (1,1) druga pochodna

czyli w tym punkcie jest minimum lokalne, natomiast w punkcie ( − 1, − 1),

czyli w tym punkcie jest maksimum lokalne funkcji y.
do punktu
w najkrótszym czasie właśnie po tej krzywej.Ważnymi obiektami matematycznymi są te funkcjonały, które danej funkcji przypisują liczbę rzeczywistą, np. długość łuku jej wykresu. Przestrzeń funkcyjna jest przestrzenią unormowaną, opisywaną w jednej z wcześniejszych sekcji, jednak badanie ekstremów tych funkcjonałów jest szczególnie istotne ze względu na zastosowania w fizyce i technice – przykładowo jeśli funkcja będąca argumentem funkcjonału opisuje kształt śmigła samolotu, a wartości funkcjonału opisują wydajność śmigła, to znalezienie globalnego maksimum jest równoważne wyliczeniu jaki kształt śmigła zapewni największą wydajność.
Badania funkcjonałów zapoczątkował Leonard Euler. Klasycznym problemem, prowadzącym do znalezienia ekstremów pewnego funkcjonału jest zagadnienie brachistochrony, postawione w 1696 przez Jana Bernoulliego w periodyku Acta Eroditorium. Sprowadza się ono do znalezienia takiej krzywej łączącej dwa punkty A i B, aby ciało staczające się po niej od punktu A do B pokonało tę drogę w najkrótszym czasie[12].
Szukając lokalnych ekstremów funkcjonałów konieczne jest zdefiniowanie przestrzeni topologicznej. Najprościej zrobić to konstruując bazę coraz węższych otoczeń wokół każdego punktu dziedziny. Rozsądnie jest przyjąć, że ciąg funkcji należących do coraz węższych otoczeń powinien zbiegać do funkcji f odpowiadającej otaczanemu punktowi, jednak nie jest oczywiste, czy także pochodne tych funkcji muszą zbiegać do pochodnej f. Jeśli przyjmiemy, że tak, to mówimy o tzw. ekstremum mocnym, jeśli natomiast dopuszczamy dowolne wartości pochodnej, o ekstremum słabym. Każde ekstremum mocne jest szczególnym przypadkiem słabego, odwrotnie nie koniecznie.
Rachunek wariacyjny bada ekstrema funkcjonałów, często zadanych w postaci całek. W mechanice klasycznej ważne są równania, pozwalające na znajdowanie torów cząstek qk, jeśli znana jest funkcja L (lagranżjan), opisująca ten układ. Równania te zostały wprowadzone w 1750 roku przez Leonharda Eulera oraz Josepha Louisa Lagrange'a i zwane są dziś nazwiskami ich odkrywców. Równania Eulera-Lagrange'a mają ścisły związek z metodami rachunku wariacyjnego.
Formalnie, o funkcji L zakłada się że jest określona na
oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji
![[a,b]\ni t \mapsto q(t)=(q_1(t), \ldots, q_n(t))\in \mathbb{R}^n](http://upload.wikimedia.org/wikipedia/pl/math/f/8/9/f89ec39a042b1809e3bdfb9a77709fa8.png)
zakłada się, że jest funkcją o wartościach wektorowych, dwukrotnie różniczkowalną w sposób ciągły. W celu wyznaczenia toru cząstki, określa się funkcjonał

Ekstremów tego funkcjonału szuka się w klasie funkcji dwukrotnie różniczkowalnych, przyjmujących na końcach przedziału [a,b] wartości

Jest to problem z tzw. ustalonym brzegiem. Okazuje się, że funkcje qi, dla których funkcjonał F przyjmuje ekstremum, spełniają układ równań różniczkowych cząstkowych, zwanych równaniami Eulera-Lagrange'a, postaci:

gdzie

W matematyce i fizyce zachodzi często potrzeba badania ekstremów funkcji przy pewnych dodatkowych warunkach. Chcąc np. znaleźć odległość punktu
od hiperpowierzchni zadanej równaniem g(x,y,z) = 0 należy zbadać minima funkcji

przy warunku dodatkowym

W paragrafie tym podamy ogólną definicję ekstremum warunkowego i ogólne wyniki tej teorii, badanie ekstremów warunkowych funkcji tylko dwóch zmiennych zostanie omówione w następnym ustępie.
Jeśli X jest przestrzenią topologiczną, Y przestrzenią liniową,
oraz
to mówimy że funkcja
ma w punkcie
minimum (maksimum) lokalne przy warunku M (albo związane zbiorem M), jeśli istnieje otoczenie U punktu x0 takie, że
względnie
dla 
W dalszym ciągu będziemy zakładali spełnienie założeń twierdzenia Lusternika, tj.
jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu 
jest punktem regularnym zbioru M = G − 1({0}), tj.
jest suriekcją X na Y,
to znaczy X1 jest jądrem 
(rozkład przestrzeni X na topologiczną sumę prostą).Niech f będzie funkcją określoną na otwartym podzbiorze U przestrzeni Banacha X o wartościach w
oraz niech
będzie punktem regularnym zbioru M = G − 1(0). Jeżeli funkcja f jest różniczkowalna w punkcie x0 i ma w tym punkcie ekstremum warunkowe, to

dla każdego 
W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. drugie twierdzenie Lusternika, mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja f, określona jak wyżej, jest różniczkowalna w punkcie
i ma w tym punkcie ekstremum warunkowe (związane warunkiem M), to istnieje funkcjonał liniowy
taki, że

Funkcjonał Λ nazywany jest funkcjonałem Lagrange'a i ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną metodą mnożników Lagrange'a, opisaną dalej.
W dalszym ciągu, podtrzymując powyższe założenia i zakładając dodatkowo, że funkcje f i G są dwukrotnie różniczkowalne w sposób ciągły w pewnych otoczeniach punktu x0, można sformułować warunek wystarczający istnienia ekstremum warunkowego. Mianowicie, jeżeli istnieje funkcjonał liniowy
taki, że

oraz

jest dodatnio (ujemnie) określona dla
to funkcja f ma w punkcie x0 minimum (maksimum) warunkowe.
Twierdzenie to można udowodnić korzystając z twierdzenia Lusternika i odpowiednio wykorzystując twierdzenia Taylora. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów – w tym przypadku dodatkowo zakłada się że odwzorowania f i G są różniczkowalne 2n razy w sposób ciągły w pewnym otoczeniu punktu x0. Wówczas, jeżeli istnieje funkcjonał
taki, że

dla
oraz odwzorowanie

jest dodatnio[13] (ujemnie) określona dla
to funkcja f ma w punkcie x0 minimum (maksimum) warunkowe.

Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, gdyż nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni[14]. Duża część zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku gdy
a odwzorowanie
reprezentowane jest przez układ m funkcji o n zmiennych, tj. 
Szukanie ekstremów warunkowych funkcji
będących zarazem punktami regularnymi[15], sprowadza się do rozwiązania układu równań operatorowych

gdzie
Wiadomo, że każdy taki funkcjonał Λ jest reprezentowany przez układ m liczb rzeczywistych
a pochodna
jest macierzą wymiaru
rzędu m[15]. Układ równań operatorowych sprowadza się więc do układu m + n równań skalarnych:

gdzie
o n + m zmiennych
Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby λi spełniają tylko rolę pomocniczą i nazywane są często mnożnikami Lagrange'a. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)

dla

co sprowadza się do badania formy kwadratowej

gdzie

Warunek
jest równoważny równaniu

które w postaci macierzowej przybiera formę

Do badania określoności tej macierzy można stosować kryterium Sylvestera.
W praktyce, gdy
wprowadzamy funkcję pomocniczą

i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych[16], tj. rozwiązaniu układu równań
a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego λ.
Do otrzymanego warunku dołączamy warunek G(x,y) = 0. Równoważnie, wszystkie punkty, które mogą być ekstremami warunkowymi można wyznaczyć z układu równań

gdzie
oznacza jakobian funkcji f i G.
jest płaszczyzna. W przestrzeni trójwymiarowej, równanie
opisuje walec (u którego podstawy, na płaszczyźnie
leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprowadza się w tym wypadku do badania punktów ekstremalnych części wspólnej walca i płaszczyzny.Ilustracją zastosowania metody mnożników Lagrange'a jest problem wyznaczenia ekstremów funkcji:

na kole jednostkowym, tj. przy warunku

Zatem funkcja G jest postaci

a więc funkcja F wyraża się wzorem:

Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań

Podstawiając
do pierwszego równania uzyskujemy:
Stosując podobne podstawienie do trzeciego równania, dostaje się warunek
skąd wynika
Funkcja
może zatem przyjmować ekstrema tylko w punktach
Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli zwartym[17]), więc na mocy twierdzenia Weierstrassa, funkcja
osiąga w tych punktach ekstrema (warunkowe):


Warto zauważyć, że funkcja f, określona na całej płaszczyźnie (bez dodatkowego warunku) nie ma ekstremów.
Problem polega na znalezieniu dyskretnego rozkładu zmiennej losowej maksymalizującego entropię. Funkcja entropii prawdopodobieństw
wyraża się wzorem

Oczywiście, suma prawdopodobieństw
jest równa jeden, więc warunek na
przyjmuje postać

Stosując metodę mnożników Lagrange'a, dostajemy układ n równań:

który sprowadza się do układu

Różniczkując każde równanie n-krotnie, powyższy układ sprowadza się do poniższego:

Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj.
a ponieważ ich suma jest równa jeden, wynika stąd, że dla dowolnego
:

Ciekawym praktycznym zastosowaniem ekstremum lokalnego w przestrzeni par permutacji jest algorytm statystyczny, zwany gradacyjną analizą odpowiedniości (Grade Correspondence Analysis; GCA).
Algorytm ma na celu przekształcenie badanych nominalnych cech statystycznych w cechy porządkowe tak, aby korelacja rangowa pomiędzy nimi w zbiorze uczącym była maksymalna[18].
Algorytm GCA był stosowany m.in. do tabeli, w której wiersze odpowiadają okręgom wyborczym, kolumny partiom politycznym, a liczby w komórkach macierzy liczbie głosów oddanych na poszczególne partie w poszczególnych okręgach[19] GCA rozmieściło zarówno okręgi wyborcze, jak i partie na skali, która po zbadaniu okazała się odpowiadać continuum lewica-prawica.
Ściśle: danymi wejściowymi jest tzw. macierz kontyngencji, której wiersze odpowiadają możliwym wartościom (tzw. etykietom) pewnej nominalnej cechy statystycznej (zwanej zmienną wierszową), a kolumny możliwym wartościom innej cechy nominalnej (zwanej zmienną kolumnową). Wartości elementów macierzy reprezentują liczebność obserwacji w próbie, dla których rozważane dwie cechy mają wartości przypisane do danego wiersza i kolumny[20].
Celem algorytmu jest znalezienie takiej permutacji wierszy i kolumn macierzy (czyli etykiet zmiennych wierszowej i kolumnowej), aby współczynnik rho Spearmana dla powstałego rozkładu dwuwymiarowego był największy. Odpowiada to znalezieniu takiego uszeregowania etykiet zmiennych nominalnych, aby powstałe w ten sposób zmienne porządkowe wykazywały możliwie dużą zależność statystyczną w sensie korelacji rangowej.
GCA jest algorytmem iteracyjnym, który wielokrotnie startując od losowych permutacji wierszy i kolumn macierzy, dochodzi do różnych lokalnych maksimów rho Spearmana. Maksima są lokalne w tym sensie, że aby uzyskać większą wartość trzeba zmienić jednocześnie kolejność wierszy i kolumn macierzy. Zmiana wyłącznie kolejności wierszy lub wyłącznie kolejności kolumn nie da wyższej wartości rho.
na brzegu tego zbioru. Wówczas np. funkcja
mogłaby mieć minimum i maksimum właściwe w każdym swoim punkcie.
jest ułamkiem nieskracalnym, to każdy ułamek
różniący się od
o mniej niż
ma mianownik większy od q. Nierówność


jest 
której wykres pokazano w sekcji Proste przykłady ekstremów
wynika:




prawa strona ma ten sam znak, co
Gdy
to z ciągłości
wynika
w pewnym otoczeniu punktu
więc w tym otoczeniu
dla 
Analogicznie, istnieje minimum gdy 
.
równości te mają prosty sens geometryczny: płaszczyzna styczna do powierzchni
w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny 
ma w punkcie
minimum, natomiast funkcja
nie ma w punkcie
ekstremum lokalnego
dla 
-liniowy
jest dodatnio (ujemnie) określony, jeśli istnieje takie
że
dla wszelkich 
jest przestrzenią skończenie wymiarową.