Metoda gradientu prostego jest pojęciem z zakresu optymalizacji matematycznej. Jest to algorytm numeryczny mający na celu znalezienie minimum zadanej funkcji celu.
Jest to jedna z prostszych metod optymalizacji. Przykładami innych metod są metoda najszybszego spadku, czy metoda Newtona.
Spis treści |
Metoda gradientu prostego jest iteracyjnym algorytmem wyszukiwania minimum zadanej funkcji celu
:

gdzie
.
Założenia dla metody są następujące:
(funkcja jest ciągła i różniczkowalna),
jest ściśle wypukła w badanej dziedzinie.Na samym początku algorytmu wybierany jest punkt startowy
. W punkcie tym obliczany jest kierunek poszukiwań
. Punkt w następnym kroku obliczany jest według wzoru:

jeśli obliczony punkt nie spełni warunku stopu algorytmu, całe postępowanie jest powtarzane.
Kierunkiem poszukiwań w metodzie gradientu prostego jest antygradient funkcji celu
.
Współczynnik
jest współczynnikiem długości kolejnych kroków. W wielu przypadkach przyjmuje się stałe niewielkie wartości:

Jeśli
jest funkcją kwadratową o dodatnio określonym hesjanie
to można przyjąć:

gdzie
jest największą wartością własną macierzy
.
Współczynnik
może również dynamicznie zmieniać się podczas procesu szukania minimum. Kolejne kroki w algorytmie powinny być wybierane tak aby:

Jeżeli warunek ten nie jest w danym kroku spełniony, to należy powtórzyć krok z mniejszą wartością
.
Algorytm ogólnie można zapisać:


to zmniejsz wartość
i powtórz punkt 2 dla kroku
-ego.
W celu określenia, czy punkt w danym kroku dostatecznie dobrze przybliża minimum funkcji celu w metodzie gradientu prostego, można użyć następujących kryteriów stopu (dla zadanej precyzji
oraz normy
):
(test stacjonarności).
Metoda gradientu prostego jest metodą o zbieżności liniowej. Oznacza to, iż przy spełnieniu założeń metody, odległości pomiędzy kolejnymi przybliżeniami, a minimum funkcji
maleją liniowo:

Na poniższych rysunkach zilustrowane zostały kolejne kroki metody gradientu prostego dla funkcji:
