Problem kolekcjonera kuponów opisuje klasę konkursów, w którym gracz otrzymuje wygraną po zebraniu wszystkich kuponów z określonej puli. Problem polega na przewidzeniu jak długo należy zbierać kupony, aby otrzymać wygraną. Problem ten jest interesujący z matematycznego punktu widzenia, jak i ma wiele zastosowań w informatyce.
Spis treści |
Oto doprecyzowanie podstawowego wariantu problemu kolekcjonera kuponów:
Interesuje nas liczba rzutów
, po której w każdej urnie znajdzie się co najmniej jedna kula. Liczba rzutów
jest zmienną losową.
Problem ten można stosunkowo łatwo zanalizować rozbijając proces wypełniania urn na etapy. Załóżmy, że w pewnej chwili wypełnionych jest k urn i niech
oznacza liczbę rzutów potrzebnych do zapełnienia k+1 urn (czyli do dorzucenia jednej kuli do pustych urn). Wtedy
jest zmienną losową o rozkładzie geometrycznym z parametrem 

są niezależneKorzystając z tego, że wartość oczekiwana zmiennej o rozkładzie geometrycznym z parametrem
wynosi
oraz z tego, że wartość oczekiwana sumy zmiennych losowych jest równa sumie wartości oczekiwanych tych zmiennych otrzymujemy
![E[T_n] = \sum_{k=0}^{n-1} \frac{n}{n-k} = n \sum_{k=0}^{n-1} \frac{1}{n-k} = n \sum_{k=1}^{n} \frac{1}{k}](http://upload.wikimedia.org/wikipedia/pl/math/5/2/b/52b83fb543d4bc7d919ffa7e5c8059c9.png)
Suma
nazywana jest n-tą liczbą harmoniczną i oznaczana symbolem
. Ponadto

gdzie
jest stałą Eulera–Mascheroniego. W konsekwencji,

Wariancję zmiennej losowej
można wyznaczyć w podobny sposób jak wyznacza się wartość oczekiwaną. Zmienna losowa o rozkładzie geometrycznym z parametrem
ma wariancję równą (1-p)/p2 oraz z wariancja sumy niezależnych zmiennych losowych jest równa sumie wariancji tych zmiennych, skąd wynika że
.Ponadto
,zatem asymptotycznie zmienna
jest mocno skoncentrowana.