Modele IBM - pięć modeli tłumaczenia automatycznego metodą statystyczną. Zostały one opracowane i opublikowane przez grupę badaczy z IBM [1] w 1993 r.
Spis treści |
Najprostszy model tłumaczenia statystycznego wg IBM. Obliczane jest tylko prawdopodobieństwo częstości występowania danego wyrazu w zdaniu, inne parametry nie są brane pod uwagę. Wykorzystywany jest tutaj model zaszumionego kanału, który zdanie wynikowe przyjmuje za zdanie źródłowe.

Dla danego zdania docelowego e oblicza się prawdopodobieństwo, że długość jego tłumaczenia f wynosi m. Kolejno oblicza się prawdopodobieństwo dopasowania a. Dopiero na podstawie dopasowania można obliczyć prawdopodobieństwo, że zdanie źródłowe f jest tłumaczeniem zdania e[2]
Prawdopodobieństwo podobne jak w Modelu I, lecz dodatkowo pojawia się prawdopodobieństwo dopasowania, czyli parametr uwzględniający pozycję słowa w zdaniu.
W tym modelu występują cztery parametry:
Umieszczenie kolejnych przetłumaczonych słów zależy od innych wcześniejszych słów pochodzących od tego samego źródła. Wprowadza podział na grupy słów występujące razem i rozłącznie np. implemented – mis en application, not – no … pas
Podobny do Modelu IV, lecz uniemożliwia powstawanie zdań, w których brakuje słów, takich gdzie dana pozycja zajmowana jest przez więcej niż jedno słowo oraz umieszczania słów przed pierwszym lub za ostatnim wyrazem przetłumaczonego zdania.
Najbardziej skuteczny, jednak zazwyczaj odrzucany na korzyść modeli II, III i IV m.in. ze względu na złożoność obliczeniową