Tworzenie książki (wyłącz)
 Dodaj tę stronę do książki Pokaż książkę (0 stron) Proponowane strony

UTF-8

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, szukaj

UTF-8 – system kodowania Unicode.

Spis treści

[edytuj] Zalety i wady

[edytuj] Zalety

[edytuj] Wady

[edytuj] Sposób kodowania

Mapowanie znaków Unicode na ciągi bajtów:

Dla pierwszych znaków z przedziału ASCII od 0 do 127 znak jest mapowany jako jeden bajt. Dla znaków powyżej (np. polskie znaki) jest mapowany jako dwa bajty (lub więcej).

Oznacza to, że ten sam znak można zapisać na kilka sposobów. Przykładowo znak ASCII / (ukośnik) można zapisać jako:

Stanowi to zagrożenie bezpieczeństwa m.in. dla serwerów, które sprawdzają obecność znaku / w ścieżkach. Z tego powodu standard UTF-8 przewiduje, że poprawny jest wyłącznie najkrótszy możliwy sposób zapisu, a każdy program musi odrzucać znaki zapisane dłuższymi sekwencjami niż minimalna.

Problemu tego można byłoby uniknąć, przy okazji skracając nieznacznie długość danych, jeśli wykorzystano by zasadę przesunięć typu:

[edytuj] Zobacz też

[edytuj] Linki zewnętrzne

Źródło „http://pl.wikipedia.org/w/index.php?title=UTF-8&oldid=30486351
Osobiste
Przestrzenie nazw

Warianty
Działania
Nawigacja
Dla czytelników
Dla wikipedystów
Narzędzia
Drukuj lub eksportuj
W innych językach

Polecamy: Pozycjonowanie, wózki dziecięce, Kino domowe, Viagra, Kredyty