Kodowanie_UTF-8

Wyszukaj w słowniku

Dostępne słowniki:

Termin Definicja
Kodowanie_UTF-8

Nowość wprowadzona od ZWCAD+ 2015.

Jest systemem kodowania unicode, wykorzystującym od 8 do 32 bitów do zakodowania pojedynczego znaku, w pełni kompatybilnym z ASCII.

Każdy tekst w ASCII jest tekstem w UTF-8. Przejście programu na unicode otwiera możliwość kompilacji wersji 64-bitowej oraz wykorzystania większej ilości rdzeni procesora w tym samym czasie (na chwilę obecną ZWACD+ potrafi wykorzystać jednocześnie 2 rdzenie przy wymagających operacjach).

 

Sposób kodowania:

0x00 do 0x7F - bity 0xxxxxxx, gdzie "x" to bity - licząc od najwyższego
0x80 do 0x7FF - bity 110xxxxx 10xxxxxx
0x800 do 0xFFFF - bity 1110xxxx 10xxxxxx 10xxxxxx

Znaki z przedziału ASCII (0 do 127) kodowane są jako jeden bajt, czyli między innymi litery alfabetu łacińskiego. Polskie znaki dialektyczne kodowane już są jako dwa bajty.

 

Przykładowo znak ASCII / (ukośnik) można zapisać jako:

00101111

11000000 10101111

11100000 10000000 10101111

Należy jednak pamiętać, że poprawny jest zawsze najkrótszy możliwy sposób zapisu.