EBCDIC
Ovaj, danas zastareli karakterski skup, bio je upotrebi na IBM centralama.
EBCDIC je skraćenica od Extended Binary Coded Decimal Interchange Code.
U ovoj tabeli se svi funkcionalni ili kontrolni karakteri nalaze
ispred svih karaktera sa grafijom i oni zauzimaju prve 64 pozicije u
kolacionoj sekvenciji (kodovi 0016-3F16)
Osobine ovog koda su:
- Blanko je prvi karakter s grafijom. Njegova decimalna vrednost je 6410,
heksadecimalna 4016 a binarna 010000002.
- Skup velikih slova (A-Z) i skup malih slova (a-z)
su u alfabetskom redosledu unutar kolacione sekvencije.
- Skup cifara (0-9) je u rastućem brojčanom redosledu
unutar kolacione sekvencije.
- Skup velikih slova (A-Z) i skup malih slova (a-z)
nisu kontingenti unutar kolacione sekvencije. Na primer, kod
veliko slova I je 0xC9, a kod slova J je 0xD1
i 0xD1-0xC9=8.
- U kolacionoj sekvenciji, svi specijalni i interpunkcijski znaci prethode
svim malim slovima, sva mala slova prethode svim velikim slovima, dok
sva velika slova prethode svim ciframa.
- Kod svakog velikog slova je za 64=0x40=01000000 veći od
koda odgovarajućeg malog slova. Na primer, za slovo E važi da
je 0xC5-0x40=0x85, odnosno, 11000101-01000000=10000101.
Prema tome, binarni kodovi velih i malih slova razlikuju se samo u
jednoj cifri, onoj koja odgovara šestom stepenu osnove 2.
Još o EBCDIC kodu i primeri
- Windows kodne strane
Za potrebe operativnog sistema Windows Microsoft je takođe
ponudio seriju karakterskih skupova koji su proširenja ASCII 7-bitnog koda na
8-bitni kod. Bio je u uptrebi u okviru Windows okruženja 80-ih i 90-ih godina
pre nego što je Unicode implementiran u Windows-e, ali i sada ga ovaj
operativni sistem podržava.
Karakteristika Microsoftovih kodnih strana je da se u u njima svih 128 pozicija
u gornjoj kodnoj strani koriste za karaktere s grafijom, što čini
zajedno sa donjom ASCII kodnom stranom ukupno 95+128=223 pozicija.
Mikorsoftove kodne strane su:
- CP1252 (WinLatin1)
To je varijanta ISO 8859-1 Latin 1. Zbog većeg broja pozicija za karaktere
s grafijom prisutan je, na primer, i znak za euro i francuska ligatura OE. U stvari, on je nadskup skupa ISO 8859-1. Svi karakteri na pozicijama A0-FF su isto raspoređeni, ali su popunjene i pozicije 80-9F.
- CP1250 (WinLatin2)
To je varijanta ISO 8859-2 Latin 2. I ovde su zbog većeg broja pozicija u
gornjoj kodnoj strani prisutni neki karakteri kojih nema u Latin 1,
na primer, navodnici » i «, znak za
promil i slično. Slova specifična za srpsku latinicu nalaze se na
sledećim pozicijama:
veliko slovo | kod | malo slovo | kod
|
---|
Ž0x8Ež0x9E
Š0x8Aš0x9A
Đ0xD0đ0xF0
Ć0xC6ć0xE6
Č0xC8č0xE8
| | | | | | | | | | | | | | | | | | | |
Dakle, slova Č, Ć i Ð su na istim pozicijama kao
i u ISO 8859-2 Latin 2, dok slova Ž i Š nisu.
- CP1251 (WinCyrillic)
Ovaj karakterski skup ima bogat repertoar (uključujući i ukrajinsko specifično G).
Redosled karaktera u njemu nije ni nalik redosledu u standardu ISO 8859-5 Cyrillic.
Više o tome
- CP1253 (WinGreek)
Potpuno je usaglašen sa standardom ISO 8859-7.
- CP1254 (WinTurkish)
Ovaj karakterski skup je u odnosu na WinLatin1 kao što je ISO 8859-9
prema ISO 8859-1 — u stvari, gornja kodna strana od A0 do FF je potpuno kompatibilna sa ISO 8859-9.
- CP1255 (WinHebrew)
Saglasan je sa ISO 8859-8 i predstavlja njegov nadskup u kome su u nižim pozicijama dodati dijakritici za vokale i još neki znaci.
- CP1256 (WinArabic)
Ova kodna strana nije saglasna sa ISO 8859-6. I u njemu se kodiraju samo "apstraktna" slova, a ne slova u kontekstu. Slova su redosledu arapskog alfabeta, ali su među njima sadržana i mala francuska slova.
- CP1257 (WinBaltic)
On je saglasan sa ISO 8859-13 Latin-7, i u stvari je poslužio kao osnova
za njegovu izgradnju, ali nije saglasan sa starijim ISO 8859-4 Latin-4. Pokriva estonski, letonski i litvanski, ali i poljski i nemački.
|