Industrijski standardi

  • EBCDIC

    Ovaj, danas zastareli karakterski skup, bio je upotrebi na IBM centralama. EBCDIC je skraćenica od Extended Binary Coded Decimal Interchange Code. U ovoj tabeli se svi funkcionalni ili kontrolni karakteri nalaze ispred svih karaktera sa grafijom i oni zauzimaju prve 64 pozicije u kolacionoj sekvenciji (kodovi 0016-3F16) Osobine ovog koda su:

    1. Blanko je prvi karakter s grafijom. Njegova decimalna vrednost je 6410, heksadecimalna 4016 a binarna 010000002.
    2. Skup velikih slova (A-Z) i skup malih slova (a-z) su u alfabetskom redosledu unutar kolacione sekvencije.
    3. Skup cifara (0-9) je u rastućem brojčanom redosledu unutar kolacione sekvencije.
    4. Skup velikih slova (A-Z) i skup malih slova (a-z) nisu kontingenti unutar kolacione sekvencije. Na primer, kod veliko slova I je 0xC9, a kod slova J je 0xD1 i 0xD1-0xC9=8.
    5. U kolacionoj sekvenciji, svi specijalni i interpunkcijski znaci prethode svim malim slovima, sva mala slova prethode svim velikim slovima, dok sva velika slova prethode svim ciframa.
    6. Kod svakog velikog slova je za 64=0x40=01000000 veći od koda odgovarajućeg malog slova. Na primer, za slovo E važi da je 0xC5-0x40=0x85, odnosno, 11000101-01000000=10000101. Prema tome, binarni kodovi velih i malih slova razlikuju se samo u jednoj cifri, onoj koja odgovara šestom stepenu osnove 2.

    Još o EBCDIC kodu i primeri

  • Windows kodne strane

    Za potrebe operativnog sistema Windows Microsoft je takođe ponudio seriju karakterskih skupova koji su proširenja ASCII 7-bitnog koda na 8-bitni kod. Bio je u uptrebi u okviru Windows okruženja 80-ih i 90-ih godina pre nego što je Unicode implementiran u Windows-e, ali i sada ga ovaj operativni sistem podržava. Karakteristika Microsoftovih kodnih strana je da se u u njima svih 128 pozicija u gornjoj kodnoj strani koriste za karaktere s grafijom, što čini zajedno sa donjom ASCII kodnom stranom ukupno 95+128=223 pozicija. Mikorsoftove kodne strane su:

    • CP1252 (WinLatin1)

      To je varijanta ISO 8859-1 Latin 1. Zbog većeg broja pozicija za karaktere s grafijom prisutan je, na primer, i znak za euro i francuska ligatura OE. U stvari, on je nadskup skupa ISO 8859-1. Svi karakteri na pozicijama A0-FF su isto raspoređeni, ali su popunjene i pozicije 80-9F.

    • CP1250 (WinLatin2)

      To je varijanta ISO 8859-2 Latin 2. I ovde su zbog većeg broja pozicija u gornjoj kodnoj strani prisutni neki karakteri kojih nema u Latin 1, na primer, navodnici » i «, znak za promil i slično. Slova specifična za srpsku latinicu nalaze se na sledećim pozicijama:

      veliko
      slovo
      kodmalo
      slovo
      kod
      Ž0x8Ež0x9E
      Š0x8Aš0x9A
      Đ0xD0đ0xF0
      Ć0xC6ć0xE6
      Č0xC8č0xE8

      Dakle, slova Č, Ć i Ð su na istim pozicijama kao i u ISO 8859-2 Latin 2, dok slova Ž i Š nisu.

    • CP1251 (WinCyrillic)

      Ovaj karakterski skup ima bogat repertoar (uključujući i ukrajinsko specifično G). Redosled karaktera u njemu nije ni nalik redosledu u standardu ISO 8859-5 Cyrillic. Više o tome

    • CP1253 (WinGreek)

      Potpuno je usaglašen sa standardom ISO 8859-7.

    • CP1254 (WinTurkish)

      Ovaj karakterski skup je u odnosu na WinLatin1 kao što je ISO 8859-9 prema ISO 8859-1 — u stvari, gornja kodna strana od A0 do FF je potpuno kompatibilna sa ISO 8859-9.

    • CP1255 (WinHebrew)

      Saglasan je sa ISO 8859-8 i predstavlja njegov nadskup u kome su u nižim pozicijama dodati dijakritici za vokale i još neki znaci.

    • CP1256 (WinArabic)

      Ova kodna strana nije saglasna sa ISO 8859-6. I u njemu se kodiraju samo "apstraktna" slova, a ne slova u kontekstu. Slova su redosledu arapskog alfabeta, ali su među njima sadržana i mala francuska slova.

    • CP1257 (WinBaltic)

      On je saglasan sa ISO 8859-13 Latin-7, i u stvari je poslužio kao osnova za njegovu izgradnju, ali nije saglasan sa starijim ISO 8859-4 Latin-4. Pokriva estonski, letonski i litvanski, ali i poljski i nemački.


Dokument:
URL:
Autor: Cvetana Krstev
Poslednja izmena: