Cumartesi, Nisan 21, 2007

Karakter Kodlama Terimleri

Karakter kodlamasıyla ilgili kavramlar, oldum olası bana karışık gelmiştir. Bugün nihayet bu karmaşaya son vermek için, kısa bir araştırma yaptım. Burada bazı notlarımı yazıyorum:


character reference (character escape)
numeric character reference
&#DD (decimal)
&#xHHHH (hexadecimal)
character entity reference (named entities, html entities)
<
>
character encoding


Numerik referanslar, unicode tarafından tanımlanan UCS (universal character set) rakamlarına sadıktır.

Eğer utf-8 gibi yerli bir unicode kodlaması kullanılırsa o zaman, karakter referanslarına hiç gerek kalmaz.

Yani karakter referansları, aslında unicode karakterleri, ascii formatında uzun uzun yazmaktan ibaret. Unicode yazınca o zaman bu karakterler, ascii formatında değil, doğrudan binary formatta kaydediliyor.

Faydalı linkleri delicious hesabımda topluyorum: http://del.icio.us/mnuhoglu/character-maps

Hiç yorum yok: