Karakter kodlamasıyla ilgili kavramlar, oldum olası bana karışık gelmiştir. Bugün nihayet bu karmaşaya son vermek için, kısa bir araştırma yaptım. Burada bazı notlarımı yazıyorum:
character reference (character escape)
numeric character reference
DD (decimal)
HHHH (hexadecimal)
character entity reference (named entities, html entities)
<
>
character encoding
Numerik referanslar, unicode tarafından tanımlanan UCS (universal character set) rakamlarına sadıktır.
Eğer utf-8 gibi yerli bir unicode kodlaması kullanılırsa o zaman, karakter referanslarına hiç gerek kalmaz.
Yani karakter referansları, aslında unicode karakterleri, ascii formatında uzun uzun yazmaktan ibaret. Unicode yazınca o zaman bu karakterler, ascii formatında değil, doğrudan binary formatta kaydediliyor.
Faydalı linkleri delicious hesabımda topluyorum: http://del.icio.us/mnuhoglu/character-maps
Cumartesi, Nisan 21, 2007
Karakter Kodlama Terimleri
Gönderen Mert Nuhoglu zaman: 8:49 ÖÖ
Etiketler: programlama
Kaydol:
Kayıt Yorumları (Atom)
Hiç yorum yok:
Yorum Gönder