UTF7 vs. UTF 8

click fraud protection
Boya fırçası tutan Çinli sanatçı

Çince karakterler ASCII değil, Unicode kullanılarak kodlanmalıdır.

Resim Kredisi: Blue Jean Resimleri/Fotodisk/Getty Images

UTF-7 ve UTF-8, her ikisi de 16 bit Unicode'u kodlamak için kullanılan standart olan Unicode Dönüşüm Formatı türüdür 7 bit veya 7 bit üzerinden iletilebilen bir formatta uluslararası harfler ve özel semboller gibi karakterler 8 bit sistemler. UTF-8, Web sayfalarında ve birçok e-posta programında popüler olan en yaygın kullanılan kodlama biçimidir. UTF-7, UTF-8 ile çalışmayan bazı e-posta protokolleri için kodlama sağlar.

tek kod

Unicode, karakterleri tamsayı olarak göstermek için uluslararası bir standarttır. Bilgi Değişimi için Amerikan Standart Kodu olan ASCII tarafından kullanılan yedi bit yerine karakter başına 16 bit kullanır. ASCII, Unicode'da bulunan 65.000 benzersiz karaktere karşı yalnızca 128 karakter üretebilir. Bu daha geniş karakter yelpazesi, Unicode'u Doğu Asya dilleri ve geniş karakter kümeleri, ancak 7-bit veya 8-bit bit yoluyla iletileceklerse Unicode karakterleri kodlanmalıdır. kanallar.

Günün Videosu

UTF-8

UTF-8, e-posta veya diğer 8 bitlik kanallar aracılığıyla Web üzerinden iletim için Unicode karakterleri 8 bitlik parçalara dönüştürmek için kullanılan en yaygın Evrensel Dönüşüm Formatıdır. Bu kodlama formatı, her Unicode karakterini, tamsayı değerine bağlı olarak bir ila dört sekizliye değiştirir. Unicode karakter ve öncelikle ASCII karakterinde de bulunan harfleri kullanan belgeler için çok verimlidir. ayarlamak. UTF-8, Batılı olmayan alfabeler için tek baytlık kodlamadan daha fazla yer kaplama eğilimindedir.

UTF-7

UTF-7, ilk olarak 1990'ların ortalarında önerilen Evrensel Dönüşüm Formatının özel bir çeşididir. Unicode metnini bir ASCII karakter dizisiyle temsil etmek üzere tasarlanmıştır ve daha verimli bir e-posta için UTF-8'den daha kodlama yöntemi artı 7 bitlik bir veri üzerinden iletmek için gereken alıntı yazdırılabilir kodlama yol. UTF-7 kodlamasının kullanılması, kodlanmış karakterlerin boyutunu önemli ölçüde azaltır.

Hususlar

UTF-7, 7 bit kanallar üzerinde UTF-8 artı alıntı yazdırılabilir kanallardan daha verimli olmasına rağmen, çoğu yetkili Internet Mail Consortium ve Microsoft Developer Network dahil olmak üzere, her zaman UTF-7 üzerinden UTF-8 kullanılmasını önerir. mümkün. Bunun nedeni, UTF-7'nin 8 bitlik akrabasında olmayan güvenlik ve sağlamlık sorunları yaratmasıdır. IMC ayrıca 1 Ocak 1999'dan sonra oluşturulan tüm posta görüntüleme programlarının postaları UTF-8'de görüntüleme yeteneğine sahip olmasını önerir.