Karakter Cina harus dikodekan menggunakan Unicode, bukan ASCII.
Kredit Gambar: Blue Jean Images/Photodisc/Getty Images
UTF-7 dan UTF-8 adalah kedua jenis Format Transformasi Unicode, standar yang digunakan untuk mengkodekan Unicode 16-bit karakter seperti huruf internasional dan simbol khusus dalam format yang dapat ditransmisikan melalui 7-bit atau sistem 8-bit. UTF-8 adalah format pengkodean yang paling umum digunakan, populer di halaman Web dan banyak program email. UTF-7 menyediakan pengkodean untuk beberapa protokol email yang tidak akan bekerja dengan UTF-8.
Unicode
Unicode adalah standar internasional untuk mewakili karakter sebagai bilangan bulat. Ini menggunakan 16 bit per karakter versus tujuh bit yang digunakan oleh ASCII, Kode Standar Amerika untuk Pertukaran Informasi. ASCII hanya dapat mereproduksi 128 karakter versus 65.000 karakter unik yang tersedia di Unicode. Rentang karakter yang lebih luas ini membuat Unicode lebih sesuai untuk bahasa Asia Timur dan lainnya dengan besar set karakter, tetapi karakter Unicode harus dikodekan jika akan dikirim melalui 7-bit atau 8-bit bit saluran.
Video Hari Ini
UTF-8
UTF-8 adalah Format Transformasi Universal yang paling umum digunakan untuk mengubah karakter Unicode menjadi segmen 8-bit untuk transmisi melalui Web melalui email atau melalui saluran 8-bit lainnya. Format pengkodean ini mengubah setiap karakter Unicode menjadi satu hingga empat oktet, tergantung pada nilai integer dari Karakter Unicode, dan sangat efisien untuk dokumen yang terutama menggunakan huruf juga ditemukan dalam karakter ASCII mengatur. UTF-8 cenderung mengambil lebih banyak ruang daripada pengkodean byte tunggal untuk abjad non-Barat.
UTF-7
UTF-7 adalah varian khusus dari Format Transformasi Universal yang pertama kali diusulkan pada pertengahan 1990-an. Itu dirancang untuk mewakili teks Unicode dengan string karakter ASCII, menghasilkan yang lebih efisien metode penyandian untuk email daripada UTF-8 ditambah penyandian yang dapat dicetak yang dikutip yang diperlukan untuk mengirimkan melalui data 7-bit jalur. Menggunakan pengkodean UTF-7 mengurangi ukuran karakter yang disandikan secara signifikan.
Pertimbangan
Meskipun UTF-7 lebih efisien melalui saluran 7-bit daripada UTF-8 plus kutipan-cetak, sebagian besar otoritas termasuk Konsorsium Surat Internet dan Jaringan Pengembang Microsoft merekomendasikan penggunaan UTF-8 melalui UTF-7 kapan pun mungkin. Ini karena UTF-7 menciptakan masalah keamanan dan ketahanan yang tidak ada dalam relatif 8-bitnya. IMC juga merekomendasikan bahwa semua program penampil surat yang dibuat setelah 1 Januari 1999 harus mampu menampilkan surat dalam UTF-8.