อักขระภาษาจีนต้องเข้ารหัสโดยใช้ Unicode ไม่ใช่ ASCII
เครดิตรูปภาพ: รูปภาพ Blue Jean / รูปภาพ Photodisc / Getty
UTF-7 และ UTF-8 เป็นรูปแบบการแปลง Unicode ทั้งสองประเภท ซึ่งเป็นมาตรฐานที่ใช้ในการเข้ารหัส Unicode 16 บิต อักขระเช่นตัวอักษรสากลและสัญลักษณ์พิเศษในรูปแบบที่สามารถส่งผ่าน 7 บิตหรือ ระบบ 8 บิต UTF-8 เป็นรูปแบบการเข้ารหัสที่ใช้บ่อยที่สุด ซึ่งเป็นที่นิยมในหน้าเว็บและโปรแกรมอีเมลจำนวนมาก UTF-7 มีการเข้ารหัสสำหรับโปรโตคอลอีเมลบางตัวที่ไม่สามารถใช้ได้กับ UTF-8
Unicode
Unicode เป็นมาตรฐานสากลสำหรับการแสดงอักขระเป็นจำนวนเต็ม ใช้ 16 บิตต่ออักขระเทียบกับ 7 บิตที่ใช้โดย ASCII ซึ่งเป็นรหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล ASCII สามารถทำซ้ำได้เพียง 128 อักขระ เทียบกับ 65,000 อักขระเฉพาะที่มีอยู่ใน Unicode อักขระที่กว้างขึ้นนี้ทำให้ Unicode เหมาะสำหรับภาษาเอเชียตะวันออกและอื่น ๆ ที่มีขนาดใหญ่ ชุดอักขระ แต่ต้องเข้ารหัสอักขระ Unicode หากต้องส่งผ่าน 7 บิตหรือ 8 บิต ช่อง.
วีดีโอประจำวันนี้
UTF-8
UTF-8 เป็นรูปแบบ Universal Transformation ที่ใช้บ่อยที่สุดในการแปลงอักขระ Unicode ให้เป็นเซ็กเมนต์ 8 บิตสำหรับการส่งผ่านเว็บผ่านอีเมลหรือผ่านช่องทาง 8 บิตอื่นๆ รูปแบบการเข้ารหัสนี้เปลี่ยนอักขระ Unicode แต่ละตัวเป็นหนึ่งถึงสี่ออกเตต ขึ้นอยู่กับค่าจำนวนเต็มของ อักขระ Unicode และมีประสิทธิภาพมากสำหรับเอกสารที่ใช้ตัวอักษรเป็นหลัก ซึ่งพบในอักขระ ASCII ด้วย ชุด. UTF-8 มีแนวโน้มที่จะใช้พื้นที่มากกว่าการเข้ารหัสแบบไบต์เดียวสำหรับตัวอักษรที่ไม่ใช่แบบตะวันตก
UTF-7
UTF-7 เป็นตัวแปรพิเศษของ Universal Transformation Format ที่เสนอครั้งแรกในช่วงกลางทศวรรษ 1990 ได้รับการออกแบบเพื่อแสดงข้อความ Unicode ด้วยสตริงของอักขระ ASCII ทำให้มีประสิทธิภาพมากขึ้น วิธีการเข้ารหัสสำหรับอีเมลที่มากกว่า UTF-8 บวกกับการเข้ารหัสที่เสนอราคาสำหรับพิมพ์ได้ซึ่งจำเป็นในการส่งข้อมูล 7 บิต เส้นทาง. การใช้การเข้ารหัส UTF-7 จะช่วยลดขนาดของอักขระที่เข้ารหัสได้อย่างมาก
ข้อควรพิจารณา
แม้ว่า UTF-7 จะมีประสิทธิภาพมากกว่าช่องสัญญาณ 7 บิตมากกว่า UTF-8 บวกกับการพิมพ์ที่อ้างอิงได้ แต่หน่วยงานส่วนใหญ่ รวมถึง Internet Mail Consortium และ Microsoft Developer Network แนะนำให้ใช้ UTF-8 ผ่าน UTF-7 ทุกครั้ง เป็นไปได้. ทั้งนี้เนื่องจาก UTF-7 สร้างปัญหาด้านความปลอดภัยและความทนทานที่ไม่มีอยู่ในญาติ 8 บิต IMC ยังแนะนำว่าโปรแกรมแสดงเมลทั้งหมดที่สร้างขึ้นหลังวันที่ 1 มกราคม 1999 ควรจะสามารถแสดงเมลใน UTF-8 ได้