चीनी अक्षरों को यूनिकोड का उपयोग करके एन्कोड किया जाना चाहिए, ASCII का नहीं।
छवि क्रेडिट: ब्लू जीन छवियां / फोटोडिस्क / गेट्टी छवियां
यूटीएफ -7 और यूटीएफ -8 दोनों प्रकार के यूनिकोड परिवर्तन प्रारूप हैं, मानक 16-बिट यूनिकोड को एन्कोड करने के लिए उपयोग किया जाता है अंतर्राष्ट्रीय अक्षरों और विशेष प्रतीकों जैसे वर्ण एक प्रारूप में जिन्हें 7-बिट या. के माध्यम से प्रेषित किया जा सकता है 8-बिट सिस्टम। UTF-8 सबसे अधिक इस्तेमाल किया जाने वाला एन्कोडिंग प्रारूप है, जो वेब पेजों और कई ईमेल कार्यक्रमों में लोकप्रिय है। UTF-7 कुछ ईमेल प्रोटोकॉल के लिए एन्कोडिंग प्रदान करता है जो UTF-8 के साथ काम नहीं करेगा।
यूनिकोड
यूनिकोड वर्णों को पूर्णांकों के रूप में दर्शाने के लिए एक अंतर्राष्ट्रीय मानक है। यह एएससीआईआई द्वारा उपयोग किए जाने वाले सात बिट्स बनाम सूचना इंटरचेंज के लिए अमेरिकी मानक कोड की तुलना में प्रति वर्ण 16 बिट्स का उपयोग करता है। ASCII यूनिकोड में उपलब्ध 65,000 अद्वितीय वर्णों की तुलना में केवल 128 वर्णों को पुन: उत्पन्न कर सकता है। वर्णों की यह विस्तृत श्रृंखला यूनिकोड को पूर्वी एशियाई भाषाओं और अन्य भाषाओं के लिए अधिक उपयुक्त बनाती है वर्ण सेट, लेकिन यूनिकोड वर्णों को एन्कोड किया जाना चाहिए यदि उन्हें 7-बिट या 8-बिट बिट के माध्यम से प्रेषित किया जाना है चैनल।
दिन का वीडियो
यूटीएफ -8
UTF-8 सबसे आम यूनिवर्सल ट्रांसफ़ॉर्मेशन फ़ॉर्मेट है जिसका उपयोग यूनिकोड वर्णों को ईमेल या अन्य 8-बिट चैनलों के माध्यम से वेब पर ट्रांसमिशन के लिए 8-बिट सेगमेंट में बदलने के लिए किया जाता है। यह कोडिंग प्रारूप प्रत्येक यूनिकोड वर्ण को एक से चार ऑक्टेट में बदल देता है, जो के पूर्णांक मान पर निर्भर करता है यूनिकोड वर्ण, और यह उन दस्तावेज़ों के लिए बहुत कुशल है जो मुख्य रूप से ASCII वर्ण में पाए जाने वाले अक्षरों का भी उपयोग करते हैं सेट। UTF-8 गैर-पश्चिमी अक्षरों के लिए सिंगल-बाइट एन्कोडिंग की तुलना में अधिक स्थान लेता है।
यूटीएफ-7
UTF-7 यूनिवर्सल ट्रांसफॉर्मेशन फ़ॉर्मेट का एक विशेष प्रकार है जिसे पहली बार 1990 के दशक के मध्य में प्रस्तावित किया गया था। इसे यूनिकोड टेक्स्ट को ASCII वर्णों की एक स्ट्रिंग के साथ प्रस्तुत करने के लिए डिज़ाइन किया गया था, जो एक अधिक कुशल उत्पादन करता है UTF-8 की तुलना में ईमेल के लिए एन्कोडिंग विधि प्लस 7-बिट डेटा पर संचारित करने के लिए आवश्यक उद्धृत-मुद्रण योग्य एन्कोडिंग पथ। UTF-7 एन्कोडिंग का उपयोग करने से एन्कोडेड वर्णों का आकार महत्वपूर्ण रूप से कम हो जाता है।
विचार
हालांकि यूटीएफ -7, यूटीएफ -8 प्लस उद्धृत-प्रिंट करने योग्य, अधिकांश प्राधिकरणों की तुलना में 7-बिट चैनलों पर अधिक कुशल है इंटरनेट मेल कंसोर्टियम और माइक्रोसॉफ्ट डेवलपर नेटवर्क सहित यूटीएफ -7 पर यूटीएफ -8 का उपयोग करने की सलाह देते हैं जब भी संभव। ऐसा इसलिए है क्योंकि यूटीएफ -7 सुरक्षा और मजबूती के मुद्दों को बनाता है जो इसके 8-बिट रिश्तेदार में मौजूद नहीं हैं। आईएमसी यह भी सिफारिश करता है कि 1 जनवरी 1999 के बाद बनाए गए सभी मेल-डिस्प्लेइंग प्रोग्राम यूटीएफ -8 में मेल प्रदर्शित करने में सक्षम होने चाहिए।