
يجب ترميز الأحرف الصينية باستخدام Unicode وليس ASCII.
حقوق الصورة: بلو جين إيماجيس / فوتوديسك / جيتي إيماجيس
UTF-7 و UTF-8 كلاهما نوعان من تنسيق تحويل Unicode ، وهو المعيار المستخدم لترميز Unicode 16 بت أحرف مثل الأحرف الدولية والرموز الخاصة بتنسيق يمكن إرسالها عبر 7 بت أو أنظمة 8 بت. UTF-8 هو تنسيق الترميز الأكثر استخدامًا ، وهو شائع في صفحات الويب والعديد من برامج البريد الإلكتروني. يوفر UTF-7 ترميزًا لبعض بروتوكولات البريد الإلكتروني التي لا تعمل مع UTF-8.
يونيكود
Unicode هو معيار دولي لتمثيل الأحرف كأعداد صحيحة. يستخدم 16 بت لكل حرف مقابل السبع بتات المستخدمة بواسطة ASCII ، الكود القياسي الأمريكي لتبادل المعلومات. يمكن لـ ASCII إعادة إنتاج 128 حرفًا فقط مقابل 65000 حرفًا فريدًا متاحًا في Unicode. هذا النطاق الواسع من الأحرف يجعل Unicode أكثر ملاءمة للغات شرق آسيا واللغات الأخرى ذات الحجم الكبير مجموعات الأحرف ، ولكن يجب تشفير أحرف Unicode إذا كان سيتم إرسالها عبر 7 بت أو 8 بت القنوات.
فيديو اليوم
UTF-8
UTF-8 هو تنسيق التحويل العالمي الأكثر شيوعًا والمستخدم لتحويل أحرف Unicode إلى مقاطع 8 بت لنقلها عبر الويب عبر البريد الإلكتروني أو عبر قنوات 8 بت الأخرى. يغير تنسيق الترميز هذا كل حرف Unicode إلى واحد إلى أربع ثماني بتات ، اعتمادًا على قيمة العدد الصحيح لملف رمز Unicode ، وهو فعال للغاية بالنسبة للمستندات التي تستخدم الأحرف بشكل أساسي والتي توجد أيضًا في حرف ASCII تعيين. يميل UTF-8 إلى شغل مساحة أكبر من الترميز أحادي البايت للأبجديات غير الغربية.
UTF-7
UTF-7 هو متغير خاص من تنسيق التحويل الشامل الذي تم اقتراحه لأول مرة في منتصف التسعينيات. تم تصميمه لتمثيل نص Unicode بسلسلة من أحرف ASCII ، مما ينتج عنه أكثر كفاءة طريقة ترميز البريد الإلكتروني من UTF-8 بالإضافة إلى التشفير المقتبس القابل للطباعة اللازم للإرسال عبر بيانات 7 بت طريق. يؤدي استخدام ترميز UTF-7 إلى تقليل حجم الأحرف المشفرة بشكل ملحوظ.
الاعتبارات
على الرغم من أن UTF-7 أكثر كفاءة عبر قنوات 7 بت من UTF-8 plus القابلة للطباعة ، إلا أن معظم المراجع بما في ذلك Internet Mail Consortium و Microsoft Developer Network يوصيان باستخدام UTF-8 على UTF-7 في أي وقت المستطاع. هذا لأن UTF-7 يخلق مشاكل أمنية وقوة غير موجودة في نسخته ذات 8 بت. كما توصي IMC بأن تكون كافة برامج عرض البريد التي تم إنشاؤها بعد 1 يناير 1999 قادرة على عرض البريد بتنسيق UTF-8.