![붓을 들고 중국 예술가](/f/245efa214e07ff32a403964fc5a6e4c2.jpg)
중국어 문자는 ASCII가 아닌 유니코드를 사용하여 인코딩해야 합니다.
이미지 크레디트: 블루 진 이미지/포토디스크/게티 이미지
UTF-7 및 UTF-8은 모두 16비트 유니코드를 인코딩하는 데 사용되는 표준인 유니코드 변환 형식의 두 가지 유형입니다. 국제문자, 특수기호 등의 문자를 7비트 또는 8비트 시스템. UTF-8은 웹 페이지와 많은 이메일 프로그램에서 널리 사용되는 가장 일반적으로 사용되는 인코딩 형식입니다. UTF-7은 UTF-8에서 작동하지 않는 일부 이메일 프로토콜에 대한 인코딩을 제공합니다.
유니코드
유니코드는 문자를 정수로 표현하기 위한 국제 표준입니다. 정보 교환을 위한 미국 표준 코드인 ASCII에서 사용하는 7비트에 비해 문자당 16비트를 사용합니다. ASCII는 유니코드에서 사용할 수 있는 65,000개의 고유한 문자에 비해 128개의 문자만 재생할 수 있습니다. 이 더 넓은 범위의 문자는 유니코드를 동아시아 언어 및 큰 언어로 된 다른 언어에 더 적합하게 만듭니다. 문자 집합이지만 유니코드 문자가 7비트 또는 8비트를 통해 전송되는 경우 인코딩되어야 합니다. 채널.
오늘의 비디오
UTF-8
UTF-8은 이메일이나 기타 8비트 채널을 통해 웹을 통해 전송하기 위해 유니코드 문자를 8비트 세그먼트로 변환하는 데 사용되는 가장 일반적인 범용 변환 형식입니다. 이 코딩 형식은 각 유니코드 문자를 정수 값에 따라 1-4 옥텟으로 변경합니다. 유니코드 문자이며 ASCII 문자에서도 발견되는 문자를 주로 사용하는 문서에 매우 효율적입니다. 세트. UTF-8은 비서양 알파벳의 경우 1바이트 인코딩보다 더 많은 공간을 차지하는 경향이 있습니다.
UTF-7
UTF-7은 1990년대 중반에 처음 제안된 Universal Transformation Format의 특별한 변형입니다. ASCII 문자열로 유니코드 텍스트를 나타내도록 설계되어 보다 효율적인 UTF-8과 7비트 데이터를 통해 전송하는 데 필요한 인용 인쇄 가능한 인코딩보다 이메일에 대한 인코딩 방법 길. UTF-7 인코딩을 사용하면 인코딩된 문자의 크기가 크게 줄어듭니다.
고려 사항
UTF-7은 UTF-8과 인용 인쇄 가능보다 7비트 채널에서 더 효율적이지만 대부분의 기관은 Internet Mail Consortium 및 Microsoft 개발자 네트워크를 포함하여 항상 UTF-7보다 UTF-8을 사용할 것을 권장합니다. 가능한. UTF-7은 8비트 상대 파일에는 없는 보안 및 견고성 문제를 생성하기 때문입니다. IMC는 또한 1999년 1월 1일 이후에 만들어진 모든 메일 표시 프로그램이 UTF-8로 메일을 표시할 수 있어야 한다고 권장합니다.