¿Qué quiere decir con código interno y código estándar nacional? ¿Cómo convertirlos?

El código interno es la codificación utilizada para los caracteres chinos informáticos, mientras que el código estándar nacional es el conjunto de caracteres de codificación de caracteres chinos más utilizado en China continental. La regla de conversión es: el código interno es agregar 128 a cada byte del código estándar nacional, es decir, cambiar el bit más alto de los dos bytes de 0 a 1.

Entre los estándares de codificación informática para caracteres chinos, la codificación de caracteres chinos más grande es CNS11643 de la provincia de Taiwán (4.0)*** y contiene 76067 caracteres chinos simplificados, japoneses y coreanos verificables, pero no es universal. Sólo se utiliza en unos pocos entornos, como los sistemas de registro de hogares. El código de los Cinco Grandes comúnmente utilizado en Taiwán y Hong Kong incluye 13.053 caracteres chinos tradicionales.

GB18030 es el último conjunto de caracteres de código interno de la República Popular China. GBK contiene 20.912 caracteres simplificados, caracteres chinos tradicionales, caracteres japoneses y coreanos, mientras que el anterior GB2312 contiene 6.763 caracteres simplificados. El conjunto de caracteres básicos ideográficos unificados Unicode contiene 20.902 caracteres chinos y tiene dos áreas extendidas, con un total de más de 70.000 caracteres.

Datos ampliados:

China continental adopta el código estándar nacional ("GB" es la abreviatura del estándar nacional de la República Popular China). GB2312 contiene 6763 caracteres chinos, GBK contiene 20912 caracteres chinos y el último GB18030 contiene 27533 caracteres chinos. GRANDE5. Contiene 13053 caracteres chinos. Códigos de un solo byte o de doble byte utilizados en Taiwán y Hong Kong.

El gobierno chino no acepta mucho Unicode. El gobierno chino exige que el software vendido en China continental admita la codificación GB18030. En el campo de la comunicación internacional y el diseño de software, la codificación CJK recopila caracteres chinos, japoneses y coreanos.