¿Qué es la codificación de caracteres chinos?

El requisito previo para que las computadoras procesen información de caracteres chinos es codificar cada carácter chino. Estos códigos se denominan colectivamente codificación de caracteres chinos. El proceso de transmisión de información de caracteres chinos dentro del sistema es el proceso de conversión de codificación de caracteres chinos.

1. Al transmitir información entre sistemas de procesamiento de información de caracteres chinos o sistemas de comunicación, para la codificación unificada especificada para cada carácter chino, nuestro país ha designado el estándar nacional para códigos de intercambio de caracteres chinos "conjunto de caracteres de codificación de caracteres chinos". para el intercambio de información" ——Conjunto básico", cuyo nombre en código es GB 2312-80, también conocido como "Código estándar nacional".

2. Código estándar nacional: todas las codificaciones de caracteres chinos deben seguir este estándar: la codificación de códigos de máquina de caracteres chinos, el diseño de bibliotecas de fuentes de caracteres chinos, la conversión de códigos de entrada de caracteres chinos y la dirección de caracteres chinos. Los códigos de dispositivos de salida, etc., se basan todos en Este estándar es la base. GB 2312-80 es el código estándar nacional. Este código estipula que un carácter chino está representado por dos bytes y cada byte tiene solo 7 bits, que es similar al código ASCII.

3. Código de área: todos los conjuntos de caracteres de GB 2312-80 se forman en una matriz cuadrada de 94 × 94. Cada fila se denomina "área" y está numerada del 0l al 94; Los llamados "Bits" están numerados del 0l al 94. De esta manera, se obtiene el mapa de bits del área de GB 2312-80. La codificación de caracteres chinos representada por la posición del mapa de bits del área se denomina código de área.

4. Los dos bytes del código de ubicación (decimal) se convierten a hexadecimal y luego se agregan 20H para obtener el código estándar nacional correspondiente. decimal Agregue A0H después de hexadecimal para obtener el código interno correspondiente.

5. Código GB (código estándar nacional): dado que el código de ubicación es codificación decimal y el uso real de la computadora es codificación binaria, en el proceso de uso real, el código interno de la computadora utiliza el estándar nacional. código.

Información ampliada:

ASCII (Código estándar americano para el intercambio de información, Código estándar americano para el intercambio de información) es un sistema de codificación informático basado en el alfabeto latino, utilizado principalmente para mostrar el inglés moderno. y otros idiomas de Europa occidental. Es el sistema más común en la actualidad y equivale a la norma internacional ISO/IEC 646.

Relación de conversión entre el código de ubicación y el código estándar nacional:

El código de ubicación se convierte primero a representación hexadecimal, (representación hexadecimal del código de ubicación) + 2020H = código estándar nacional. El código de área es 20 y el número de bit es 83. Convierta el número de área 2083 a hexadecimal y expréselo como 1453H+2020H=3473H y se obtendrá el código estándar nacional.

Enciclopedia Baidu - Código estándar nacional

Enciclopedia Baidu - Código de ubicación