Código interno de caracteres chinos: el código ANSI es un conjunto de códigos de un solo byte (número binario de 8 bits), que solo puede representar un máximo de 256 caracteres y no puede representar muchos caracteres chinos. Varios países y regiones han diseñado diferentes conjuntos de caracteres chinos basados en códigos ANSI para manejar una gran cantidad de caracteres chinos. Estos códigos utilizan bytes únicos para representar caracteres ingleses ANSI (es decir, códigos compatibles con ANSI) y bytes dobles para representar caracteres chinos. Dado que un sistema solo puede tener un código interno de caracteres chinos, no puede reconocer caracteres en otros códigos internos de caracteres chinos, lo que genera inconvenientes en la comunicación.
Código GB: el código GB es un esquema de codificación de caracteres chinos simplificado anunciado por el país en 1980. Se utiliza ampliamente en China continental y Singapur. También se le llama código estándar nacional. El código estándar nacional codifica un conjunto de 6763 caracteres chinos, que cubren la mayoría de los caracteres chinos en uso.
Código GBK: el código GBK es un código de caracteres extendido del código GB, que codifica más de 20.000 caracteres chinos simplificados y tradicionales. Las versiones simplificadas de Win95 y Win98 utilizan GBK como código interno del sistema.
Código BIG5: el código BIG5 es una codificación de caracteres chinos para caracteres chinos tradicionales y se usa ampliamente en sistemas informáticos en la provincia de Taiwán y Hong Kong.
Código HZ: El código HZ es una codificación de caracteres chinos muy utilizada en Internet.
Código ISO -2022CJK: IOS-2022 es un estándar de codificación para caracteres de varios idiomas desarrollado por la Organización Internacional de Normalización (ISO). Se utiliza codificación de doble byte, donde la codificación china se denomina ISO-2022 CN y las codificaciones japonesa y coreana se denominan JP y KR respectivamente. En términos generales, estos tres se denominan colectivamente códigos CJK. Actualmente, los códigos CJK se utilizan principalmente en Internet.
Codificación Unicode: la codificación Unicode también es una codificación estándar internacional. Utiliza codificación de doble byte y es incompatible con la codificación ANSI. Se ha utilizado en redes, sistemas Windows y muchos software a gran escala.
Luego, codificación por compresión:
La información multimedia incluye texto, datos, sonido, animación, gráficos, imágenes, vídeo y otra información multimedia. Aunque la cantidad de datos digitalizados es muy grande, los sistemas informáticos no pueden almacenarlos ni intercambiarlos sin comprimirlos. Otra razón es que las imágenes, el audio y el vídeo tienen un gran potencial de compresión debido a la redundancia espacial, la redundancia temporal, la redundancia estructural y la redundancia de conocimiento presentes en los datos multimedia. Redundancia visual, redundancia de similitud de áreas de imagen, redundancia estadística de texturas, etc. Proporcionan posibles condiciones para la aplicación de la tecnología de compresión de datos. Por lo tanto, los sistemas multimedia deben adoptar tecnología de compresión de datos, que es una tecnología muy crítica en la tecnología multimedia.
Clasificación de los métodos de compresión de datos
(1) Según la pérdida de calidad, se puede dividir en codificación con pérdida y codificación sin pérdida.
(2) Según su alcance, se puede dividir en método de dominio espacial, método de transformación y método híbrido de dominio espacial o dominio de frecuencia.
(3) Según sea adaptativa o no, se puede dividir en codificación adaptativa y codificación no adaptativa.
Clasificación según algoritmo de compresión:
(1) Modulación de código de pulso
(2) Codificación predictiva
(3) Codificación por transformación
(4) Codificación estadística
(5) Codificación híbrida
(1) Modulación de código de pulso
La modulación de código de pulso es en realidad continua Una representación muestreada digital de una señal analógica. Los codificadores y decodificadores de modulación de código de impulsos (PCM) están ubicados al principio y al final del sistema de codificación de imágenes. Los siguientes métodos de codificación son todos métodos de codificación por compresión de señales analógicas de datos multimedia después de la modulación de código de pulso.
(2) Codificación predictiva
Lo que el codificador registra y transmite no es el valor real de la muestra, sino la diferencia entre este y el valor predicho. Este método se llama modulación de código de pulso diferencial (DPCM).
(3) Codificación de transformación
La idea principal de la codificación de transformación es utilizar la correlación entre los valores de píxeles de los bloques de imagen para transformar la imagen en un nuevo conjunto de bases, de modo que la energía se concentra en unos pocos. En varios coeficientes de transformación, la compresión se logra almacenando estos coeficientes.
En la codificación de transformación, debido a que la cantidad de cálculo para transformar la imagen completa es demasiado grande, la imagen original generalmente se divide en muchas subimágenes rectangulares para una transformación independiente.
La transformada de coseno discreta (DCT) se usa comúnmente
(4) Codificación estadística
La codificación de Huffman es la codificación estadística más utilizada. Utiliza menos bits para símbolos de alta frecuencia y más bits para símbolos de baja frecuencia. Su eficiencia de codificación depende principalmente de la distribución de probabilidad de los símbolos a codificar. Cuanto más concentrados estén los símbolos, mayor será la relación de compresión.
También existen codificación aritmética y codificación de longitud de tirada.
(5) Codificación híbrida
La codificación híbrida se refiere a la codificación que combina técnicas de transformación y predicción. Generalmente existen dos formas de codificación.