GBK es una codificación universal en China continental y UTF-8 es una codificación universal en el mundo. Generalmente, se utilizan programas que utilizan GBK. Los caracteres se representan mediante bytes dobles, pero para distinguir los caracteres chinos, los bits más altos se establecen en 1.
En cuanto a la codificación UTF-8, es una codificación multibyte utilizada para resolver caracteres internacionales. Utiliza 8 bits (es decir, un byte) para el inglés y 24 bits (tres bytes) para el chino. ) para codificar. Para foros con muchos caracteres en inglés, se utiliza UTF-8 para ahorrar espacio.
GBK contiene todos los caracteres chinos; UTF-8 contiene caracteres utilizados por todos los países del mundo.
GBK es un estándar ampliado en base al estándar nacional GB2312 y es compatible con GB2312 (parece que todavía no es un estándar nacional)
El texto codificado UTF-8 puede admitir caracteres UTF8 conjuntos en varios países que se muestran en el navegador.
Por ejemplo, si se trata de codificación UTF8, el chino también se puede mostrar en el IE en inglés de los extranjeros sin que tengan que descargar el paquete de soporte de idioma chino de IE. Por lo tanto, para foros con mucho inglés, cada carácter ocupa 2 bytes cuando se usa GBK, pero solo ocupa un byte cuando se usa inglés UTF-8.
UTF8 es una codificación internacional y tiene mayor versatilidad. Los extranjeros también pueden navegar por el foro. GBK es una codificación nacional y tiene menos versatilidad que UTF8. Sin embargo, UTF8 ocupa una base de datos más grande que GBK.