La primera línea de un artículo en inglés debe tener una sangría de cuatro letras. ¿Significa sangría de dos caracteres?

La primera línea de un artículo en inglés tiene una sangría de cuatro letras, lo que significa una sangría de dos caracteres. Dos caracteres en inglés son en realidad dos letras en inglés, es decir, dos dígitos binarios. Cada carácter en caracteres chinos representa dos dígitos binarios.

En la codificación ASCII, se requiere 1 byte para almacenar un carácter alfabético en inglés. En la codificación GB 2312 o GBK, un carácter chino debe almacenarse en 2 bytes. En la codificación UTF-8, una memoria de caracteres alfabéticos en inglés requiere 1 byte y una memoria de caracteres chinos requiere de 3 a 4 bytes.

En la codificación UTF-16, un carácter alfabético inglés o un carácter chino requieren 2 bytes (algunos caracteres chinos en el área de extensión Unicode requieren 4 bytes). En la codificación UTF-32, se necesitan 4 bytes para almacenar cualquier carácter del mundo.

Datos ampliados:

Las aplicaciones de Microsoft Common Language Runtime utilizan codificaciones para asignar representaciones de caracteres desde esquemas de caracteres nativos a otros esquemas. Las aplicaciones utilizan la decodificación para asignar caracteres de esquemas no nativos a esquemas nativos.

Las computadoras y los equipos de comunicaciones utilizarán codificaciones de caracteres para representar caracteres. Significa que se le asignará un determinado rol a algo. Tradicionalmente, representa una secuencia entera de bits, por lo que puede transmitirse a través de una red y almacenarse fácilmente. Dos ejemplos comunes son ASCII y UTF-8 de Unicode.

Según las estadísticas de Google, UTF-8 es el método de codificación de páginas web más utilizado. A diferencia de la mayoría de los códigos de caracteres, que corresponden caracteres a números o cadenas de bits, el código Morse utiliza una serie de pulsos electrónicos de longitud variable para representar caracteres.