En la codificación ASCII, se requiere 1 byte para almacenar un carácter alfabético en inglés. En la codificación GB 2312 o GBK, un carácter chino debe almacenarse en 2 bytes. En la codificación UTF-8, una memoria de caracteres alfabéticos en inglés requiere 1 byte y una memoria de caracteres chinos requiere de 3 a 4 bytes.
En la codificación UTF-16, un carácter alfabético inglés o un carácter chino requieren 2 bytes (algunos caracteres chinos en el área de extensión Unicode requieren 4 bytes). En la codificación UTF-32, se necesitan 4 bytes para almacenar cualquier carácter del mundo.
Datos ampliados:
Las aplicaciones de Microsoft Common Language Runtime utilizan codificaciones para asignar representaciones de caracteres desde esquemas de caracteres nativos a otros esquemas. Las aplicaciones utilizan la decodificación para asignar caracteres de esquemas no nativos a esquemas nativos.
Las computadoras y los equipos de comunicaciones utilizarán codificaciones de caracteres para representar caracteres. Significa que se le asignará un determinado rol a algo. Tradicionalmente, representa una secuencia entera de bits, por lo que puede transmitirse a través de una red y almacenarse fácilmente. Dos ejemplos comunes son ASCII y UTF-8 de Unicode.
Según las estadísticas de Google, UTF-8 es el método de codificación de páginas web más utilizado. A diferencia de la mayoría de los códigos de caracteres, que corresponden caracteres a números o cadenas de bits, el código Morse utiliza una serie de pulsos electrónicos de longitud variable para representar caracteres.