De 1975 a 1976, bajo el liderazgo de la Oficina Nacional de Publicaciones, la Academia de Ciencias y la Agencia de Noticias Xinhua, los tipógrafos de la Fábrica de Impresión Xinhua de Beijing y la Fábrica de Impresión del Diario del Pueblo y 1.500 estudiantes de secundaria en Beijing celebró las mayores estadísticas de ortografía "desde la liberación de China". Se llevó a cabo una "verificación de frecuencia" de 86 tipos de libros, 104 tipos de publicaciones periódicas y más de 7.000 artículos sobre teoría política, comunicación de noticias, ciencia y tecnología, literatura y arte, etc. Como resultado, sólo se utilizaron 6.335 palabras para imprimir libros y publicaciones periódicas modernas.
Estos más de 6.000 caracteres chinos se dividen en cinco categorías, las más utilizadas son 560, 807, 65, 438, 0,033, * * * y 2.400, representando el 99% de los caracteres chinos de los libros. y publicaciones. En otras palabras, un chino sólo necesita saber 2.400 caracteres para entender la lengua vernácula ordinaria. Además, hay 1.700 caracteres chinos que no se utilizan habitualmente y 2.165 caracteres chinos que se utilizan ocasionalmente.
Entre las 560 palabras más utilizadas, las palabras con mayor frecuencia de repetición son cientos de miles de veces. Por ejemplo, la palabra "的" aparece 830.000 veces en más de 20 millones de palabras.
Las palabras más utilizadas son las siguientes 42 palabras: "Primero, cuando no estemos trabajando para nuestros padres, deberíamos mudarnos a China para poder aprender de ellos y aprender de estos 42". Las palabras representan una cuarta parte de las palabras utilizadas en periódicos y publicaciones periódicas.
Recientemente, la agencia de noticias Xinhua publicó la información estadística más reciente. En la actualidad, el número total de caracteres chinos ha superado los 80.000, pero sólo hay 3.500 caracteres de uso común. Aunque la cantidad de palabras de uso común no ha cambiado mucho, la cantidad total de léxico ha aumentado.
Se entiende que el "Mar de caracteres chinos" publicado en 1994 contiene 87.019 caracteres chinos, y la biblioteca de caracteres chinos de Beijing Guoan Consulting Equipment Company, que ha pasado la evaluación de expertos, tiene el origen de 91.251 caracteres chinos, que se dice que es la biblioteca de fuentes más grande del país en la actualidad. En marcado contraste con la enorme biblioteca de caracteres chinos, el número de caracteres variantes comúnmente utilizados en el lenguaje escrito cotidiano en las dinastías pasadas se limitaba generalmente a tres o cuatro mil. El número de huesos del oráculo no supera el de la escritura original.
La "Lista de palabras de uso común en chino moderno" publicada por el estado en 1988 contiene un total de 2.500 palabras comunes y 1.000 palabras menos comunes, con un total de sólo 3.500 palabras.