Inspección por muestreo de listas de vocabulario de uso común en chino moderno

Para probar si las palabras comunes seleccionadas en la lista de palabras comunes son razonables, encargamos al Departamento de Ciencias de la Computación de la Universidad de Shanxi que utilizara muestreo por computadora para realizar estadísticas sobre un corpus de 2 millones de palabras y detectar la frecuencia de uso de las palabras seleccionadas. palabras comunes.

Los materiales de muestra incluyen:

1. People's Daily en julio de 1987 (excluyendo ilustraciones, anuncios, títulos y símbolos no chinos, 6,543805 millones de palabras);

6.5438 Noticias de ciencia y tecnología de Beijing en julio de 2087 (excluyendo ilustraciones, anuncios, títulos y símbolos no chinos, 200.000 palabras);

3.1987 Número tres contemporáneo (excluyendo ilustraciones, títulos y símbolos no chinos) símbolos, 30 10.000 palabras).

Los resultados de la prueba muestran que la tasa de cobertura de 2500 palabras comunes es 97,97, la tasa de cobertura de 1000 palabras comunes es 1,51 y la tasa de cobertura total (3500 palabras) es 99,48, lo que indica que "Palabras de uso común en chino moderno" La mesa es práctica.