En la etapa inicial del desarrollo del corpus, solo se llevó a cabo un análisis general de palabras, como estadísticas de frecuencia de palabras, y luego se agregaron los atributos gramaticales de las palabras (como parte del discurso, etc.). Hasta ahora, la gente está prestando cada vez más atención a la anotación de corpus de diferentes niveles, como la fonética, la formación de palabras, la sintaxis, la semántica y la pragmática.
La lingüística de corpus no despertó mucha resonancia en sus inicios, pero la lingüística de corpus moderna ha sido reconocida cada vez por más personas y sus aplicaciones se han generalizado cada vez más, desde el análisis del lenguaje hasta la enseñanza de idiomas. desde lexicografía hasta inteligencia artificial y otros campos.
Tras décadas de desarrollo, la lingüística de corpus ha madurado tanto teórica como técnicamente. También ha comenzado a recibir atención su aplicación en la enseñanza de idiomas. La investigación en lingüística de corpus de mi país ha logrado algunos resultados. Por ejemplo, el Noveno Proyecto Nacional Quinquenal de Planificación de Ciencias Sociales "Corpus de Estudiantes Chinos de Inglés", organizado por el profesor Gui Shichun, recopiló más de 6,543,8 millones de palabras de estudiantes de inglés desde la escuela secundaria hasta la universidad, y marcó 62 errores comunes en las composiciones de los estudiantes, incluidos Los errores de ortografía, errores de combinación de palabras, errores de uso de palabras y errores de estructura gramatical son útiles como orientación. En la enseñanza de idiomas, el corpus se puede utilizar para (1) analizar errores comunes cometidos por los estudiantes en el aprendizaje de idiomas; (2) determinar la prioridad de los proyectos de aprendizaje de idiomas (3) generar automáticamente varios tipos de ejercicios, etc.