Tras entrar en el nuevo siglo, la investigación literaria occidental contemporánea se ha entrelazado cada vez más con disciplinas afines, especialmente con la investigación empírica sobre el lenguaje. Entre ellas, su relación con la lingüística de corpus ha despertado una preocupación generalizada en la comunidad académica. . concentrarse en. Porque la lingüística de corpus puede proporcionar un conjunto de métodos y herramientas eficaces para la investigación literaria, permitiendo a las personas describir obras literarias de forma más detallada, profunda y específica. La investigación literaria basada en corpus no sólo puede resumir las respuestas de fenómenos individuales, sino también prestar más atención a resumir las respuestas de numerosos fenómenos y las conexiones entre fenómenos. Además, la autenticidad y generalización de la teoría pueden verificarse mediante investigaciones empíricas. La teoría de la crítica literaria no es una excepción. Dado que el corpus literario puede contener millones, decenas de millones o incluso cientos de millones de palabras de obras literarias, las personas pueden obtener suficientes ejemplos de ellas para verificar o ilustrar ciertas teorías de la crítica literaria.
La investigación literaria basada en corpus utiliza un corpus de obras literarias y herramientas de análisis de corpus, toma el lenguaje literario y la estructura literaria como objeto de investigación y utiliza técnicas de análisis estadístico por computadora, como análisis de distribución de palabras, análisis de características estilísticas, y análisis de la trama para ampliar la investigación literaria tradicional, refinar las reglas de la retórica literaria y la narrativa literaria, examinar el estilo de escritura del autor e incluso identificar al verdadero autor de la obra. La investigación literaria basada en corpus puede realizar análisis de frecuencia de palabras, análisis de distribución de vocabulario, análisis sintáctico, análisis de palabras clave y análisis de trama (análisis de trama) basado en análisis de palabras clave. El análisis de palabras clave de obras literarias puede hacer que las personas comprendan qué temas pretende expresar la obra.
Tomemos como ejemplo el primer capítulo de la novela de Faulkner "El sonido y la furia" El primer capítulo de "El sonido y la furia" es la narración de Benji, un paciente con demencia de 33 años. . Wang Zhenchang y otros comentaron sobre el primer capítulo que "el lector es introducido desde el principio en un mundo confuso y fragmentado comprendido por un idiota". ("Un breve análisis de las características estructurales de "El sonido y la furia" de Faulkner", publicado en "Revista del Instituto de Lenguas Extranjeras del Ejército Popular de Liberación", número 4, 1997) Bangui no tiene ningún concepto de tiempo y espacio. Ahora puede llevarlo en cualquier momento al tiempo y al espacio pasados. Entonces, ¿cómo se refleja el mundo fragmentado a través del uso del lenguaje? ¿Puedes encontrar un hilo en el discurso incoherente de Benji? Aunque el narrador de la historia es un demente, el autor está sobrio. Además, casi todos los lectores creen que Katie es el personaje clave de la novela, si no la protagonista. Cuán crucial es ella es motivo de preocupación. Además, la evaluación que la gente hace del idioma en el primer capítulo de "El sonido y la furia" es que el lenguaje es simple, las oraciones cortas y el vocabulario común. Bueno, qué tan simple es el lenguaje, qué tan cortas son las oraciones y qué tan común es el vocabulario se pueden examinar y describir en detalle mediante métodos de lingüística de corpus.
Para responder a las preguntas anteriores se puede utilizar el método de análisis lingüístico de corpus. Primero, se estableció un corpus de clásicos ingleses con más de 6 millones de caracteres. Luego, se utilizó el software de análisis del lenguaje Wordsmith para crear una lista de palabras para el corpus de más de 6 millones de caracteres y una lista de palabras para el primer capítulo de "El sonido y la furia". Una vez creadas las dos listas de palabras, utilice la lista de palabras del corpus clásico como lista de referencia para contar las palabras clave del primer capítulo. Finalmente, con la ayuda de la lista de palabras clave, se elabora un mapa de distribución de la trama del primer capítulo.
Los resultados estadísticos muestran que el Capítulo 1*** tiene 236 palabras clave. Las 10 palabras principales en la lista de palabras clave son: Caddy, dijo, Dilsey, Lustre, Quentin, Versh, Jason, Don't, ain't y hush. Aunque la palabra "Caddy" aparece sólo 280 veces en el Capítulo 1, que es menos que muchas palabras, su importancia ocupa un lugar destacado en la lista, lo que indica que Caddy es de hecho una figura clave. Además, las personas pueden utilizar el software de búsqueda para buscar y enumerar todas las oraciones en las que aparece la palabra Caddy, estudiar el contexto en el que aparece Katie y describir y explicar la clave de Katie. Además, entre las 10 primeras palabras clave, 6 son nombres, dos son palabras negativas, una es dicho y una es silencio. El orden de los nombres muestra que la persona que más le importa a Benji o con la que tiene más contacto es Katie, seguida por las otras cinco personas en orden. La gente puede explorar y explicar por qué existe tal orden y descubrir el modo de pensar de Benji y la intención del autor.
La palabra Said aparece 907 veces en el primer capítulo, ocupando el primer lugar en frecuencia, lo que indica que el estilo del primer capítulo es oral y los personajes de la novela tienen mucha comunicación e interacción verbal. La gente puede observar y explicar además por qué las dos palabras negativas y silencio son tan críticas, cuál es su significado y qué problemas ilustran.