1. Corpus y conceptos de lingüística de corpus El corpus, también conocido como corpus o materiales, es un almacén para almacenar materiales lingüísticos. Un corpus es una base de datos de material lingüístico recopilado y científicamente organizado. Este material se produce de forma natural en un idioma, ya sea escrito o hablado. Estos materiales no procesados son la base de las estadísticas del lenguaje y los materiales de primera mano para analizar y estudiar las reglas del lenguaje [2 ~ 3]. La lingüística de corpus es el estudio del lenguaje basado en corpus de textos. Diferentes investigadores tienen diferentes puntos de vista sobre la lingüística de corpus.
Punto. Algunas personas creen que la lingüística de corpus es un marco teórico y una nueva disciplina que va de la mano con otras ramas de la lingüística. Otros investigadores creen que la lingüística de corpus no es una disciplina independiente, pero proporciona una base metodológica para la investigación del lenguaje y un nuevo pensamiento filosófico para la investigación lingüística. Para resolver este problema, los investigadores chinos, basándose en un resumen de los resultados de las investigaciones de los famosos lingüistas extranjeros Halliday, Leach y Tognini-Bonelli, señalaron que sólo se dispone de corpus.
La lingüística de corpus es el nombre que se le da a una nueva disciplina cuando los lingüistas utilizan los materiales y hechos lingüísticos para criticar teorías lingüísticas existentes y proponer nuevas perspectivas o teorías [3 ~ 6]. En general, un corpus es un método y un medio para utilizar materiales lingüísticos reales para estudiar un determinado aspecto del lenguaje. Con los métodos proporcionados por la lingüística de corpus, los lingüistas no solo pueden verificar las reglas lingüísticas existentes sino también describir reglas gramaticales y pragmáticas en evolución basadas en los datos proporcionados por los corpus. En el pasado, los materiales del corpus se recopilaban y organizaban manualmente y generalmente se utilizaban para calcular la frecuencia de uso de las palabras como base para escribir libros de texto y diccionarios. Ahora, la eficiencia y la escala de la creación de corpus utilizando computadoras han mejorado enormemente. El corpus se selecciona aleatoriamente a partir de materiales lingüísticos representativos.
—
09
—
La muestra se ingresa en la computadora y puede consistir en una gran cantidad de texto procesado por el computadora. Cuantos más textos recibe un corpus, más amplio es el alcance que cubre y más confiable es la información que proporciona. La construcción del corpus incluye recolectar materiales originales para formar un corpus original y luego anotar el corpus para generar un corpus anotado. Podemos utilizar software de análisis de corpus para realizar varios análisis estadísticos en el corpus anotado para revelar varias características del idioma de destino.
2. El papel de la lingüística de corpus en la investigación del lenguaje
El desarrollo de la lingüística de corpus ha jugado un papel positivo en la promoción del estudio en profundidad del lenguaje. Por un lado, afecta los conceptos de aprendizaje de idiomas y los métodos de aprendizaje de idiomas, por otro lado, proporciona una base para la implementación de algunos conceptos de aprendizaje de idiomas; Este artículo sólo analiza tres aspectos del impacto de los corpus en la investigación lingüística.
(1) ¿El lenguaje es descriptivo o prescriptivo?
Ya sea que el lenguaje sea descriptivo o prescriptivo, los diferentes períodos tienen diferentes énfasis. En el siglo XVIII, las principales lenguas europeas se aprendían mediante métodos prescritos. Los lingüistas siempre han tratado de formular varias reglas para el uso correcto del lenguaje, que enfatizan la corrección del lenguaje y la aplicación de los patrones estándar latinos. Por lo tanto, la gramática es el foco de la investigación y el aprendizaje del lenguaje, y algunos usos deben memorizarse repetidamente después de ser prescritos, "porque esta es una cuestión de blanco y negro, de correcto o incorrecto" [7]. Bajo la influencia de este punto de vista, la enseñanza de lenguas adopta un método de traducción de gramática centrado en el profesor. Los métodos de enseñanza de idiomas incluyen la explicación y memorización de numerosas definiciones y reglas. La palabra escrita suele recibir más atención. La opinión correspondiente es que el lenguaje es una ciencia descriptiva.
Guiados por este punto de vista, los lingüistas intentan descubrir y registrar el idioma realmente hablado por una comunidad de habla sin utilizar otras reglas para corregir el idioma de la comunidad. La lingüística de corpus proporciona la base y la viabilidad de esta perspectiva. A través de la investigación y el análisis de una gran cantidad de ejemplos en el corpus, se pueden resumir las reglas de aplicación práctica del lenguaje. La encarnación de esta visión en el aprendizaje de idiomas es prestar más atención a las necesidades individuales de los estudiantes y cambiar la enseñanza intensiva centrada en el docente por una enseñanza de exploración del conocimiento centrada en el estudiante. En las actividades de enseñanza, los profesores ya no inculcan ciegamente reglas y conocimientos lingüísticos, sino que exigen a los alumnos que contacten el lenguaje real y natural mediante la búsqueda de corpus, observen fenómenos lingüísticos, analicen y resuman reglas idiomáticas, hagan suposiciones y utilicen continuamente el lenguaje. Pruebe y revise el suyo propio. suposiciones. Los docentes también han pasado de ser transmisores de conocimientos tradicionales a exploradores de conocimientos e investigadores de lenguas iguales a los estudiantes. Es cierto que el énfasis unilateral en si el lenguaje es prescriptivo o descriptivo no parece lo suficientemente objetivo. A partir de la naturaleza prescriptiva del lenguaje, los investigadores y estudiantes del lenguaje pueden simplificar el lenguaje complejo, captar el marco básico del lenguaje a un nivel macro y reducir la dificultad de la investigación y el aprendizaje del lenguaje. Para los estudiantes de idiomas, la motivación y el interés por aprender pueden no ser demasiado altos y los métodos de aprendizaje son relativamente rígidos. Desde la perspectiva de la naturaleza descriptiva del lenguaje, los investigadores y estudiantes del lenguaje estarán expuestos a un lenguaje rico y real, y lograrán el propósito de aprender y dominar el lenguaje observando, analizando y resumiendo las reglas del lenguaje. En este proceso, tanto los investigadores como los alumnos participan activamente, por lo que su motivación e interés mejorarán enormemente.
(2) Lenguaje y habla, así como capacidad lingüística y uso del lenguaje.
Saussure dividió la lengua en lengua y habla. El lenguaje es un sistema gramatical utilizado por todos los miembros de un sistema social y es el potencial en el cerebro de un grupo de personas. Es una forma de lenguaje social, homogénea y abstracta. El lenguaje es el lenguaje producido por cada individuo de la sociedad, que es heterogéneo y diverso [5]. Debido a diferentes comprensiones de la naturaleza del lenguaje y la división entre lenguaje y habla, han surgido dos escuelas principales, el estructuralismo y el funcionalismo, y sus enfoques de investigación sobre el lenguaje también son diferentes. El lenguaje estudiado por el estructuralismo es un sistema de símbolos abstractos que está por encima de los individuos y la sociedad. El funcionalismo enfatiza la función de uso del lenguaje, examina los fenómenos lingüísticos reales y trata de descubrir la estructura * * * *. Basándose en las investigaciones de Saussure, Chomsky propuso dos conceptos: habilidad lingüística y aplicación del lenguaje. Chomsky cree que los usuarios del lenguaje tienen una comprensión instintiva de las reglas del lenguaje. La capacidad lingüística es el conocimiento del lenguaje arraigado en el cerebro de que un individuo puede generar palabras ilimitadas de acuerdo con reglas limitadas. Los lingüistas se centran en reglas finitas que producen un habla infinita. El concepto de uso del lenguaje es muy similar al concepto de habla definido por Saussure, que se refiere al uso real del lenguaje en una situación específica. La lingüística de corpus proporciona un método de investigación más científico para el desarrollo posterior del funcionalismo, centrándose en el uso del habla y el lenguaje. A través de un estudio en profundidad del uso del habla y el lenguaje, podemos verificar las reglas lingüísticas prescriptivas existentes e intentar generalizar otras nuevas. La investigación de corpus sobre el uso del habla y el lenguaje se refleja en todos los aspectos de la investigación del lenguaje, como el estudio del registro; el análisis del discurso de los hablantes nativos y el resumen de su estructura típica, que se utiliza para compilar materiales de enseñanza del lenguaje hablado; y aplicarlo a los programas de enseñanza Diseñar; analizar y comparar el uso del idioma de los estudiantes de idiomas extranjeros y explorar estrategias de aprendizaje más efectivas. El estudio del lenguaje y la capacidad lingüística se lleva a cabo en la adquisición del lenguaje, es decir, cuándo y cómo se forman las reglas que existen en el cerebro humano de forma subconsciente. Por tanto, los corpus estudian el lenguaje concreto, mientras que el estudio del lenguaje y la capacidad lingüística se centra más en el lenguaje abstracto. No podemos afirmar o negar ciegamente un determinado método de investigación, porque el lenguaje puede estudiarse desde múltiples ángulos y diferentes ángulos de investigación pueden complementarse entre sí, servir a diferentes propósitos y satisfacer diferentes necesidades. Sin embargo, la aparición de corpus proporciona las condiciones para la investigación lingüística.
—
1
Nueve
—
Las nuevas perspectivas hacen que la investigación lingüística sea más objetiva y verdadera.
(3) Relaciones de combinación y relaciones de agregación
Saussure es el fundador de la escuela estructuralista. Creía que el lenguaje es un sistema de símbolos, por lo que los lingüistas deben hacer todo lo posible para encontrar el valor del lenguaje a partir de la relación entre un símbolo y otros símbolos y comprender la posición de los símbolos en el sistema. Saussure propuso dos tipos principales de relaciones lingüísticas: relaciones de combinación y relaciones de agregación. La relación de combinación se refiere a la relación entre una unidad y otras unidades en la misma secuencia, o la relación entre todos los componentes en el campo.
La relación de agregación, también conocida como relación de asociación, se refiere a la relación entre componentes que pueden reemplazarse entre sí en posiciones especiales de la estructura, o la relación entre componentes en el sitio y componentes que no están en el sitio. Las palabras en la relación de agregación tienen las mismas características sintácticas, pero no pueden ser reemplazadas semánticamente [7]. La aparición de corpus a gran escala proporciona un enorme espacio para la investigación sobre la relación entre ambos, especialmente la investigación sobre la relación de combinación. Porque las computadoras tienen la capacidad de buscar una palabra específica e investigar todas las palabras * * * relacionadas con esa palabra. Ésta es también la relación de colocación que habitualmente se estudia. Halliday (1976) definió la colocación como "un fenómeno * * * lineal que refleja la relación de combinación de elementos léxicos en un vecindario significativo". Esta definición define claramente la colocación como una relación de combinación. En el estudio de la colocación, Jones y Sinclair fueron los primeros investigadores en estudiar la colocación de palabras en un corpus. Desde la década de 1980, la investigación de colocación de palabras basada o impulsada por corpus se ha llevado a cabo ampliamente, lo que ha cambiado en gran medida la investigación de colocación. Se mejora la validez de la investigación, aumenta la proporción de investigación cuantitativa y la capacidad de emparejamiento es observable y operable. Con el creciente grado de automatización, los factores de interferencia humana en el proceso de investigación se han reducido considerablemente. En su artículo [9], Daniel Krieger afirmó la objetividad de la lingüística de corpus en el estudio de las relaciones combinatorias mediante el estudio del uso de "cualquiera". Según las reglas gramaticales tradicionales, "cualquiera" se suele utilizar en oraciones negativas y en oraciones interrogativas, pero las estadísticas de Mindt muestran que la frecuencia de "cualquiera" en oraciones afirmativas es del 50%, en oraciones negativas del 40% y en oraciones interrogativas solo representa por 65,438+ 00%. Por tanto, el corpus proporciona una gran comodidad para el estudio de relaciones combinatorias. La investigación sobre relaciones de agregación se refleja más en la investigación sobre algunos sinónimos. Por ejemplo, Cui señaló en su artículo que Rundell realizó un estudio comparativo sobre el grupo de sinónimos "iniciar" y "comenzar" utilizando el corpus [10]. Los resultados de esta investigación proporcionan un modelo para utilizar corpus para estudiar relaciones de combinación y relaciones de agregación. Los investigadores del lenguaje pueden utilizar corpus para realizar muchos estudios similares.
3. Problemas en la investigación de corpus actual
No hay duda de que los corpus desempeñan un papel activo en la investigación lingüística, pero el mayor problema en la actualidad es que existen pocas investigaciones sobre lenguas. expertos Habiendo dominado los métodos de investigación de corpus, la mayoría de los profesores y estudiantes de idiomas no entienden los corpus y no saben cómo utilizar los recursos del corpus para la investigación científica. Sin embargo, existen pocos artículos sobre el uso de corpus. Por lo tanto, capacitar a profesores y estudiantes de idiomas para que utilicen los recursos del corpus a gran escala desempeñará el papel de los corpus de manera más efectiva y promoverá en gran medida el ritmo de la investigación y el aprendizaje de idiomas.
Corpus proporciona nuevas ideas y métodos para la investigación del lenguaje, pero es necesario mejorar considerablemente la utilización de los recursos del corpus. Sólo si más profesores y estudiantes de idiomas tienen el contacto más cercano con el corpus de maestros de idiomas, el corpus podrá promover verdaderamente la investigación y el aprendizaje de idiomas.