(1) El rápido desarrollo de las computadoras;
(2) La crítica de la lingüística de corpus por parte de la lingüística generativa transformacional no siempre es correcta (por ejemplo, la acusación de que el análisis informático de los corpus es una pseudotecnología), algunas son unilaterales o incluso erróneas (como negar el valor de los datos del corpus).
Dos significados: Primero, se refiere a la comparación en el corpus de una misma lengua. Por ejemplo, el International English Corpus tiene 20 subcorpus paralelos de países donde el inglés es el idioma nativo u oficial y el idioma principal, como el Reino Unido, Estados Unidos, Canadá, Australia y Nueva Zelanda. El paralelismo se refleja en el hecho de que el tiempo, los objetos, las proporciones, la cantidad de texto y la longitud del texto de la selección del corpus son casi los mismos. El propósito de establecer la base de datos es realizar investigaciones comparativas sobre el inglés en diferentes países.
Otro tipo de corpus paralelo se refiere al muestreo y procesamiento paralelo entre dos o más idiomas, como los corpus alineados bilingües en la traducción automática.
? ¿Hansard del Parlamento canadiense (e.html)
? Acta de la reunión del Consejo Legislativo de la Región Administrativa Especial de Hong Kong (http://catalog.ldc.upenn.edu/LDC2000T50)
? Noticias de Hong Kong
? Ley de Hong Kong (Ley de Hong Kong)
Duró 8 años y constó de dos etapas: la primera etapa fue de 1996 a 2000, en la que se completó principalmente la anotación de las capas de análisis léxico y sintáctico para formar PDT 1.0 versión; la segunda etapa, 2000-2004, marcó principalmente la información de la capa de sintaxis profunda de la biblioteca del árbol, formando la versión PDT 2.0.
http://www.chineseldc.org(192.168.88.2)