Parallel Corpus English / Spanish (PaEnS)
Tipo de recurso:
Recursos por materias
Materias de especialidad:
Descripción:
English/Spanish parallel Corpus, PaEnS, es parte de un gran proyecto en curso, PaCorES, Parallel Corpora Spanish, que tiene como objetivo recopilar una serie de corpus paralelos bilingües con el español como lengua central.
PaEnS es un corpus paralelo bilingüe compuesto por dos partes principales: el corpus central y los suplementos.
El corpus central está compuesto por textos originales en inglés y español y sus respectivas traducciones. Incluye obras de ficción, novelas y cuentos, alrededor del 80%, así como no ficción, especialmente psicología, ensayos y textos de divulgación científica. Las obras seleccionadas no están representadas por los textos completos, sino más bien por muestras, permitiendo una mejor sección transversal de los textos. Se marcan las pausas en el texto (original y traducción).
Los suplementos contienen un total de más de 110 millones de palabras. Si no se especifica lo contrario, no se realizan ninguna revisión manual.
En un futuro próximo, se espera agregar nuevas colecciones de textos bilingües de diversa procedencia.
El objetivo es construir un recurso lingüístico multifuncional y representativo para el par de idiomas inglés / español que sea capaz de satisfacer las necesidades diferenciadas de los usuarios y que pueda ser explotado para múltiples propósitos, como la investigación general en lingüística contrastiva, tipología lingüística, estudios de traducción y lexicografía bilingüe, así como el suministro de datos de entrenamiento a la máquina sistemas de traducción. PaEnS también ha demostrado ser un recurso muy útil y ampliamente utilizado por traductores y estudiantes de inglés o español como lenguas extranjeras en intermedio y avanzado. niveles para obtener multitud de sugerencias de traducción realizadas por humanos y presentadas dentro de ejemplos de uso del lenguaje real.
PaEnS es un corpus paralelo bilingüe compuesto por dos partes principales: el corpus central y los suplementos.
El corpus central está compuesto por textos originales en inglés y español y sus respectivas traducciones. Incluye obras de ficción, novelas y cuentos, alrededor del 80%, así como no ficción, especialmente psicología, ensayos y textos de divulgación científica. Las obras seleccionadas no están representadas por los textos completos, sino más bien por muestras, permitiendo una mejor sección transversal de los textos. Se marcan las pausas en el texto (original y traducción).
Los suplementos contienen un total de más de 110 millones de palabras. Si no se especifica lo contrario, no se realizan ninguna revisión manual.
En un futuro próximo, se espera agregar nuevas colecciones de textos bilingües de diversa procedencia.
El objetivo es construir un recurso lingüístico multifuncional y representativo para el par de idiomas inglés / español que sea capaz de satisfacer las necesidades diferenciadas de los usuarios y que pueda ser explotado para múltiples propósitos, como la investigación general en lingüística contrastiva, tipología lingüística, estudios de traducción y lexicografía bilingüe, así como el suministro de datos de entrenamiento a la máquina sistemas de traducción. PaEnS también ha demostrado ser un recurso muy útil y ampliamente utilizado por traductores y estudiantes de inglés o español como lenguas extranjeras en intermedio y avanzado. niveles para obtener multitud de sugerencias de traducción realizadas por humanos y presentadas dentro de ejemplos de uso del lenguaje real.
Institución o grupo de investigación donde se realiza el proyecto:
Universidad Santiago de Compostela
País:
Página de internet donde se encuentra la referencia al proyecto de investigación:
Dirección postal completa:
Corpus PaEnS (I. Doval)
Departmento de Filoloxía Inglesa e Alemá
Facultade de Filoloxía, Universidade de Santiago de Compostela
Avda. Castelao s/n
E-15782 Santiago de Compostela (España)
Teléfono 1:
(+34) 881811849 / 859 / 871
Fuente de información: