PhraseNET: Detección y extracción automatizada de unidades fraseológicas

Descripción:
This article describes a new method to identify and extract phraseological units from textual corpora. There are different methods of classification of phraseological units, but we have to highlight the ones proposed by Corpas Pastor (1996). This author, starting from a wide conception of phraseology, classifies Spanish's phraseologisms in three different categories: collocations, locutions and phraseological enunciated units (fixed forms and routine formulas) from which we have to choose locutions and phraseological enunciated for our research. The extraction is done sentence-by-sentence and the proposed architecture is based on statistics and relational algebra. The main characteristic of this architecture is the scarce use of linguistic resources, which are replaced by algorithms of searches and statistical methods. Four experiments are presented in this paper to show the extraction of phraseological units from textual corpora. This application demonstrates the useful architecture of the software design, comparing the results of this system with manual extraction. The advantages of this system are the huge database that can be analyzed.
Autor:
Jose Luiz de Lucca
Editorial:
Universitat Politécnica de València
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Valencia

El desarrollo temático de la conversación en español como lengua materna y en español como lengua extranjera de estudiantes finlandeses

Materias de especialidad:
Descripción:
Partiendo de ocho conversaciones en español como lengua materna (ELM) y ocho conversaciones en español como lengua extranjera (ELE) de estudiantes finlandeses, la tesis analiza el desarrollo temático del núcleo de la conversación en ambos tipos de interacciones. Concretamente, los fenómenos conversacionales estudiados vienen representados por el mecanismo de cambio de tema secuencial, las secuencias temáticas que conforman el núcleo de la conversación cotidiana (secuencias de conformidad, secuencias narrativas y secuencias laterales) y, por último, la práctica interactiva de cierre de tema secuencial. En la investigación, se compara el funcionamiento del conjunto de dichos fenómenos en el corpus de conversaciones en ELE con respecto al corpus de conversaciones en ELM y, empleando tales resultados, se propone una serie de contenidos y directrices didácticos para su tratamiento explícito en la clase de ELE como parte de la competencia conversacional.
Autor:
María del Carmen Martínez Carrillo
Editorial:
Universidad Antonio de Nebrija, Departamento de Lenguas Aplicadas
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Madrid

Contacto de lenguas y la expresión de la posterioridad temporal en el español de Cataluña

Materias de especialidad:
Descripción:
Varios estudios realizados en las últimas décadas del siglo XX y las primeras del XXI demuestran que el futuro simple en español (cantaré) está en pleno retroceso en Hispanoamérica y en el resto de zonas peninsulares para la expresión de eventos prospectivos frente a la forma perifrástica IR A + INFINITIVO (voy a cantar). Algunos estudios que lo reafirman son los de Miró y Pineda, 1990; Gómez Manzano, 1992; Almeida y Díaz, 1998; Troya Déniz, 1998; Sedano, 2006; Melis 2006. No obstante, en los territorios de habla catalana se considera que, respecto del español general (peninsular y americano), la tendencia es inversa: la estructura perifrástica es menos productiva que la sintética (Ramírez-Parra y Blas Arroyo, 2000; Buzón García, 2013, en áreas de la Comunidad Valenciana, e Illamola, 2008 y 2013, en zonas de Cataluña). La tesis doctoral que se presenta tiene como objetivos principales analizar, por un lado, la distribución de la forma sintética –RÉ y de la construcción perifrástica IR A + INFINITIVO en contextos prospectivos para comprobar en qué medida sigue la tendencia señalada para el español general. Y, por otro, estudiar esta variación en el marco de los fenómenos de contacto de lenguas, en tanto que se examina a partir de un corpus de producciones orales escolares de informantes bilingües castellano-catalán, entre 11 y 16 años, de dos municipios de Cataluña --Mataró y Manlleu-- y en dos momentos temporales distintos, cuando cursaban 6º de primaria y, cuatro años más tarde, cuando cursaban 4º de la ESO. Concretamente, se quiere constatar la influencia del catalán en la producción de enunciados con referencia temporal prospectiva en castellano, expresados mediante una u otra forma. Si bien en catalán existe la perífrasis ANAR A + INFINITIVO, esta no acepta el valor de futuridad y mantiene el valor etimológico de movimiento y de finalidad. En cambio, en castellano, sí es posible dicho valor (y otros modales), dado el diferente grado de gramaticalización qu Se parte, por tanto, de la hipótesis de que la lengua inicial de los informantes es uno de los factores que inciden en el uso de una u otra variante para la expresión de futuro. Ahora bien, además de las variables clásicas que emplea la sociolingüística variacionista (sexo, edad), se incluyen como posibles condicionantes de este particular empleo nuevas variables independientes que permiten examinar más de cerca este fenómeno y las prácticas lingüísticas de los individuos; a saber: uso de castellano en el seno familiar, empleo de castellano en las interacciones entre amigos, competencia oral declarada y consumo de programas televisivos en castellano y en catalán. Todas estas variables inciden en los usos y prácticas lingüísticos de los individuos y, en consecuencia, condicionan en mayor o menor medida el empleo del futuro simple de indicativo y la perífrasis. En conclusión, en esta tesis se constata, en primer lugar, que los individuos analizados emplean de forma profusa la forma sintética, de modo que la tendencia es contraria a la constatada en otras zonas castellanohablantes monolingües y que puede hablarse de un fenómeno de convergencia lingüística, donde el sistema del castellano se está acercando paulatinamente al del catalán. Y, en segundo lugar, que el factor que de forma significativa condiciona el uso de la forma perifrástica es el sexo, aunque se observan correlaciones entre el empleo de IR A + INFINITIVO y la lengua inicial, la competencia oral declarada en castellano y el consumo televisivo: cuanto mayor es la presencia de castellano en estas esferas, mayor es la producción de FA.
Autor:
Cristina Illamola
Editorial:
Universidad de Barcelona
Tipo de publicación:
Tesis
Ciudad:
Barcelona

Teoría de la Lexicografía en Diccionarios Monolingües del Español (Orígenes - Siglo XXI)

Materias de especialidad:
Descripción:
El estudio realizado se acerca a la Teoría lexicográfica contenida en los diccionarios generales del español mediante la elaboración de un diccionario de especialidad metalexicográfica, que toma como fuente la macroestructura de este tipo de obras de consulta --Diccionario Histórco de la Terminología Metalexicográfica (DHTM)--. Con esto se intentará determinar, en la medida de lo posible y para la lexicografía del español únicamente, cuál es la terminología metalexicográfica registrada y el tratamiento recibido dentro de los diccionarios generales. De esta manera, la investigación, además de presentar información sobre la evolución de la práctica lexicográfica y la teoría que se desprende de ella, también facilitará datos relativos a la filogenia entre diccionarios. La incorporación de voces propias de la ciencia y la técnica es un punto de reflexión acostumbrado dentro de la Metalexicografía del español; hasta tal punto que actualmente existe un debate abierto en torno a la inclusión de este léxico en los diccionarios generales. En los siglos XVI y XVII, las voces técnicas se registraban principalmente en manuales y textos especializados de acceso restringido. En el siglo XVIII, con el nacimiento de la lexicografía general, también empiezan a recogerse --de manera más limitada en la producción de la Academia y más profusa en la obra de E. de Terreros-- en los diccionarios generales. Uno de los momentos decisivos en el tratamiento lexicográfico de este subconjunto léxico fue el siglo XIX, cuando los diccionarios de la Academia y los ajenos a la Corporación modifican su postura en torno a la inclusión de tecnicismos, los cuales pasan a ocupar desde entonces un lugar significativo en las columnas de los diccionarios generales. La terminología propia de la elaboración de diccionarios ha tenido una presencia constante desde el nacimiento de la lexicografía general del español. Pero sin duda, la profunda reestructuración experimentada por la lingüística durante el siglo XX, la cual permitió la consolidación de la lexicografía como disciplina lingüística, tuvo una importancia definitiva en el desarrollo terminológico de esta rama de la lingüística aplicada y en su mayor representación en las macroestructuras de los diccionarios generales.
Autor:
Jesús Camacho Niño
Editorial:
Universidad de Jaén
Tipo de publicación:
Tesis
Página de Internet:
Ciudad:
Jaén

Descripción y representación de los adjetivos deverbales de participio en el discurso especializado

Materias de especialidad:
Descripción:
El objetivo de esta tesis, es reunir información gramatical suficiente que permita determinar qué características deben reunir las bases verbales del español para ser capaces de originar un adjetivo deverbal de participio (ADP), y, basados en ello, poder describir cómo opera el proceso de activación de valor especializado en los términos N+ADP del dominio de la economía. Estas construcciones sintácticas mínimas son muy productivas en los discursos de ámbitos especializados, sin embargo la naturaleza híbrida de la forma participial acarrea muchos conflictos a la tarea de Procesamiento de Lenguaje Natural (PNL). Esta aproximación al análisis de los ADP es lingüística, está anclada teóricamente en la Teoría Comunicativa de la Terminología (TCT) e intenta ser el punto de contacto entre teoría y aplicación.
Autor:
Hada Rosabel Salazar Burgos
Editorial:
Universitat Pompeu Fabra
Tipo de publicación:
Tesis
Correo electrónico:
Página de Internet:
Ciudad:
Barcelona

Tertulia política y (des)cortesía verbal

Materias de especialidad:
Descripción:
El objetivo de esta tesis doctoral es confirmar la presencia de descortesía verbal en el género de la tertulia política, así como describir la configuración y el funcionamiento que presenta el fenómeno en este contexto comunicativo específico. Desde la perspectiva pragmática, planteamos el análisis cualitativo y cuantitativo de un corpus formado por 32 tertulias que han sido emitidas por la radio y la televisión española de 2009 a 2013. El interés de este objeto de estudio radica en dos factores: a) no ha recibido un análisis específico hasta ahora; b) presenta una peculiar combinación de rasgos determinados, por un lado, por el entorno mediático en el que se desarrolla y, por otro, por el tratamiento ideológico del tema que llevan a cabo los participantes de la interacción. Para describir y explicar rigurosamente la presencia de actos verbales descorteses en el corpus, en primer lugar, ofrecemos una exhaustiva caracterización del género tertulia política; en segundo lugar, redefinimos los conceptos básicos de la teoría en virtud de la situación comunicativa que nos interesa. La presencia de procesos interruptores, actos de habla disentivos y descalificaciones nos conducen a asegurar que la descortesía verbal ha calado en la superestructura del género tertulia política (si bien presenta índices de frecuencia de empleo superiores en televisión que en radio), así como a constatar que constituye una descortesía mediático-ideológica, en virtud de su doble objetivo: atraer la atención de la audiencia y conseguir su adscripción a un grupo ideológico determinado. La relevancia del estudio radica en la propuesta teórica que planteamos, susceptible de ser aplicada a otros contextos de comunicación, así como el avance que supone atender a la relevancia que parámetros como el medio de difusión, el rol o el sexo de hablante tienen en la configuración de la descortesía verbal.
Autor:
Marina González Sanz
Editorial:
Universidad de Sevilla
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Sevilla

Pragmática Lingüística aplicada al Español para Extranjeros, con especial atención a los Marcadores Discursivos

Descripción:
El presente trabajo de investigación aborda la realización de un diccionario de marcadores discursivos. Este diccionario está destinado a hablantes no nativos de español, estudiantes de cualquier nivel que deseen ampliar su vocabulario y aprender a utilizar correctamente estas expresiones, en muchas ocasiones coloquiales y de difícil asimilación por otros medios. En este diccionario tienen cabida todo tipo de marcadores, incluyendo nexos, operadores y algunas expresiones que no habían sido recogidas antes en un diccionario destinado a estudiantes de español como segunda lengua. En la primera parte de la tesis se realiza un análisis del estado de la cuestión, en el que se consultan y analizan distintas fuentes disponibles relacionadas con los marcadores discursivos, en concreto: un grupo de manuales de español, los diccionarios de marcadores y partículas existentes en lengua española y los artículos y monografías más recientes sobre marcadores. A continuación se explica el proceso de creación del diccionario y las decisiones tanto macroestructurales como microestructurales que se tomaron a la hora de elaborarlo. Un breve trabajo de campo confirma que esta obra será muy beneficiosa para los estudiantes de español. Finalmente, la parte central del trabajo es el Diccionario de Marcadores Discursivos para Estudiantes de Español como Lengua Extranjera, que cuenta con setecientas entradas completas más remisiones. Es el primer diccionario que se realiza con estas características, sin perder de vista al usuario al que se dirige, el estudiante de español como segunda lengua.
Autor:
Anais Holgado Lage
Editorial:
Universidad de Salamanca
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Salamanca

El léxico de la Informática e Internet en el ámbito hispanohablante. Descripción y estudio contrastivo

Descripción:
El español es una lengua con muchas realizaciones en función de sus diferentes registros. Es claro que las diferencias existentes en la lengua española son debidas a su amplia distribución geográfica y al alto número de hablantes; esto se materializa en los términos que designan realidades nuevas, como en el caso de la informática. Por esta razón, se consideró pertinente realizar un estudio detallado que pusiese de manifiesto las diferentes realizaciones de este tipo de léxico en los países de habla hispana, desde una perspectiva descriptiva y contrastiva, que permitiese observar puntos de encuentros y/o desencuentros en aspectos morfológicos, semánticos y discursivos de este lenguaje de especialidad. Para esta investigación, hemos llevado a cabo un rastreo de este tipo de léxico en fuentes lexicográficas (diccionarios generales, corpus, bases terminológicas y glosarios especializados) y en fuentes textuales (entre los años 2006 y 2010); estas últimas responden a dos tipos: periódicos digitales y páginas web de universidades, ambas de veintiún países de habla hispana. Con las fuentes textuales, se ha conformado un corpus mediante la herramienta TLCorpus de TshwaneDJe, que permite visualizar listados de términos e indica su frecuencia de aparición; asimismo, posibilita su búsqueda en un microcontexto, a la vez que extraer ejemplos. Finalmente, en esta investigación se ha profundizado tanto en el aspecto teórico como en el práctico del léxico de la informática e Internet en el ámbito hispánico. Aspiramos a que se constituya en un antecedente válido para posteriores estudios y análisis en este campo, así como en la base para un glosario actualizado de este tipo de términos.
Autor:
Lirian Astrid Ciro
Editorial:
Universidad de Lleida
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Lleida

La publicidad en escena. Análisis pragmático-textual del discurso publicitario de revistas en español

Materias de especialidad:
Descripción:
La publicidad es un producto de épocas y de culturas específicas. Tanto el contenido publicitario como su expresión semiótica son cambiantes a lo largo de los años, de acuerdo no solo a las culturas, sino también a los diferentes estilos de vida que imperan en un período temporal en las sociedades. La publicidad constituye precisamente por ello una excelente plataforma de observación de los hábitos comunicativos de las comunidades de práctica en un período dado. Y en ello radica el centro de nuestro interés al abordar el discurso publicitario: la publicidad vista como prácticas discursivas, que explota las posibilidades y las formas de comunicación de una lengua en una época determinada y con un fin específico, la persuasión. Hemos empleado el término de "puesta en escena", que proviene del teatro y que significa 'montar un espectáculo sobre el escenario' , porque la publicidad, conocedora de hábitos y de rutinas de vida comunes, de los principios ético-morales, así como también de las aspiraciones y de los ideales de las diferentes comunidades de práctica de una sociedad, lleva a escena diferentes episodios que, como piezas de un variopinto mosaico, encuentran su lugar en la representación de los micromundos que conforman una sociedad. La publicidad es, pues, siempre una puesta en escena en la que se (re)construyen realidades con un objetivo fático, primero y persuasivo, último. Desde un punto de vista técnico, el término "puesta en escena" describirá --partiendo de una aproximación teórica pragmática en un sentido amplio del término-- la estructura y la conjunción de elementos propias de las prácticas discursivas publicitarias de los anuncios impresos en lengua hispana y que posibilitan la representación de universos ficticios, lo cual implica la construcción de unos locutores y entornos imaginarios de acuerdo a quien va destinado el mensaje publicitario.
Autor:
Yvette Bürki
Editorial:
Universität Basel
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
Basel

La argumentación en el discurso periodístico sobre la inmigración

Materias de especialidad:
Descripción:
En este trabajo se estudian los mecanismos argumentativos que los principales medios de comunicación españoles emplearon en la cobertura de los "sucesos de El Ejido" ocurridos en la localidad almeriense en febrero de 2000. Para ello, se utilizan dos herramientas fundamentales: el Análisis Crítico del Discurso, en tanto que marco metodológico general y la Teoría de la Argumentación en la Lengua, en tanto que instrumento de trabajo particular.
Autor:
Mario de la Fuente García
Editorial:
Universidad de León
Tipo de publicación:
Tesis
Correo electrónico:
Ciudad:
León