todoELE | Etiquetas | corpus de aprendices

Bibliografía - corpus de aprendices

El corpus de aprendices japoneses CELEN y su aplicación a la docencia y la investigación en ELE

Pilar Valverde (2023)

En TEISEL.Tecnologías para la investigación en segundas lenguas 3

En este artículo se presenta el Corpus de ELE en Japón, CELEN (https://ske.li/qqr), una colección de textos escritos por hablantes de japonés (L1) con distintos grados de dominio del español como lengua extranjera, desde el nivel A1 hasta el nivel C2 del MCER. Los datos proceden de (1) universidades en Japón, donde el español se estudia como asignatura de lengua extranjera o como carrera, y (2) contextos de interacción real en Internet, como blogs electrónicos y foros. La versión 1.2, de abril de 2023, consta de 6.196 textos escritos por 1.035 aprendices, con un total de 658.467 palabras. En el apartado 1 se resume brevemente la situación del español en Japón y los corpus de aprendices existentes. En el apartado 2 se describen las características principales de CELEN, el proceso de recogida y anotación de los datos y la interfaz de consulta. En el apartado 3 se ilustra su uso con varios tipos de búsquedas (concordancias, colocaciones, listas de palabras y n-gramas), aplicadas a fenómenos lingüísticos relevantes en la docencia o la investigación en ELE: el uso de se, las preposiciones, la concordancia de género, el orden de palabras, las colocaciones verbales, la frecuencia léxica o las secuencias de categorías gramaticales más frecuentes. Se trata de un recurso abierto, que se actualiza periódicamente, y esperamos que otros profesores e investigadores puedan albergar sus textos en él para ofrecer a la comunidad científica una amplia muestra de aprendices japoneses de español. En la página web del proyecto (https://sites.google.com/view/celen) se puede consultar la guía de uso detallada y descargar íntegramente algunas partes del corpus bajo una licencia CC BY-NC 4.0.

Herramientas para la codificación, el análisis y la explotación de un corpus oral de aprendices francófonos de español

Cristina Muñoz (2024)

En TEISEL.Tecnologías para la investigación en segundas lenguas 3

Texto completo

En este trabajo se analiza el uso de tres herramientas digitales para la codificación, el análisis y la explotación de un corpus oral de aprendices de L2. En primer lugar, se presenta la creación, codificación y actualización del corpus, que se compiló con el objetivo de analizar los errores cometidos en el plano oral por parte de un grupo compuesto por 51 informantes franceses, estudiantes de segundo año de Lenguas Extranjeras Aplicadas de la Universidad François Rabelais de Tours (Francia). Una vez conseguido el material auditivo, se procedió a la transcripción y anotación textual codificada, siguiendo la normativa que marca Text Encoding Initiative.

Esta investigación se valió de ciertas herramientas digitales, como XML Formatter (https://jsonformatter.org/xml-formatter), XML Validator (https://codebeautify.org/xmlvalidator), VS Studio (https://code.visualstudio.com/), Git (https://git-scm.com/), GitHub (https://github.com/), SpaCy (https://SpaCy.io/), CATMA (https://catma.de/) y Google Colaboratory (https://colab.google/), que contribuyeron al desarrollo del análisis y la explotación del corpus oral, sirviendo para la configuración y validación de la cabecera del corpus (XML Formatter - Validator), para el etiquetado del corpus (VS Studio), para el control y almacenaje de las versiones (Git-GitHub) y para la actualización del corpus (SpaCy permite nuevos análisis, Google Colaboratory es un instalador de software usado junto a SpaCy, y con CATMA se desarrolla el nuevo etiquetado).

La precisión gramatical en un corpus de escritura académica de aprendientes africanos de ELE

Anita Ferreira Cabrera (2022)

En Revista Internacional de Lenguas Extranjeras 18

Texto completo

La precisión en la escritura es de vital importancia en las audiencias académicas y profesionales, en las cuales los errores pueden estigmatizar a quienes escriben. El Feedback Correctivo Escrito (FCE) es un tema crucial en el ámbito de la Adquisición de una Segunda Lengua (ASL) dado que favorece el aprendizaje y contribuye cognitivamente al mejoramiento de los niveles de precisión en una segunda lengua. El objetivo de este artículo es aportar evidencia empírica en el área del ELE para fines académicos. Para ello, se analiza un corpus de textos académicos de aprendientes africanos de nivel A2, cuyas L1 son portugués e inglés, con el objeto de determinar los errores más frecuentes. Los resultados arrojan que estos corresponden a las preposiciones y artículos. La determinación de dichos errores permite el tratamiento de ellos a través de estrategias de feedback correctivo escrito metalingüístico directo para mejorar la precisión de este tipo de palabras en los escritos académicos.

Los corpus de aprendices de español LE/L2: panorama actual y perspectivas futuras

Guillermo Rojo, Ignacio Palacios, María Sampedro Mella, Aurélie Marsily (2022)

En Journal of Spanish Language Teaching 9.2

Este capítulo tiene un objetivo doble. En primer lugar, tras una breve introducción delimitadora del tema, trataremos de describir las características de los corpus de aprendices (CA) de español como lengua extranjera o segunda (LE/L2) existentes en la actualidad y facilitar a los lectores todos los datos pertinentes: denominación, responsables, direcciones web, tamaño, naturaleza de las muestras (carácter escrito u oral), tipos de codificación incorporada, fecha de construcción, L1 de los participantes y condiciones actuales de uso. Toda esa información, detallada hasta donde sea posible, será finalmente resumida en un cuadro en el que se podrán apreciar con facilidad todas sus cualidades y también sus carencias. En segundo término, describiremos las aplicaciones más importantes que se pueden obtener de los CA para la mejora del proceso de enseñanza/aprendizaje de ELE, con una enumeración final de las líneas fundamentales por las que debería discurrir esta zona de trabajo en los próximos años.

----

The purpose of this study is twofold. Firstly, after a brief introduction narrowing down the area of study, we intend to describe the characteristics of the currently existing L2 Spanish learner corpora and provide the readers with the main data: denomination, team responsible for the corpus, websites, size, type of samples (written, spoken), type of data coding, construction date, participants’ L1 and current conditions of use. All this information will be given as detailed as possible and will be summarised in a table where all the strengths and weaknesses of these corpora will be presented. We will secondly deal with the main applications of these learner corpora for the improvement of L2 Spanish teaching and learning processes together with some final notes containing a number of suggestions for future work.

Pasado, presente y futuro de los corpus de aprendices de ELE. Una revisión bibliográfica

Eugenia Esperanza Núñez Nogueroles (2019)

En ReiDoCrea 8 (3) - Monográfico sobre Perspectivas transnacionales en la enseñanza de lenguas

Texto completo

: Este trabajo presenta una revisión bibliográfica en la que se examinan publicaciones referentes a los corpus de aprendices en general y a los de ELE en particular, destacando el papel fundamental de los avances informáticos en el desarrollo de este ámbito. Dado que la investigación en corpus de aprendices aborda el estudio de los errores, comenzaremos remontándonos a los orígenes de la Lingüística Contrastiva y sus tres modelos de análisis para, más adelante, poner de manifiesto que la ayuda proporcionada en la actualidad por los ordenadores ha solventado problemas detectados en los trabajos que implementaron estos modelos (en especial, el Análisis de Errores) durante el siglo XX. Nos centraremos, a continuación, en la investigación en corpus de aprendices: expondremos sus características principales y describiremos cinco de ellos. Exploraremos el Análisis de errores asistido por ordenador y el Análisis Contrastivo de Interlengua. Indagaremos en la relación entre la investigación basada en corpus de aprendices y la Adquisición de Segundas Lenguas, por un lado, y entre aquella y la Enseñanza de Lenguas Extranjeras, por otro. Haremos referencia a la producción pedagógica derivada del tipo de estudios que nos ocupan y, por último, incluiremos una sección final, a modo de conclusión.

Writing development in Spanish as a second and heritage language: a corpus study on complexity

Agustina Carando, Sophia Minnillo, Paloma Fernández-Mira, Sam Davidson, Kenji Sagae, Claudia Sánchez-Gutiérrez (2023)

En Journal of Spanish Language Teaching 10.1

Few studies have analyzed the writing features of second language (L2) alongside heritage language (HL) learners of Spanish. Focusing on the development of writing complexity, we collected data from students at the beginning and at the end of a composition sequence. Comparing the groups at the outset revealed HL students’ greater mood complexity. After 14 weeks, both groups improved in tense complexity, mean essay length, and lexical sophistication. Our findings suggest that, given sufficient time, both HL and L2 students can progress in similar ways in at least some measures of linguistic complexity. Nevertheless, they might gain from instruction that facilitates new and diverse vocabulary, and the construction of longer sentences. L2 students specifically would benefit from greater emphasis on the subjunctive. Our study supports the claim that achieving writing complexity takes time and comes in stages, contributing to a more nuanced understanding of L2 and HL writing development.

------------------------

Pocos estudios analizaron las características de la escritura en aprendices de español como segunda lengua (L2) junto a hablantes de herencia (HH). Enfocándonos en el desarrollo de la complejidad escrita, recabamos datos al principio y al final de una secuencia de composición. Al comparar los grupos al comienzo del curso observamos una mayor complejidad de modo verbal en los HH. Después de 14 semanas, los dos grupos mejoraron en el tiempo verbal, largo del ensayo y sofisticación léxica, lo que demuestra que progresan de forma similar en algunas medidas. No obstante, hay áreas que podrían mejorarse: un mayor énfasis en vocabulario nuevo y diverso, y fomentar el largo de las oraciones; para los L2 además se recomienda más práctica del subjuntivo. Esta investigación apoya la idea de que la complejidad escrita requiere tiempo y ocurre en etapas, contribuyendo a nuestro conocimiento de las trayectorias de desarrollo escrito en estos grupos.

Publica