Bibliografía - Cristóbal Lozano

Despite the burgeoning field of Spanish second language acquisition (SLA) research, large Spanish learner corpora (LC) are not common practice yet. We present a general yet practical introduction to the multiple decisions Spanish as a second language (L2) researchers should consider before creating their own LC. We focus on (i) two freely available Spanish LC (CEDEL2 and COWS-L2H), (ii) their general design principles, (iii) crucial variables to collect (learner and task variables), (iv) ways of collecting and compiling LC data, and (v) the final product (the corpus interface). We explore different ways of interrogating the two corpora, illustrating them with specific (morpho)syntactic and lexical examples from L2 Spanish, as well as potential curricular and teaching applications of LC. We conclude with a recommendation for the triangulation of LC data with experimental research and a summary of future directions that the field of LC research may take. Our ultimate aim is to equip researchers with the basic theoretical and methodological tools to design, build and collect their own LC.

----

A pesar del reciente auge del campo de la investigación de la adquisición de español como segunda lengua (L2), el uso de corpus de aprendices (CA) sigue sin ser una práctica habitual. En este artículo presentamos, de manera general a la vez que práctica, las múltiples decisiones a las que se enfrentan los investigadores de español L2 a la hora de crear su propio corpus. Nos centramos en (i) dos CA de español de acceso gratuito (CEDEL2 and COWS-L2H), (ii) sus principios de diseño, (iii) las variables relativas a los aprendices y a las tareas, (iv) maneras de recoger y compilar los datos y (v) el producto final (interfaces de búsqueda). Exploramos diferentes maneras de interrogar los corpus, ilustrándolas con ejemplos lingüísticos, y describimos posibles usos de esos datos tanto en la investigación como en la enseñanza. Concluimos con una recomendación de triangular datos de CA y experimentos y un resumen de los próximos pasos en el campo de la investigación de CA. Nuestra finalidad es equipar a los investigadores con herramientas básicas para compilar exitosamente su propio CA.

This article presents a state-of-the-art discussion of second language (L2) Spanish corpus-based research on lexical competence. While L2 Spanish learner corpus research (LCR) is still in its infancy, we will review the major findings of relevant studies on the production of several lexical aspects: copula choice with ser/estar; overt/null pronoun distribution; collocations and lexico-syntactic verbal competence. Due to the highly contextualised nature of learner corpus data, many of these studies show that learners do not always behave differently from natives in terms of frequency of use, though they may differ in terms of discursive and pragmatic uses. The article ends with some theoretical and methodological caveats about L2 Spanish learner corpus research. An argument is made for the need to conduct L2 corpus-based research which (1) is theoretically motivated and explanatory (as opposed to descriptive and pedagogical), (2) uses fine-grained annotation (as opposed to coarse-grained, general tagsets), (3) exploits learner corpora that are properly designed and where learner variables are properly controlled for.

---------------------------

Este artículo presenta una revisión crítica de los estudios de corpus de español como segunda lengua (L2) sobre la competencia léxica. Si bien la investigación de la adquisición del español L2 basada en corpus está aún en su infancia, se revisarán los hallazgos principales de algunos estudios clave sobre el uso de verbos copulativos (ser/estar), la distribución de pronombres plenos y nulos, las colocaciones y otros aspectos léxicos. Dado que los datos de corpus proceden de discursos naturales, la mayoría de estos estudios demuestran que los aprendices se comportan de forma similar a los nativos con relación a la frecuencia de uso, aunque difieren con relación a los usos pragmáticos y discursivos. El artículo concluye con una discusión de las limitaciones teóricas y metodológicas de dichos estudios y con recomendaciones para que los futuros estudios de español L2 basados en corpus (1) estén teóricamente motivados y sean explicativos (en vez de descriptivos y pedagógicos), (2) usen sistemas de anotación más sofisticados (en vez de sistemas genéricos) y (3) exploten corpus de aprendices que estén bien diseñados y que controlen las variables del aprendiz.

Revistas