Corpus Val.Es.Co 3
Etiquetas:
El corp recogido en esta web presenta una muestra de español coloquial.
Esta versión del corpus consta de sesenta y seis conversaciones, que incluyen el núcleo de la versión anterior (corpus 2.1), al que se le añaden nuevas muestras conversacionales. Además, un subcorpus de quince conversaciones se ha segmentado en diferentes unidades de análisis: discursos, diálogos, turnos, intervenciones, actos y subactos, siguiendo la teoría de unidades conversacionales desarrollada por el grupo Val.Es.Co. Este intento constituye el primer análisis integral de la estructura del español hablado sobre una teoría de base pragmática.
La interfaz ha sido reconfigurada totalmente: las conversaciones se pueden reproducir en modo karaoke, se pueden explorar secciones dentro de cada conversación y se puede acceder a la información de la ficha técnica con facilidad. Asimismo, las palabras se han etiquetado morfosintácticamente mediante el etiquetador XIADA, desarrollado en la Universidad de Santiago de Compostela (España).
La búsqueda presenta varias opciones de filtrado: por caracteres especiales (como pausa, signos de interrogación o exclamación, reinicios), por metadatos, por índices prosódicos y por unidades discursivas. Para el subcorpus segmentado, el usuario puede elegir entre un formato "plano", sin indicaciones de unidades, o un formato con la segmentación total o parcial del ejemplo.
Los resultados de la búsqueda se presentan ordenados por intervenciones. Cada ejemplo puede ampliar su contexto en varias intervenciones hacia arriba o hacia abajo. Es posible exportar los resultados en formato .docx o .xlxs.
La sección "Preguntas frecuentes" constituye una primera guía de uso del corpus y el punto de partida para entender su funcionamiento.
Esta versión constituye el principal resultado del proyecto de investigación UDEMADIS (FFI 2016-77841-P), concedido por el MINECO (España), y en el que han trabajado más de doce investigadores durante tres años.
Deja un comentario