Corpus - corpus escrito

RedPajama-Data-v2

https://github.com/togethercomputer/RedPajama-Data

RedPajama-Data-v2 es un corpus multilingüe de acceso abierto para el entrenamiento de modelos de lenguaje, que está formado por 30 billones de formas... Ver más»

Corpus del Español del Siglo XXI (CORPES XXI)

https://www.rae.es/banco-de-datos/corpes-xxi

En el congreso celebrado en Medellín en marzo de 2007, las academias de la lengua española acordaron encomendar a la Real Academia Española la... Ver más»

Corpus Iberia

http://iberia.cchs.csic.es/cgi-bin/iberia.cgi

"El corpus Iberia es una herramienta informática creada entre 2008 y 2009 en el seno del Consejo Superior de Investigaciones Científicas para los estudios... Ver más»

Corpus de ELE en Japón (CELEN)

https://sites.google.com/view/celen

Aplicación de consulta El Corpus de ELE en Japón (CELEN) es un corpus de aprendices de español cuya primera lengua es el japonés. Los datos que lo... Ver más»

Corpus de español hablado y escrito por sinohablantes (CorSinoELE)

http://corsinoele.usal.es

El corpus CorSinoELE. Corpus de español hablado y escrito por sinohablantes consta de 395 textos orales y escritos producidos por 99 hablantes chinos... Ver más»