El Corpus Oral de Madrid ha sido grabado entre 2016 y 2019. Se trata de un corpus de habla oral que representa el habla de Madrid. En su versión actual consta de 106 conversaciones entre 485 hablantes madrileños, resultando en 57 horas de grabación y 469.860 palabras.
El proyecto CORMA surgió para documentar el español conversacional espontáneo tal y como se presenta actualmente en Madrid. Se define por los rasgos siguientes:
- representa un corpus de interacciones lingüísticas en marcos y actividades cotidianos
- se caracteriza por un alto grado de variación situacional y sociolingüística, con un número representativo de participantes de ambos sexos, diferentes generaciones y diferentes niveles socio-culturales
- es un corpus de habla oral, conversacional y coloquial, es decir los participantes interactúan de manera inmediata, cara a cara, están involucrados en diálogos, ante todo cooperativos, con un alto grado de dinamicidad
- es un corpus de habla espontánea, obtenida principalmente mediante la técnica ordinaria.
Los materiales publicados incluyen transcripciones, archivos de audio y documentación técnica, junto con un sistema de metadatos detallado que facilita la selección de submuestras y el análisis cuantitativo y cualitativo (por variables de grabación, situación comunicativa y perfil sociolingüístico de los hablantes). El acceso está orientado a fines académicos y se rige por condiciones de uso que garantizan la protección de los participantes y la correcta citación del recurso.