Inicio
todoELE
  • Inicio
  • Materiales
    • πŸ“‹ Actividades
    • πŸ“ Conjugación
    • πŸ“Š Corpus
    • πŸ“” Diccionarios
    • βœ… Evaluación
    • βš™οΈ Gramática
    • πŸ“— Manuales
    • ✍️ Ortografía
    • πŸ“… Programación
    • πŸ—£οΈ Pronunciación
    • πŸ“ Recursos
    • πŸ”€ Vocabulario
  • Formación
    • πŸ“š Bibliografía
    • πŸ‘₯ Congresos
    • πŸŽ“ Cursos
    • 🏫 Centros
    • 🏒 Organizaciones
    • πŸ“° Revistas
    • 🌍 Atlas de ELE
  • Trabajo
    • πŸ’Ό Ofertas de trabajo
    • ℹ️ Trabajo - Recursos
  • En la red
    • 🌐 Sitios ELE
    • πŸ“° Agregador
    • πŸ“§ Formespa
  • Tecnología
    • πŸ’» Herramientas digitales
  • Comunidad
    • πŸ“° Actualidad ELE
    • 😊 Anécdotas ELE
    • πŸ“ Blog
    • πŸ“ŒTablón de anuncios
  • Buscar

Ruta de navegación

  • Inicio
  • Corpus
  • Observatorio Lázaro

Observatorio Lázaro

https://observatoriolazaro.es/index.php
anglicismos
medios de comunicación

Observatorio Lázaro es un proyecto que analiza y extrae automáticamente los anglicismos aparecidos en las noticias del día de una veintena de medios españoles de prensa escrita, entre ellos elDiario.es, El País, El Mundo, ABC, La Vanguardia, El Confidencial, 20minutos, Agencia EFE, La Marea, El Economista, Marca, Fotogramas, Rolling Stone, Elle o El Mundo Today.

Cada día, Lázaro lee la prensa, detecta los préstamos no adaptados (fundamentalmente anglicismos), los registra en una base de datos y publica los datos en esta web, donde se pueden buscar, comparar y descargar libremente.

La información técnica sobre el modelo está disponible en este artículo científico. El código del observatorio y el corpus de entrenamiento están disponibles en GitHub. El modelo ya entrenado y listo para reutilizar está disponible a través de HuggingFace y de la librería de Python pylazaro.

Dado que la extracción es totalmente automática, los datos pueden contener errores: palabras mal etiquetadas como anglicismos o anglicismos que pasan inadvertidos.

Enviar corpus

Etiquetas

  • corpus oral (25)
  • corpus sonoro (11)
  • corpus escrito (10)
  • variedades del español (10)
  • corpus de estudiantes (9)
  • inmigrantes (8)
  • estudiantes universitarios (6)
  • español para fines específicos (5)
  • interacciones conversacionales (5)
  • corpus de vídeo (4)
  • corpus general (4)
  • humor (4)
  • sinohablantes (4)
  • actos de habla (3)
  • hablantes de herencia (3)
ver todas »
Sobre Todoele Índice Publica Contacto: todoele@gmail.com
Política de privacidad Créditos