Fundamentación y descripción

Muchas sub-disciplinas de la lingüística requieren la correcta aplicación de herramientas cuantitativas para el análisis de datos experimentales y de corpus. El análisis estadístico permite explorar datos, identificar patrones y refutar hipótesis. Este curso propone una introducción a un amplio espectro de métodos estadísticos para regresión desde una perspectiva práctica. Se pondrá el énfasis en aplicaciones y casos de estudio. No se requieren conocimientos previos de programación o matemática. Únicamente es necesaria la dedicación por parte de los/as alumno/as para aprender a usar R, un lenguaje de programación y entorno para el análisis estadístico [software libre].


  • Proveer un conjunto de técnicas para el análisis de respuestas gausianas y no

gausianas, usando modelos de regresión.

  • Lograr manejar datos correlacionados.
  • Poder explorar datos mediante análisis descriptivo y gráficas.
  • Introducir a los/as estudiantes en el entorno de programación R.
  • Brindar habilidades para la crítica metodológica de artículos científicos.
  • Proporcionar a los/las estudiantes herramientas para poder realizar un proyecto de investigación en lingüística cuantitativa.


Unidad 1: Análisis descriptivo y nociones de probabilidad e inferencia.

Introducción a R. Tipos de variables. Estadística descriptiva. Gráficas. Pre-procesamiento. Nociones de probabilidades. Función de probabilidad puntual, de densidad y acumulada. Algunas distribuciones usuales. Distribuciones muestrales. Estimación por intervalo. Nociones de: p-valor, hipótesis, potencia, tamaño muestral, tamaño de efecto. Tests de normalidad e igualdad de varianzas.

'Unidad 2: El modelo lineal [LM]

Correlación. Modelo de regresión lineal simple. Supuestos. Estimación de los parámetros por cuadrados mínimos. Distribución de los estimadores. Test de hipótesis. Intervalo de confianza e intervalo de predicción. Regresión lineal múltiple. Predictoras binarias y categóricas. Comparaciones múltiples. Contrastes. Análisis de residuos. Transformaciones. Colinealidad, heteroscedasticidad, no linealidad y falta de independencia. Selección de modelos.

Unidad 3: El modelo lineal generalizado [GLM]

La familia exponencial. Funciones de enlace. Regresión logística. Estimación de los parámetros por máxima verosimilitud. Test de cociente de máxima verosimilitud. Residuos y bondad de ajuste. Test de Hosmer-Lemeshow. Curva ROC y otras medidas de desempeño para predicción. Regresión de Poisson. Sobre-dispersión.

Unidad 4: Métodos para datos agrupados y medidas repetidas

Modelo lineal mixto [LMM]. Efectos fijos y aleatorios. Estructuras de covarianzas. Modelos lineales generalizados mixtos [GLMM]. Modelos con ecuaciones estructurales generalizadas [GEE].

