El proyecto “Delitos e Inmigración en España (2010–2023)” nació con la intención original de analizar la evolución conjunta de la criminalidad y la inmigración en España desde 1998 hasta la actualidad.
Sin embargo, la falta de desagregación por nacionalidad antes de 2010 en los registros del Ministerio del Interior y la discontinuidad en las series de población extranjera del INE hicieron imposible construir un panel homogéneo anterior a 2010.
Por esta razón, el periodo final del estudio se delimitó a 2010–2023, garantizando consistencia anual, coherencia estadística y comparabilidad entre fuentes oficiales (INE, Interior y Eurostat).
Este marco temporal permite capturar la consolidación de la inmigración en España, la recuperación post-crisis de 2008 y el impacto de los años de COVID-19 (2020–2021), ofreciendo una visión equilibrada entre estabilidad estructural y eventos extraordinarios.
¿Existe una relación descriptiva significativa entre la variación en la población extranjera y la variación en la tasa de delitos en España entre 2010 y 2023?
Esta pregunta guía el análisis empírico del proyecto y enmarca todos los resultados dentro de un enfoque descriptivo y no causal, centrado en observar co-movimientos estadísticos y patrones de correlación en el tiempo.
Estudio reproducible desarrollado íntegramente en R y
RStudio (versión ≥ 4.3), siguiendo un flujo completo de
análisis de datos: limpieza, validación, generación de métricas,
visualización y reporte automatizado en
RMarkdown/Quarto.
El entorno fue gestionado con renv para asegurar la
reproducibilidad exacta del entorno de ejecución y las
dependencias de los paquetes.
El proyecto analiza el periodo 2010–2023, evaluando
la relación entre población extranjera y
criminalidad agregada en España.
Incluye controles socioeconómicos (PIB real, AROPE,
paro juvenil) y ventanas de análisis con y sin
COVID-19.
Los resultados son descriptivos y no causales, basados
exclusivamente en fuentes oficiales (INE, Ministerio
del Interior y Eurostat).
Todas las figuras y tablas fueron generadas con
ggplot2 y paquetes del ecosistema
tidyverse, bajo un diseño visual coherente (tema “pearl” y
paleta Okabe–Ito).
El informe se produce automáticamente a partir de los datos procesados
mediante scripts versionados y trazables dentro del repositorio.
Autor: Jesús Castro · JESUSCASTRODATA
Entorno: R + RStudio · renv reproducible · ggplot2 +
tidyverse
Periodo: 2010–2023 · Versión: dev ·
Últ. actualización: 2025-10-27
Licencias: MIT (código) · CC BY 4.0 (documentos y
figuras)
Repositorio: github.com/JESUSCASTRODATA/crime-migration-spain
Cobertura. 2010–2023 (análisis principal con y sin 2020–2021). Fuentes. INE (población), Ministerio del Interior (criminalidad), Eurostat (Gini y AROPE; serie armonizada UE). Métricas. Tasas por 100k, % de población extranjera, diferencias interanuales (Δ). Aviso. Evidencia descriptiva; no implica causalidad.
Hallazgos clave.
d_).tasa_100k = (conteo_anual / poblacion_anual) × 100.000.share_extranjeros = pct_extranjeros / 100.*_summary, *_qa_*
documentan cada chequeo.Este documento no recalcula: inserta figuras/tablas
ya exportadas. Rutas relativas desde docs/ →
../output/figures/ y ../output/tables/.
Convenciones
01_tendencias_base100.png,
03_corr_deltas_sin_covid.png,
18_stationarity_heatmap.png…20_corr_deltas_sin_covid.csv,
20_pcor_niveles_sin_covid.csv,
18_stationarity_summary.csv…Muestra anual corta (14 obs.); agregación nacional; posibles variables omitidas; ruptura COVID. Se prioriza evidencia en Δ y ventana sin COVID.
d_ = Δ (primera diferencia anual). pct_ =
porcentaje (0–100); share_ = proporción (0–1).
*_100k = tasa por 100.000 hab. r, ρ, τ =
Pearson, Spearman, Kendall.
Tendencias base-100: Hechos conocidos, esclarecidos y % extranjeros (base = primer año disponible)
Muestra la evolución relativa (índice base = 100) de tres series nacionales: hechos conocidos, hechos esclarecidos y porcentaje de población extranjera. Permite observar cómo, pese a la caída general entre 2010-2016, las tres variables repuntan desde 2017 y sufren una interrupción durante el periodo COVID-19 (2020-2021), antes de recuperarse con fuerza.
Correlaciones en variaciones (Δ) — ventana sin COVID
Representa la matriz de correlaciones entre las variaciones anuales (Δ) de las principales variables: tasas de hechos conocidos, hechos esclarecidos y porcentaje de población extranjera. Se observa una asociación elevada (r≈0.8–0.9) entre los cambios en la proporción de extranjeros y las variaciones en las tasas de criminalidad, lo que sugiere una co-movilidad significativa en la ventana sin COVID (2010–2019 & 2022–2023).
Correlaciones en variaciones (Δ) — ventana total (2010–2023)
Refleja las correlaciones entre las variaciones anuales (Δ) de las principales variables a lo largo de todo el periodo 2010–2023, incluyendo los años COVID. La fuerza de las asociaciones se debilita respecto a la ventana sin COVID, debido a la disrupción excepcional de 2020–2021, que alteró simultáneamente tanto la movilidad como la actividad delictiva registrada. Aun así, las correlaciones positivas entre los cambios en % de extranjeros y las tasas de criminalidad se mantienen, aunque con menor intensidad.
Δ HC por 100k vs Δ % extranjeros — todo el periodo
Esta figura representa la relación entre los cambios anuales (Δ) en la tasa de hechos conocidos por 100.000 habitantes y la variación anual en el porcentaje de población extranjera, para todo el periodo 2010–2023.
Al incluir los años 2020–2021 (marcados por el impacto del COVID-19), la asociación lineal se debilita (r ≈ 0.27, p ≈ 0.38), reflejando un aumento de la volatilidad y una pérdida de co-movilidad respecto a la ventana sin COVID.
En términos descriptivos, el comportamiento atípico de 2020 y 2021 reduce la fuerza de la relación observada entre ambas variables.
Δ (5 delitos) vs Δ % extranjeros — excluye 2020–2021
Cada panel representa la variación interanual de la tasa (por 100.000 habitantes) frente al cambio en el porcentaje de población extranjera para una tipología concreta de delito violento.
En la ventana sin COVID (2010–2019 y 2022–2023), las cinco tipologías muestran pendientes positivas: a medida que aumenta la proporción de extranjeros, también lo hace la tasa de estos delitos.
No obstante, las relaciones son descriptivas y deben interpretarse como coevolución temporal, no causalidad. Las tendencias podrían reflejar factores estructurales comunes, como cambios en la denuncia, la actividad económica o el control policial.
Δ (5 delitos) vs Δ % extranjeros — con 2020–2021
Al incluir los años 2020–2021, el patrón de relación entre las variaciones en el porcentaje de población extranjera y las tasas de los cinco delitos seleccionados se vuelve más irregular y disperso. La pendiente positiva se atenúa, lo que indica que durante la pandemia —un periodo excepcional en movilidad, denuncias y operatividad policial— las series perdieron sincronía temporal, reduciendo la fuerza de la coevolución observada en periodos previos y posteriores.
Niveles: tasa HC (100k) vs % extranjeros — sin COVID
Al excluir los años 2020–2021, la relación entre la tasa de Hechos Conocidos y el porcentaje de población extranjera es muy alta (r ≈ 0.96). Este resultado refleja una coevolución casi lineal en niveles, aunque no necesariamente causal, probablemente explicada por factores estructurales comunes como el crecimiento demográfico y la recuperación económica tras la crisis de 2008.
Niveles: tasa HC (100k) vs % extranjeros — todo el periodo
En el periodo completo 2010–2023, la relación entre la tasa de hechos conocidos (HC) y el porcentaje de población extranjera mantiene una pendiente positiva moderada (r≈0.43). Sin embargo, los años 2020–2021 destacan como outliers negativos, reflejando la distorsión estadística causada por la pandemia (menor movilidad y variación en registros). Al excluirlos (véase la figura anterior “sin COVID”), la asociación se refuerza notablemente, mostrando un patrón de coevolución más claro entre ambas series.
Estacionariedad por ventana y transformación (α = 5%)
La figura muestra la clasificación de estacionariedad de las series principales (tasas de criminalidad, PIB, proporción de extranjeros) bajo diferentes ventanas temporales y transformaciones. A nivel de diferencias (Δ), todas las series se vuelven estacionarias, lo que confirma la necesidad de trabajar con variaciones interanuales para evitar correlaciones espurias. En niveles, la mayoría de las series presentan estacionariedad de tipo tendencial (T) o de nivel (L), mientras que el PIB real y el porcentaje de extranjeros muestran cambios estructurales moderados. Esto valida el enfoque metodológico del estudio, que prioriza las diferencias anuales (Δ) como base para el análisis correlacional y los tests de causalidad.
Precedencia temporal en niveles (Toda–Yamamoto), FDR ≤ 10%
El gráfico representa los resultados del procedimiento Toda–Yamamoto (1995) aplicado a las series en niveles para el periodo 2010–2023. Las flechas muestran las direcciones donde se detecta precedencia temporal con FDR (False Discovery Rate) ≤ 10%.
En este caso, no se observan relaciones causales unidireccionales estables: las conexiones entre el % de extranjeros y las tasas de Hechos Conocidos (HC) o Hechos Esclarecidos (HE) son bidireccionales o débiles, lo que sugiere posible endogeneidad o influencia de factores comunes. Esto refuerza la interpretación no causal del estudio: las co-variaciones detectadas describen patrones estadísticos, no mecanismos de causa-efecto comprobados.
Convención: Δx ≡ d_x en tablas (p. ej.,
Δ% extranjeros = d_pct_extranjeros).
| x | y | pearson_r | pearson_p | n | spearman_r | spearman_p | kendall_r | kendall_p |
|---|---|---|---|---|---|---|---|---|
| pct_extranjeros | share_extranjeros | 0.9761 | 0e+00 | 12 | 0.9720 | 0e+00 | 0.9091 | 0.000 |
| pct_extranjeros | tasa_hc_100k | 0.9550 | 0e+00 | 12 | 0.9790 | 0e+00 | 0.9394 | 0.000 |
| pct_extranjeros | tasa_he_100k | 0.9032 | 1e-04 | 12 | 0.8741 | 2e-04 | 0.7273 | 0.001 |
| x | y | pearson_r | pearson_p | n | spearman_r | spearman_p | kendall_r | kendall_p |
|---|---|---|---|---|---|---|---|---|
| d_pct_extranjeros | d_share_extranjeros | 0.9176 | 0.0001 | 11 | 0.9000 | 0.0002 | 0.7455 | 0.0014 |
| d_pct_extranjeros | d_tasa_hc_100k | 0.8086 | 0.0026 | 11 | 0.8909 | 0.0002 | 0.7091 | 0.0024 |
| d_pct_extranjeros | d_tasa_he_100k | 0.7566 | 0.0070 | 11 | 0.7455 | 0.0085 | 0.6000 | 0.0102 |
Nota: En Δ, la asociación entre Δ% extranjeros y ΔHC es fuerte al excluir 2020–2021 (p. ej., r≈0.81; ρ≈0.89).
Las correlaciones parciales permiten aislar la relación neta entre inmigración y criminalidad, descontando el efecto de variables económicas y demográficas (AROPE, PIB real y paro juvenil). En la siguiente figura se observa cómo, una vez controladas estas variables, la pendiente entre Δ% de extranjeros (en puntos porcentuales) y ΔHC por 100.000 habitantes se reduce pero mantiene signo positivo.
Relación parcial: Δ% extranjeros (p.p.) vs ΔHC (100k) — sin COVID (controlando ΔAROPE, ΔPIB pc real y ΔParo 15–29)
La pendiente parcial ilustra cómo la asociación se atenúa tras controlar por AROPE, PIB pc real y paro juvenil.
| x | y | n | method | r | p |
|---|---|---|---|---|---|
| pct_extranjeros | share_extranjeros | 12 | pearson | 0.9473 | 0e+00 |
| pct_extranjeros | share_extranjeros | 12 | spearman | 0.8811 | 2e-04 |
| pct_extranjeros | tasa_hc_100k | 12 | pearson | 0.9579 | 0e+00 |
| pct_extranjeros | tasa_hc_100k | 12 | spearman | 0.9021 | 1e-04 |
| pct_extranjeros | tasa_he_100k | 12 | pearson | 0.9196 | 0e+00 |
| pct_extranjeros | tasa_he_100k | 12 | spearman | 0.8462 | 5e-04 |
| x | y | n | method | r | p |
|---|---|---|---|---|---|
| d_pct_extranjeros | d_share_extranjeros | 11 | pearson | 0.9006 | 0.0002 |
| d_pct_extranjeros | d_share_extranjeros | 11 | spearman | 0.8909 | 0.0002 |
| d_pct_extranjeros | d_tasa_hc_100k | 11 | pearson | 0.7654 | 0.0060 |
| d_pct_extranjeros | d_tasa_hc_100k | 11 | spearman | 0.9000 | 0.0002 |
| d_pct_extranjeros | d_tasa_he_100k | 11 | pearson | 0.7798 | 0.0046 |
| d_pct_extranjeros | d_tasa_he_100k | 11 | spearman | 0.8182 | 0.0021 |
En una frase. Entre 2010 y 2023, cuando cambia la proporción de población extranjera, también cambian —en promedio— las tasas de delitos. Es un patrón descriptivo, no una afirmación causal.
Cómo leer estos resultados (para público general).
El análisis de los datos disponibles para el periodo 2010–2023 muestra una asociación estadística positiva y consistente entre la proporción de población extranjera y las tasas agregadas de criminalidad registradas en España (Hechos Conocidos y Hechos Esclarecidos).
Esta asociación es más intensa en las variaciones anuales (Δ) cuando se excluyen los años 2020–2021, marcados por los efectos excepcionales de la pandemia de COVID-19. En esa ventana sin COVID, los coeficientes de correlación alcanzan valores elevados (r ≈ 0.8, ρ ≈ 0.9), lo que evidencia una co-movilidad significativa entre los cambios relativos de ambas series. Al incorporar el periodo COVID-19, la relación se atenúa, reflejando una alteración coyuntural derivada de un contexto social y operativo extraordinario.
Al introducir controles socioeconómicos —PIB real, paro juvenil y AROPE— las correlaciones en niveles se reducen en magnitud, aunque mantienen su signo positivo. Esto sugiere que parte de la asociación observada podría deberse a factores macroeconómicos o demográficos compartidos, como el ciclo económico o la estructura poblacional, más que a un vínculo directo entre inmigración y criminalidad.
Las pruebas de estacionariedad (ADF, PP, KPSS) confirman que la mayoría de las series presentan no-estacionariedad en niveles, por lo que las correlaciones deben interpretarse en términos de variaciones y no de valores brutos.
La figura de precedencia temporal (Toda–Yamamoto) refuerza este diagnóstico: las direcciones detectadas son bidireccionales y de baja significación (FDR ≤ 10 %), lo que indica que no existe evidencia robusta de causalidad unidireccional entre el porcentaje de población extranjera y las tasas de criminalidad, sino posibles interdependencias dinámicas de corto plazo.
En consecuencia, los resultados deben entenderse como evidencia descriptiva de coevolución, no como prueba de causalidad. Esto no implica ausencia de causas reales, sino que las mismas no pueden identificarse estadísticamente con los datos y la resolución temporal disponibles. El estudio aporta, por tanto, una base empírica reproducible y neutral, que documenta cómo ambas series evolucionaron conjuntamente en el tiempo, sin extender inferencias causales más allá de los datos.
Síntesis: entre 2010 y 2023, inmigración y criminalidad agregada muestran una correlación positiva en variaciones anuales —especialmente fuera del periodo COVID-19—, pero la evidencia disponible no permite afirmar que una determine a la otra. Las tendencias observadas describen una co-evolución estadística influida por factores económicos, sociales y demográficos comunes.
Estructura sugerida del proyecto:
proyecto/
├── docs/ # Este documento Rmd
├── output/
│ ├── figures/ # Figuras generadas
│ └── tables/ # Tablas de resultados
└── scripts/ # Código de análisis
Requisitos. R ≥ 4.3.0 · Paquetes: tidyverse, knitr, kableExtra. Datos. INE (población), Ministerio del Interior (criminalidad) y Eurostat (Gini, AROPE).
Fuentes de datos
Cada una de las referencias incluidas en la sección anterior se corresponde con un método o contraste estadístico empleado en el proyecto:
Dickey & Fuller (1979, 1981) — Test ADF (Augmented Dickey–Fuller) Evalúa la presencia de raíz unitaria (no estacionariedad). En este estudio se aplicó sobre las principales series (tasa HC, HE, % de extranjeros, PIB real, AROPE, paro juvenil) para determinar si presentaban tendencia estocástica. Los resultados justifican el uso de transformaciones en diferencias (Δ).
Phillips & Perron (1988) — Test PP Alternativa robusta al ADF, corrige autocorrelación y heterocedasticidad de los errores. Se utilizó para contrastar los resultados del ADF y comprobar la robustez de la conclusión sobre estacionariedad.
Kwiatkowski et al. (1992) — Test KPSS Prueba inversa
(la hipótesis nula es estacionariedad). Complementó los tests ADF y PP:
cuando ambos coincidían, se clasificó la serie como estacionaria o no
estacionaria. Los resultados se resumen en
18_stationarity_summary.csv y
18_stationarity_heatmap.png.
Toda & Yamamoto (1995) — Procedimiento TY–VAR (Causalidad
de Toda–Yamamoto) Permite evaluar precedencia temporal entre
variables incluso si no son estacionarias. Se aplicó para explorar
relaciones de precedencia entre los cambios en el % de extranjeros y las
tasas de criminalidad, controlando el orden de integración. Implementado
en 55_toda_yamamoto_tests.R, con resultados visuales en
output/figures/granger_toda.png.
Benjamini & Hochberg (1995) — Corrección FDR (False
Discovery Rate) Controla el error tipo I cuando se ejecutan
múltiples contrastes (p. ej., distintos pares de variables o delitos).
Usado sobre los p-valores de los tests de Granger y TY para evitar
falsos positivos. Aplicado en 24_granger_VAR.R y
55_toda_yamamoto_tests.R.
Resumen operativo
| Método / Test | Propósito | Uso en el proyecto |
|---|---|---|
| ADF / PP | Detectar no-estacionariedad | Validar necesidad de diferencias (Δ) |
| KPSS | Confirmar estacionariedad | Contrastar ADF y PP |
| Toda–Yamamoto | Precedencia temporal | Explorar relaciones entre inmigración y criminalidad |
| FDR (B–H) | Ajustar por comparaciones múltiples | Corrección de p-valores en TY/Granger |
| Término / Abrev. | Significado completo | Contexto y función en el informe |
|---|---|---|
| HC (100k) | Hechos Conocidos por cada 100.000 hab. | Métrica principal de criminalidad (registros policiales). |
| HE (100k) | Hechos Esclarecidos por cada 100.000 hab. | Indicador de eficacia policial (casos resueltos). |
| pct_extranjeros | % de población extranjera (0–100%). | Variable explicativa principal. |
| share_extranjeros | Proporción de extranjeros (0–1). | Equivale a pct_extranjeros/100; útil en parciales/controles. |
| Δ (Delta) / d_ | Primera diferencia anual | Mitiga no‑estacionariedad y regresiones espurias. |
| tasa_hc_100k | Tasa de HC por 100.000 hab. | Normaliza por población para comparabilidad temporal. |
| tasa_he_100k | Tasa de HE por 100.000 hab. | Normaliza la serie de esclarecimientos. |
| r (Pearson) | Correlación lineal (−1 a +1) | Fuerza/dirección de relación lineal. |
| ρ (Spearman) | Correlación de rangos (monótona) | Más robusta a no linealidades/outliers. |
| τ (Kendall) | Concordancia de pares | Basada en pares concordantes/discordantes. |
| p‑valor | Valor de probabilidad (significancia) | Evidencia estadística (p<0.05/0.01). |
| Correlación parcial | Asociación controlando otras variables | Aísla X–Y descontando composición. |
| No‑estacionariedad | Momentos cambian en el tiempo | Puede inducir correlaciones espurias en niveles. |
| Estacionariedad | Momentos estables en el tiempo | Suele cumplirse en Δ; deseable para inferencia. |
| ADF / PP / KPSS | Tests de raíz unitaria | Diagnóstico formal de (no) estacionariedad. |
| Granger / TY | Precedencia temporal (VAR/TY) | Explora direccionalidad predictiva (no causalidad real). |
| FDR | Tasa de descubrimientos falsos | Corrección por múltiples contrastes. |
| INE | Instituto Nacional de Estadística (España) | Fuente de población y demografía. |
| Ministerio del Interior | — | Fuente de criminalidad (España). |
| Eurostat (Gini, AROPE) | Oficina Estadística de la UE | Indicadores armonizados de desigualdad/exclusión. |
Estacionariedad — α = 10%
Nota. Criterio menos estricto (α = 10%) muestra patrones similares de estacionariedad.
Castro, J. (2025). Delitos e Inmigración en España (2010–2023). JESUSCASTRODATA (GitHub). https://doi.org/10.5281/zenodo.17465216 · Código bajo MIT · Documentación y figuras bajo CC BY 4.0.
El código del proyecto se distribuye bajo la Licencia MIT, que permite su uso, copia, modificación y redistribución con atribución al autor original.
Licencia: MIT License Autor: © 2025 Jesús Castro · JESUSCASTRODATA
Los contenidos textuales, visuales y gráficos del informe están disponibles bajo una licencia Creative Commons Atribución 4.0 Internacional (CC BY 4.0), que permite compartir y adaptar el material siempre que se cite adecuadamente al autor.
Licencia: CC BY 4.0 Atribución sugerida: Castro, J. (2025). Delitos e Inmigración en España (2010–2023).* Documentos y figuras bajo CC BY 4.0.*
Los datos fuente utilizados en este proyecto (INE,
Ministerio del Interior, Eurostat) mantienen sus propias condiciones de
uso y reutilización según las políticas de cada organismo. Para conocer
los detalles específicos, consulte el documento: docs/DATOS_Y_LICENCIAS.md.
© 2024–2025 Jesús Castro · JESUSCASTRODATA Licencias: MIT (código) · CC BY 4.0 (documentación y figuras) · Datos: según condiciones originales de cada fuente. DOI: 10.5281/zenodo.17465216