Análisis de la Distribución Horaria de Incidentes

Análisis de la Distribución Horaria de Incidentes

Introducción

Se estudió la distribución de incidentes delictivos a lo largo del día, agrupando los datos por hora (0 a 23). El objetivo fue modelar esta variación temporal para entender patrones periódicos que pudieran relacionarse con horarios de mayor riesgo.

Visualización Inicial

Se obtuvo un histograma de conteos por hora \( y_i \) para cada hora \( x_i \in \{0,1,\ldots,23\} \), mostrando una clara periodicidad diaria:

\[ (x_i, y_i), \quad i=0, \ldots, 23 \]

Evaluación del Modelo

Se usaron las siguientes métricas para evaluar la bondad de ajuste:

  • Coeficiente de determinación \( R^2 \): \[ R^2 = 1 - \frac{\sum_{i=0}^{23} (y_i - \hat{y}_i)^2}{\sum_{i=0}^{23} (y_i - \bar{y})^2} \]
  • Raíz del error cuadrático medio (RMSE): \[ RMSE = \sqrt{\frac{1}{24} \sum_{i=0}^{23} (y_i - \hat{y}_i)^2} \]

Modelado con Ajuste Polinomial

Primero se intentó un ajuste polinomial de grado 4 al conjunto de datos.

El modelo resultó con un coeficiente de determinación \( R^2 = 0.506 \), y \(RMSE = 123.65\) indicando una explicación moderada de la variabilidad en los datos.

Modelado con Funciones Senoidales

Debido a la naturaleza periódica, se decidió aproximar la serie de datos con funciones seno, que capturan patrones repetitivos.

Modelo con Tres Términos Senoidales

El modelo es:

\[ y(x) = a_1 \sin\left(b_1 x + c_1\right) + a_2 \sin\left(b_2 x + c_2\right) + a_3 \sin\left(b_3 x + c_3\right) + d \]

donde:

  • \(b_1 = \frac{2\pi}{24}\) (frecuencia diaria),
  • \(b_2 = \frac{4\pi}{24}\) (doble frecuencia diaria),
  • \(b_3 = \frac{6\pi}{24}\) (triple frecuencia diaria).

Este modelo alcanzó un ajuste excelente con:

\[ R^2 = 0.94, \quad \text{RMSE} = 42.67 \]

Visualización de Resultados

Conclusión

El análisis muestra que el modelo senoidal con tres términos describe mucho mejor la periodicidad de los incidentes por hora que un ajuste polinomial, evidenciado por un mayor valor de \( R^2 \) y un menor RMSE. Este enfoque permite identificar con mayor precisión las horas de mayor riesgo y puede ayudar a optimizar estrategias de prevención.

Comments

Popular posts from this blog

Explorando los datos actuales de robos en el Metro CDMX

De la tabla al mapa — visualización de datos con Python y Plotly