Transparencia metodológica
Metodología y Fuentes
Todo dato en esta plataforma proviene de publicaciones oficiales. En esta página explicamos exactamente de dónde vienen los datos, cómo los procesamos y cuáles son sus limitaciones.
Fuentes de datos
Observatorio de la Violencia
Ministerio de Justicia y Paz de Costa Rica
Atlas de Criminalidad en PDF con conteos anuales de delitos por provincia y cantón. Cubre 2023–2025.
Tipo: Conteos absolutos
Formato: PDF (extracción automatizada con Python + pdfplumber)
Anexos Estadísticos OIJ
Organismo de Investigación Judicial
Archivos Excel con tasas de criminalidad por 10,000 habitantes por provincia. Cubre 2018–2022.
Tipo: Tasas / 10,000 hab.
Formato: Excel .xlsx (procesado con biblioteca xlsx)
Proyecciones de Población
INEC — Instituto Nacional de Estadística y Censos
Datos de población provincial y cantonal para calcular tasas por 100,000 habitantes.
Tipo: Población estimada
Formato: Incorporado en los anexos del OIJ
Proceso de extracción y procesamiento
Descarga automática
Un scraper en TypeScript (Cheerio) revisa periódicamente el sitio del Observatorio de la Violencia y descarga los PDF y Excel publicados.
Extracción de PDFs
Un script Python con pdfplumber analiza la estructura tabular de los Atlas de Criminalidad y extrae los conteos por tipo de delito, provincia y año.
Normalización
Un procesador TypeScript unifica las estructuras de Excel (tasas) y PDF (conteos) en un esquema común, asignando unidades correctas a cada registro.
Geocodificación
Los nombres de provincia y cantón se mapean a identificadores estándar (códigos INEC) para permitir visualización cartográfica.
Publicación
Los datos procesados se almacenan como archivos JSON en /public/data/ y se sirven directamente desde el servidor Next.js sin base de datos externa.
Limitaciones importantes
Cambio de metodología 2022/2023
Los datos 2018–2022 son tasas por 10,000 habitantes (Excel OIJ) y los datos 2023–2025 son conteos absolutos (PDF Atlas). Estas dos series NO son directamente comparables. La plataforma las visualiza por separado y las etiqueta claramente.
Cifra negra (sub-registro)
Los datos representan delitos denunciados y registrados por el OIJ. Un número significativo de delitos nunca se denuncia, especialmente violencia doméstica, robos menores y violaciones. La realidad criminalística supera los datos disponibles.
Cambios en clasificación de delitos
Las categorías de delito pueden haber cambiado entre períodos. Comparaciones inter-anuales deben hacerse con cautela, especialmente en categorías como 'narcotráfico' que abarcan múltiples tipos de infracción.
Período anual vs. semestral
Algunos años disponibles corresponden a datos del primer semestre. Cuando sea el caso, la etiqueta del período lo indica explícitamente (ej. 'Ene–Jun 2024'). No se extrapolan cifras anuales a partir de datos parciales.
Datos de cantones
La cobertura a nivel cantonal es parcial. No todos los cantones tienen datos para todos los años ni para todas las categorías de delito.
Garantías de calidad
Los datos se publican sin modificación numérica respecto a las fuentes originales
Cada registro incluye metadatos de origen (fuente, año, unidad de medida)
El código de procesamiento es público y auditable en GitHub
Las visualizaciones etiquetan claramente el tipo de dato (conteo vs. tasa)
Las comparaciones inter-temporales solo se muestran cuando las series son compatibles
La variación interanual se calcula solo para series de la misma fuente y metodología
Acceso a fuentes primarias
Recomendamos consultar siempre las fuentes primarias para análisis críticos. Esta plataforma facilita la exploración de datos públicos; para decisiones de política pública o investigación académica, descargue los documentos originales del Observatorio de la Violencia.
Aviso importante
Esta plataforma es un proyecto independiente, sin fines comerciales, y no está afiliada al Organismo de Investigación Judicial (OIJ), al Ministerio de Justicia y Paz, al INEC ni a ninguna otra institución gubernamental costarricense. Los datos son de dominio público y se reproducen con fines de transparencia, educación y análisis ciudadano.