Cómo aseguramos la calidad
Los datos que presentamos en datos-publicos.mx pasan por un proceso de validación automatizado antes de ser publicados. Este proceso busca garantizar que la información sea coherente, esté completa y refleje con precisión lo publicado en las fuentes oficiales.
- Recopilación directa: los scrapers extraen datos directamente de las fuentes oficiales mexicanas (SAT, IMSS, DOF, CompraNet, PNT, INEGI, Banxico, CRE, SCJN, etc.).
- Normalización: los datos se estandarizan en un esquema común (fechas en formato ISO, categorización uniforme, nombres de dependencias normalizados).
- Validación automática: antes de la publicación, cada registro pasa por filtros que detectan y excluyen problemas comunes.
- Enlace a fuente: cada registro incluye un enlace directo a la fuente oficial para que el usuario pueda verificar la información.
Qué verificamos
- Patrones HTTP ingeridos como contenido (por ejemplo, páginas de error capturadas durante un periodo de indisponibilidad del portal oficial).
- HTML sin parsear (
<html>,<script>, entidades HTML sin decodificar). - Fechas manifiestamente imposibles (más de 10 años en el futuro o anteriores a 1800).
- Descripciones truncadas con menos de 50 caracteres o sin espacios.
- Registros duplicados (deduplicación por identificador normalizado).
- Montos incoherentes (valores negativos, ceros donde se espera un monto).
Qué NO ocultamos
Descripciones breves (legítimas para categorías tabulares como combustibles o catastro), campos opcionales vacíos, registros con errores tipográficos menores. Preferimos información disponible a perfección cosmética.
Verificación contra fuentes oficiales
Cada registro en datos-publicos.mx está vinculado a su fuente oficial correspondiente. Esto permite:
- Que el usuario pueda verificar la información directamente en el portal gubernamental correspondiente.
- Que nuestro sistema detecte automáticamente cuando un enlace oficial deja de funcionar (broken link detection).
- Que en caso de discrepancia, la fuente oficial prevalece siempre.
Limitaciones y aclaraciones
Es importante que los usuarios estén conscientes de las siguientes limitaciones:
- Desfase temporal: existe un desfase natural entre el momento en que una fuente oficial publica información y el momento en que nuestro sistema la recopila y publica. Este desfase varía de horas a días según la categoría.
- Errores de scraping: la extracción automática de datos puede ocasionalmente producir errores, especialmente cuando las fuentes oficiales cambian el formato o la estructura de sus páginas.
- Cobertura parcial: no todas las fuentes oficiales mexicanas están integradas. Estamos en expansión continua.
- No sustituye fuentes oficiales: datos-publicos.mx es una herramienta de consulta y orientación. Para efectos legales, fiscales o de salud, siempre consulte la fuente oficial directamente.
Reporte de errores
Si encuentra un dato incorrecto, incompleto o desactualizado, le agradeceremos que nos lo reporte a info@datos-publicos.mx indicando:
- La URL de la página con el error.
- Qué dato es incorrecto.
- La fuente oficial correcta (si la tiene disponible).
Los reportes de errores se atienden con prioridad en un plazo de 7 días hábiles.
Vea también
- Proceso editorial — cómo seleccionamos fuentes y validamos datos.
- Nuestras fuentes — listado completo por categoría.
- Quiénes somos — quién está detrás del proyecto.