Transparencia interna

Calidad de los datos

Publicamos abiertamente cómo aseguramos la calidad de nuestra base de datos. Cada registro es validado automáticamente: aquellos con problemas evidentes son ocultados de las páginas públicas con motivo documentado.

Última actualización: 12 de mayo de 2026

Cómo aseguramos la calidad

Los datos que presentamos en datos-publicos.mx pasan por un proceso de validación automatizado antes de ser publicados. Este proceso busca garantizar que la información sea coherente, esté completa y refleje con precisión lo publicado en las fuentes oficiales.

  1. Recopilación directa: los scrapers extraen datos directamente de las fuentes oficiales mexicanas (SAT, IMSS, DOF, CompraNet, PNT, INEGI, Banxico, CRE, SCJN, etc.).
  2. Normalización: los datos se estandarizan en un esquema común (fechas en formato ISO, categorización uniforme, nombres de dependencias normalizados).
  3. Validación automática: antes de la publicación, cada registro pasa por filtros que detectan y excluyen problemas comunes.
  4. Enlace a fuente: cada registro incluye un enlace directo a la fuente oficial para que el usuario pueda verificar la información.

Qué verificamos

  • Patrones HTTP ingeridos como contenido (por ejemplo, páginas de error capturadas durante un periodo de indisponibilidad del portal oficial).
  • HTML sin parsear (<html>, <script>, entidades HTML sin decodificar).
  • Fechas manifiestamente imposibles (más de 10 años en el futuro o anteriores a 1800).
  • Descripciones truncadas con menos de 50 caracteres o sin espacios.
  • Registros duplicados (deduplicación por identificador normalizado).
  • Montos incoherentes (valores negativos, ceros donde se espera un monto).

Qué NO ocultamos

Descripciones breves (legítimas para categorías tabulares como combustibles o catastro), campos opcionales vacíos, registros con errores tipográficos menores. Preferimos información disponible a perfección cosmética.

Verificación contra fuentes oficiales

Cada registro en datos-publicos.mx está vinculado a su fuente oficial correspondiente. Esto permite:

  • Que el usuario pueda verificar la información directamente en el portal gubernamental correspondiente.
  • Que nuestro sistema detecte automáticamente cuando un enlace oficial deja de funcionar (broken link detection).
  • Que en caso de discrepancia, la fuente oficial prevalece siempre.

Limitaciones y aclaraciones

Es importante que los usuarios estén conscientes de las siguientes limitaciones:

  • Desfase temporal: existe un desfase natural entre el momento en que una fuente oficial publica información y el momento en que nuestro sistema la recopila y publica. Este desfase varía de horas a días según la categoría.
  • Errores de scraping: la extracción automática de datos puede ocasionalmente producir errores, especialmente cuando las fuentes oficiales cambian el formato o la estructura de sus páginas.
  • Cobertura parcial: no todas las fuentes oficiales mexicanas están integradas. Estamos en expansión continua.
  • No sustituye fuentes oficiales: datos-publicos.mx es una herramienta de consulta y orientación. Para efectos legales, fiscales o de salud, siempre consulte la fuente oficial directamente.

Reporte de errores

Si encuentra un dato incorrecto, incompleto o desactualizado, le agradeceremos que nos lo reporte a info@datos-publicos.mx indicando:

  • La URL de la página con el error.
  • Qué dato es incorrecto.
  • La fuente oficial correcta (si la tiene disponible).

Los reportes de errores se atienden con prioridad en un plazo de 7 días hábiles.

Vea también