OpenBorme

Manifiesto Técnico | OpenBorme

Manifiesto Técnico: Estándares de Transparencia

Este documento establece los principios técnicos y éticos que rigen el proyecto OpenBorme. Su objetivo es garantizar la reproducibilidad, la confianza en los datos estructurados y la claridad en la gestión del proyecto.

1. Contrato de Datos (Data Contract)

OpenBorme se compromete a mantener un esquema de datos estable y versionado para facilitar la interoperabilidad.

Entidad: Acto (Publication)

Unidad atómica de información registral.

  • id: Identificador único (BORME-A-YYYY-...).
  • hash: Integridad MD5 del texto extraído.
  • raw_text: Texto original verificado.

2. Metodología Reproducible

  1. Ingesta: Descarga diaria de XMLs y PDFs de la API oficial.
  2. Extracción: Procesamiento OCR y segmentación por regex.
  3. Normalización: Limpieza y estandarización de entidades.
  4. QA Automático: Validación cruzada contra sumario XML.

3. Código Abierto

Los módulos de ingesta, extracción y normalización son totalmente auditables en nuestro repositorio público. La infraestructura crítica se mantiene privada por seguridad.