Manifiesto Técnico | OpenBorme
Manifiesto Técnico: Estándares de Transparencia
Este documento establece los principios técnicos y éticos que rigen el proyecto OpenBorme. Su objetivo es garantizar la reproducibilidad, la confianza en los datos estructurados y la claridad en la gestión del proyecto.
1. Contrato de Datos (Data Contract)
OpenBorme se compromete a mantener un esquema de datos estable y versionado para facilitar la interoperabilidad.
Entidad: Acto (Publication)
Unidad atómica de información registral.
- id: Identificador único (BORME-A-YYYY-...).
- hash: Integridad MD5 del texto extraído.
- raw_text: Texto original verificado.
2. Metodología Reproducible
- Ingesta: Descarga diaria de XMLs y PDFs de la API oficial.
- Extracción: Procesamiento OCR y segmentación por regex.
- Normalización: Limpieza y estandarización de entidades.
- QA Automático: Validación cruzada contra sumario XML.
3. Código Abierto
Los módulos de ingesta, extracción y normalización son totalmente auditables en nuestro repositorio público. La infraestructura crítica se mantiene privada por seguridad.