Calidad del dato en entornos regulados: una propuesta metodológica para la selección de herramientas tecnológicas
Número
Sección
Publicado
30-04-2026
Resumen
En el contexto actual de big data y transformación digital, la gestión de la calidad del dato (DQM) se ha convertido en una función esencial, especialmente en entornos regulados por normativas como el RGPD o la Ley de Inteligencia Artificial de la UE. Este artículo examina los principales marcos normativos y estándares técnicos aplicables, analiza el ciclo de vida del dato y evalúa herramientas comerciales para su gestión. Finalmente, se propone una metodología para seleccionar herramientas tecnológicas de calidad del dato, integrando aspectos normativos, técnicos y organizacionales, con el objetivo de facilitar decisiones informadas y cumplimiento regulatorio.Palabras clave:
Calidad del dato, gobernanza de datos, cumplimiento normativo, herramientas tecnológicas, ciclo de vida del dato
Agencias de apoyo
- Esta investigación ha sido financiada por el Vicerrectorado de Investigación de la Universitat Politècnica de Valencia (PAID-11-24) y (POLISABIO2024_AP15).
Referencias
ATACCAMA. (2024a). Ataccama ONE – Unified data management platform powered by AI. https://www.ataccama.com/platform
ATACCAMA. (2024b). What’s new in the Gartner Magic Quadrant for Data Quality Solutions 2024. https://www.ataccama.com/blog/what-s-new-in-the-gartner-magic-quadrant-for-data-quality-solutions-2024
AWS. (2024). Amazon SageMaker – Built-in Algorithms. https://docs.aws.amazon.com/sagemaker/latest/dg/algos.html
DEVELOPERS, B. (2024). Boto3 Documentation. https://docs.aws.amazon.com/boto3/latest/
ESIC. (2024). Ciclo de vida de los datos: qué es y etapas. https://www.esic.edu/rethink/tecnologia/ciclo-vida-datos-c
EUROPEAN COMMISSION. (2024). Common European Data Spaces: Enhancing data-driven innovation across strategic sectors. https://digital-strategy.ec.europa.eu/en/policies/data-spaces
EUROPEAN PARLIAMENT, & COUNCIL. (2016). Regulation (EU) 2016/679 (General Data Protection Regulation). https://eur-lex.europa.eu/eli/reg/2016/679/oj
EUROPEAN PARLIAMENT, & COUNCIL. (2022a). Regulation (EU) 2022/868 on data governance (Data Governance Act). https://eur-lex.europa.eu/eli/reg/2022/868/oj
EUROPEAN PARLIAMENT, & COUNCIL. (2022b). Regulation (EU) 2022/2065 (Digital Services Act). https://eur-lex.europa.eu/eli/reg/2022/2065/oj
EUROPEAN PARLIAMENT, & COUNCIL. (2023). Regulation (EU) 2023/2854 on harmonised rules on fair access to and use of data (Data Act). https://eur-lex.europa.eu/eli/reg/2023/2854/oj
EUROPEAN PARLIAMENT, & COUNCIL. (2024a). AI Act Explorer – Regulation on harmonised rules for artificial intelligence. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689
EUROPEAN PARLIAMENT, & COUNCIL. (2024b). Regulation (EU) 2024/1183 on European digital identity (eIDAS2). https://eur-lex.europa.eu/eli/reg/2024/1183/oj/eng
EUROPEAN PARLIAMENT, & COUNCIL. (2024c). Regulation on harmonised rules for artificial intelligence (Artificial Intelligence Act). https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689
EXPERIAN. (2024). Aperture Data Studio. https://www.experian.co.uk/business/platforms/aperture-data-studio
FOUNDATION, A. S. (2024). Apache Arrow documentation. https://github.com/apache/arrow
IBM. (2024). InfoSphere Information Server for Data Quality. https://www.ibm.com/es-es/products/infosphere-info-server-for-datamgmt
INFORMATICA. (2024). Informatica Data Quality Solutions. https://www.informatica.com/
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2011). ISO 8000-110:2011 – Data quality – Part 110: Master data: Exchange of characteristic data.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2015a). ISO/IEC 25012:2015 – Software product quality requirements and evaluation (SQuaRE) – Data quality model.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2015b). ISO/IEC 25024:2015 – Measurement of data quality.
LABS, A. W. S. (2024). awswrangler: Pandas on AWS. https://aws-sdk-pandas.readthedocs.io/en/stable/
LADDER, D. (2024). Software de comparación de datos. https://dataladder.com/address-standardization-guide/
OPENREFINE. (2024). OpenRefine – A free, open source, powerful tool for working with messy data. https://openrefine.org/
SEENIVASAN MPHASIS, D., & SEENIVASAN, D. (2022). ETL vs ELT: Choosing the right approach for your data warehouse. International Journal for Research Trends and Innovation, 7(2), 2456–3315. https://doi.org/10.6084/m9.doione.IJRTI2202018
SHAH, S. I. H., PERISTERAS, V., & MAGNISALIS, I. (2021). DaLiF: A Data Lifecycle Framework for Data-Driven Governments. Journal of Big Data, 8, 89. https://doi.org/10.1186/s40537-021-00481-3
SNAPLOGIC. (2024). ETL vs. ELT: What’s the Difference? https://www.snaplogic.com/blog/etl-vs-elt-whats-the-difference
TALEND. (2024). Talend – Data Integration and Integrity Platform. https://www.talend.com/products/data-integration/
Licencia
Derechos de autor 2026 Llanos Cuenca, Jorge Maté, Andrés Boza

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.

Esta obra se encuentra bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.
