Calidad del dato en entornos regulados: una propuesta metodológica para la selección de herramientas tecnológicas

Número

Sección

Artículos
  • Llanos Cuenca Research Centre on Production Management and Engineering (CIGIP), Universitat Politècnica de València (UPV), Camino de Vera s/n, 46022 Valencia, Spain.
  • Jorge Maté Escuela Técnica Superior de Ingeniería Informática, Universitat Politècnica de València (UPV), Camino de Vera s/n, 46022 Valencia, Spain.
  • Andrés Boza Research Centre on Production Management and Engineering (CIGIP), Universitat Politècnica de València (UPV), Camino de Vera s/n, 46022 Valencia, Spain.

DOI:

https://doi.org/10.37610/88.725

Publicado

30-04-2026

Resumen

En el contexto actual de big data y transformación digital, la gestión de la calidad del dato (DQM) se ha convertido en una función esencial, especialmente en entornos regulados por normativas como el RGPD o la Ley de Inteligencia Artificial de la UE. Este artículo examina los principales marcos normativos y estándares técnicos aplicables, analiza el ciclo de vida del dato y evalúa herramientas comerciales para su gestión. Finalmente, se propone una metodología para seleccionar herramientas tecnológicas de calidad del dato, integrando aspectos normativos, técnicos y organizacionales, con el objetivo de facilitar decisiones informadas y cumplimiento regulatorio.

Palabras clave:

Calidad del dato, gobernanza de datos, cumplimiento normativo, herramientas tecnológicas, ciclo de vida del dato

Agencias de apoyo

  • Esta investigación ha sido financiada por el Vicerrectorado de Investigación de la Universitat Politècnica de Valencia (PAID-11-24) y (POLISABIO2024_AP15).

Referencias

ATACCAMA. (2024a). Ataccama ONE – Unified data management platform powered by AI. https://www.ataccama.com/platform

ATACCAMA. (2024b). What’s new in the Gartner Magic Quadrant for Data Quality Solutions 2024. https://www.ataccama.com/blog/what-s-new-in-the-gartner-magic-quadrant-for-data-quality-solutions-2024

AWS. (2024). Amazon SageMaker – Built-in Algorithms. https://docs.aws.amazon.com/sagemaker/latest/dg/algos.html

DEVELOPERS, B. (2024). Boto3 Documentation. https://docs.aws.amazon.com/boto3/latest/

ESIC. (2024). Ciclo de vida de los datos: qué es y etapas. https://www.esic.edu/rethink/tecnologia/ciclo-vida-datos-c

EUROPEAN COMMISSION. (2024). Common European Data Spaces: Enhancing data-driven innovation across strategic sectors. https://digital-strategy.ec.europa.eu/en/policies/data-spaces

EUROPEAN PARLIAMENT, & COUNCIL. (2016). Regulation (EU) 2016/679 (General Data Protection Regulation). https://eur-lex.europa.eu/eli/reg/2016/679/oj

EUROPEAN PARLIAMENT, & COUNCIL. (2022a). Regulation (EU) 2022/868 on data governance (Data Governance Act). https://eur-lex.europa.eu/eli/reg/2022/868/oj

EUROPEAN PARLIAMENT, & COUNCIL. (2022b). Regulation (EU) 2022/2065 (Digital Services Act). https://eur-lex.europa.eu/eli/reg/2022/2065/oj

EUROPEAN PARLIAMENT, & COUNCIL. (2023). Regulation (EU) 2023/2854 on harmonised rules on fair access to and use of data (Data Act). https://eur-lex.europa.eu/eli/reg/2023/2854/oj

EUROPEAN PARLIAMENT, & COUNCIL. (2024a). AI Act Explorer – Regulation on harmonised rules for artificial intelligence. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689

EUROPEAN PARLIAMENT, & COUNCIL. (2024b). Regulation (EU) 2024/1183 on European digital identity (eIDAS2). https://eur-lex.europa.eu/eli/reg/2024/1183/oj/eng

EUROPEAN PARLIAMENT, & COUNCIL. (2024c). Regulation on harmonised rules for artificial intelligence (Artificial Intelligence Act). https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689

EXPERIAN. (2024). Aperture Data Studio. https://www.experian.co.uk/business/platforms/aperture-data-studio

FOUNDATION, A. S. (2024). Apache Arrow documentation. https://github.com/apache/arrow

IBM. (2024). InfoSphere Information Server for Data Quality. https://www.ibm.com/es-es/products/infosphere-info-server-for-datamgmt

INFORMATICA. (2024). Informatica Data Quality Solutions. https://www.informatica.com/

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2011). ISO 8000-110:2011 – Data quality – Part 110: Master data: Exchange of characteristic data.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2015a). ISO/IEC 25012:2015 – Software product quality requirements and evaluation (SQuaRE) – Data quality model.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (2015b). ISO/IEC 25024:2015 – Measurement of data quality.

LABS, A. W. S. (2024). awswrangler: Pandas on AWS. https://aws-sdk-pandas.readthedocs.io/en/stable/

LADDER, D. (2024). Software de comparación de datos. https://dataladder.com/address-standardization-guide/

OPENREFINE. (2024). OpenRefine – A free, open source, powerful tool for working with messy data. https://openrefine.org/

SEENIVASAN MPHASIS, D., & SEENIVASAN, D. (2022). ETL vs ELT: Choosing the right approach for your data warehouse. International Journal for Research Trends and Innovation, 7(2), 2456–3315. https://doi.org/10.6084/m9.doione.IJRTI2202018

SHAH, S. I. H., PERISTERAS, V., & MAGNISALIS, I. (2021). DaLiF: A Data Lifecycle Framework for Data-Driven Governments. Journal of Big Data, 8, 89. https://doi.org/10.1186/s40537-021-00481-3

SNAPLOGIC. (2024). ETL vs. ELT: What’s the Difference? https://www.snaplogic.com/blog/etl-vs-elt-whats-the-difference

TALEND. (2024). Talend – Data Integration and Integrity Platform. https://www.talend.com/products/data-integration/

Descargas

Los datos de descarga aún no están disponibles.