Por qué las organizaciones necesitan limpiar sus datos sucios

  • Gestión de información

Los datos sucios, también conocidos como datos no autorizados, son datos inexactos, incompletos o inconsistentes, especialmente en un sistema informático o base de datos.

En un artículo del MIT en 2017, J. Schneider y J. Kitsuse definieron los datos sucios de la siguiente manera: “Los datos ocultos y sucios son información que se mantiene en secreto y cuya revelación sería desacreditante o costosa en términos de varios tipos de sanciones. Los datos pueden estar sucios de diferentes maneras. Pero en todos los casos, es contrario a los estándares e imágenes ampliamente compartidos de lo que una persona o grupo debería ser".

Los datos sucios pueden contener errores tales como errores ortográficos o de puntuación, datos incorrectos asociados con un campo, datos incompletos u obsoletos, o incluso datos que se han duplicado en la base de datos. Se pueden limpiar mediante un proceso conocido como limpieza de datos. Este ha sido un problema continuo para las empresas, particularmente con nuevas regulaciones como GDPR y la próxima Ley de Privacidad del Consumidor de California (CCPA), que amenazan con sanciones estrictas si los datos privados y personales utilizados por las organizaciones se hacen públicos.

Según Gartner, la gestión de datos aumentada se convertirá en una característica del panorama tecnológico de muchas organizaciones y les permitirá mejorar la capacidad de las organizaciones para analizar los datos que ingresan de manera más dinámica y con mayores niveles de automatización más cerca del tiempo real. Al hacerlo, también podrá ayudar a limpiar esos datos. Sin embargo, sigue siendo un problema.

Parece poco discutible el hecho de que los datos más limpios son mejores datos. El problema es que nadie parece estar de acuerdo cuando los datos están lo suficientemente limpios. En estos días, no es inusual que las empresas pasen seis meses o incluso un año en proyectos de limpieza de datos. A menudo realizan estas tareas sin tener idea de cuánto van a obtener de todo ese esfuerzo.

Descubre la innovación

Para asegurar el éxito empresarial, ahora y a futuro, es imprescindible maximizar el retorno de la inversión existente en software, a la vez que innovar y adoptar nuevas tecnologías. Los retos que hay abordar para competir en un mundo de TI Híbrida incluyen DevOps, Seguridad, Gestión de riesgos y Análisis predictivo. Puedes obtener más información sobre cómo abordar estos retos e innovar en este enlace.