La taxonomía de DataOps

  • Gestión de información

No puede tener operaciones de datos sin datos, por lo que la recopilación de datos es una parte fundamental de DataOps. La recopilación de datos se refiere, por supuesto, a todos los procesos mediante los cuales acumula datos y los almacena en algún lugar, durante un período de tiempo.

Es importante tener en cuenta que la recopilación de datos puede ser tanto pasiva como activa. Gran parte de los datos que las organizaciones almacenan y analizan en estos días no son datos que alguien sale y recopila a mano. Es la información producida a través de las operaciones cotidianas de estas organizaciones: su extracción de datos, por así decirlo.

El almacenamiento de datos puede parecer simple y directo pero es mucho más complejo que eso, por lo que el almacenamiento de datos es una disciplina distinta dentro de DataOps.

El almacenamiento de datos efectivo requiere encontrar el tipo correcto de infraestructura de almacenamiento, el que proporcionará el mejor equilibrio entre el rendimiento, la disponibilidad y el costo de los datos. También implica definir políticas de retención de datos para determinar cuánto tiempo se almacenarán los datos. También abarca las copias de seguridad de los datos, que son importantes para garantizar que los datos que pretende conservar en el almacenamiento realmente estarán disponibles si ocurre algo inesperado.

La administración de datos es una disciplina amplia que involucra todas las tareas necesarias para mantener los datos disponibles y accesibles una vez que se hayan recopilado y almacenado. Implica trabajos como la transformación de datos de un formato a otro para hacerlos compatibles con un conjunto dado de herramientas. También implica tareas como mover datos entre ubicaciones de almacenamiento e identificar y resolver cuellos de botella dentro de la tubería general de DataOps que están ralentizando el rendimiento.

En el mundo de TI, la palabra "monitoreo" generalmente se refiere al monitoreo de aplicaciones o infraestructura para detectar problemas. Pero también debe supervisar sus datos si desea realizar DataOps de manera efectiva.

El monitoreo de datos incluye tareas como la identificación de problemas de calidad de los datos (como la falta de datos o problemas de formato de datos) que harán que sus datos sean menos confiables o más difíciles de manejar. También significa verificar si hay signos de fallas, como una falla en la base de datos o la infraestructura, que podrían causar una ruptura en su tubería general de DataOps.

Todos (o el jefe de todos, al menos) quieren "convertir los datos en dólares", como lo expresó Gartner. El análisis de datos, o el proceso de búsqueda de información dentro de conjuntos de datos, es clave para que eso suceda.

El análisis sofisticado de datos es la única disciplina en esta lista que generalmente realizan solo los científicos de datos, no el resto del equipo de TI, aunque esto está cambiando algo a medida que más y más herramientas de visualización y análisis de datos simplificados ingresan al mercado, lo que facilita su dar sentido a grandes conjuntos de datos sin tener un Ph.D. En estadística o saber programar en R.

La seguridad de los datos es un tema importante, especialmente en la era actual de las violaciones de seguridad de datos de alto perfil. Mantener la seguridad de los datos requiere una variedad de procesos y herramientas, desde establecer las políticas de control de acceso correctas para los datos hasta monitorear las señales de acceso no autorizado y escanear datos para eliminar el malware u otras amenazas que puedan existir dentro de los conjuntos de datos.

Descubre la innovación

Para asegurar el éxito empresarial, ahora y a futuro, es imprescindible maximizar el retorno de la inversión existente en software, a la vez que innovar y adoptar nuevas tecnologías. Los retos que hay abordar para competir en un mundo de TI Híbrida incluyen DevOps, Seguridad, Gestión de riesgos y Análisis predictivo. Puedes obtener más información sobre cómo abordar estos retos e innovar en este enlace.