Siene macrodatos, sepa qué tipo de compresión utilizar

  • Predictive Analytics

big data

Los diferentes tipos de compresión pueden tener un gran efecto en las transferencias de big data. Saber qué tipos usar es importante para su negocio.

El mundo genera 2,5 trillones de bytes de datos al día y los datos no estructurados son un problema para el 95% de las empresas. Un problema al que se enfrentan las empresas es cómo almacenar todos estos datos, además de liberar suficiente ancho de banda para transferir big data.

Aquí es donde la compresión de datos entra en la conversación. En la compresión de datos, los datos se codifican utilizando menos bits que los datos originales. Hay dos enfoques para la compresión de datos: compresión sin pérdida, que elimina la redundancia pero no pierde ninguno de los datos originales; y compresión de datos con pérdida, que modifica los datos eliminando información innecesaria o menos importante.

El uso de la compresión de datos en la transmisión y almacenamiento de macrodatos es importante porque reduce la cantidad de ancho de banda de red y almacenamiento que TI debe proporcionar para esos datos. Igual de importante, existen algunos tipos de macrodatos que realmente no desea conservar, como la fluctuación de los apretones de manos de dispositivo a dispositivo que forman parte de los datos de comunicaciones de Internet de las cosas (IoT).

Sin embargo, para maximizar sus operaciones de compresión de datos en big data, debe saber cuándo y dónde utilizar los diferentes tipos de herramientas y fórmulas de compresión de datos disponibles. Aquí hay varias pautas útiles que debe tener en cuenta al seleccionar una metodología de compresión de datos.

Cuándo usar la compresión de datos sin pérdida

Si tiene una aplicación de big data y no puede permitirse perder ningún dato, y necesita descomprimir cada byte de datos que comprime, querrá una metodología de compresión de datos sin pérdidas.

Un ejemplo de cuándo querría una compresión de datos sin pérdidas, incluso si eso significa que tiene que almacenar más datos, es cuando está comprimiendo datos que se originan en una base de datos. En el momento en que elija volver a enviar estos datos a su base de datos, deberá descomprimir los datos completos para que puedan coincidir con los datos del lado de la base de datos y almacenarse.

Cuándo usar la compresión de datos con pérdida

Hay ocasiones en las que no necesita o no desea todos los datos, como la fluctuación de la IoT y los dispositivos de red. No necesita esos datos, solo los datos que le brindan la información contextual que necesita para la empresa. Un segundo ejemplo es el uso de inteligencia artificial (IA) en fórmulas de compresión de datos que podrían usarse en la interfaz de un proceso de ingestión de datos. Si está estudiando un problema específico y solo desea datos que se relacionen directamente con ese problema, puede decidir que su fórmula de compresión de datos no incluya todos los datos que no sean relevantes para el problema.

Descubre la innovación

Para asegurar el éxito empresarial, ahora y a futuro, es imprescindible maximizar el retorno de la inversión existente en software, a la vez que innovar y adoptar nuevas tecnologías. Los retos que hay abordar para competir en un mundo de TI Híbrida incluyen DevOps, Seguridad, Gestión de riesgos y Análisis predictivo. Puedes obtener más información sobre cómo abordar estos retos e innovar en este enlace.