Por qué algunos proyectos de ciencia de datos fallan

  • Gestión de información

Miles de empresas de todo el mundo compiten por un número limitado de científicos de datos, pagándoles grandes cantidades de dinero para unirse a sus organizaciones y preparándolos para el fracaso.

Para la mayoría de las organizaciones, la ciencia de datos no es el todo y el final. No puede ser la respuesta si el liderazgo de la compañía no ha formulado la estrategia o las preguntas que la ciencia de datos necesita para responder o allanar el camino hacia la producción.

Incluso las organizaciones que ya invirtieron millones en la integración de su infraestructura completa de datos corporativos para crear el repositorio de datos definitivo (lagos de datos, grupos de datos, fuentes de datos comunes o cualquier definición agradable que su organización haya elegido) para su integración y análisis no podrán ver resultados a la velocidad y precisión que demandan una vez que el sistema está en producción.

Al igual que con la adopción e implementación a largo plazo de cualquier proceso o procedimiento de negocios, sacar el máximo provecho de la ciencia de los datos lleva tiempo.

En la mayoría de las empresas, la ciencia de datos falla por razones muy específicas:

1. Objetivos / procesos comerciales indefinidos. El hecho de que su equipo de ciencia de datos pueda mapear y predecir las tasas de satisfacción del cliente durante los próximos seis meses no significa que la información sea significativa. Si los resultados demuestran la insatisfacción de los clientes a gran escala, simplemente predecir los resultados es lamentablemente inadecuado sin resolver las raíces de esa insatisfacción. Puede predecir una cantidad incalculable de puntos de datos, pero sin metas claramente definidas y con la voluntad de solucionar sus problemas, esos puntos de datos no tienen sentido. Muchas organizaciones siguen el concepto erróneo de que los científicos de datos (sin importar qué tan inteligentes sean) pueden definir correctamente los objetivos comerciales. La mayoría de las veces no pueden, porque no es su trabajo.

2. Incapacidad para construir y aplicar un conjunto uniforme de datos en toda la organización. Si bien la política de su organización puede haber inspirado a los silos y feudos, cada departamento de su organización finalmente se dirige hacia la misma meta, lo que aumenta el ROI. Para maximizar el valor de la ciencia de datos, debe crear un conjunto de datos uniforme que genere resultados procesables que cada parte de la organización pueda implementar.

3. Inversión en algoritmos "sexys" en lugar de algoritmos útiles. Acaba de contratar al científico de datos que se graduó en la parte superior de su clase. Acaba de unirse a su empresa y está muy emocionado de comenzar. Debido a su profundo conocimiento matemático y académico, tiene algunos algoritmos geniales que pueden obtener resultados realmente geniales. Sin embargo, ¿esos algoritmos ofrecerán los resultados que pueden enfocar su organización e impulsarla hacia adelante? El hecho de que algo sea viejo, cansado, probado y verdadero no significa que no funcionará.

Su equipo necesita examinar la gama completa de algoritmos que está utilizando para su modelado y preprocesamiento con un ojo objetivo. ¿La información que esos algoritmos están entregando realmente útil? ¿Ofrecen la inteligencia procesable que aumentará el ROI? A menudo no.

En la mayoría de los casos, el desafío al que se enfrenta no es nuevo. Una simple búsqueda en Google lo llevará a grandes investigaciones y estudios de casos para ver cómo otros abordaron el desafío y cómo se adaptaron a la solución. Estar abierto. Comience a pensar desde la perspectiva del problema y no solo desde la perspectiva de la solución.

4. Datos o infraestructura inapropiados. La mayoría de las organizaciones están construidas en silos. Las grandes organizaciones tienen un sistema ERP y un sistema CRM y muchos otros, pero esos sistemas pueden no estar sincronizados. Es posible que ni siquiera estén tocando el software de marketing y ventas de entrada. Hasta que todos en la organización puedan trabajar con los mismos datos y analizar los mismos datos, los resultados de la ciencia de datos en silos no son tan aplicables o efectivos. En ocasiones, lleva mucho más tiempo determinar si los datos específicos o el volumen de datos son suficientes para la tarea específica.

5. Fracaso para diferenciar entre academia o investigación y el mundo real. Los científicos de datos generalmente van desde la torre de marfil directamente a los silos de datos. En general, ofrecen excelentes resultados en la mayoría de los desafíos definidos. Recuerde, sin embargo, que al final del trabajo del científico de datos, el trabajo duro puede estar comenzando. Los ingenieros deben implementarlo en producción, muchas veces desde cero. No espere que su equipo de ciencia de datos aprenda cómo funcionan realmente las empresas. Depende de los ingenieros y analistas de sistemas determinar los requisitos específicos de su sistema para que su trabajo entre en producción.

El resultado más crítico de cualquier actividad de ciencia de datos es la relevancia. Cada "respuesta" generada por su equipo de ciencia de datos debe responder preguntas específicas derivadas de la estrategia corporativa general. Si bien la inversión en las "campanas y silbidos" de la IA es divertida y emocionante, las organizaciones deben asegurarse de tener una estrategia definida, la idea correcta y una hoja de ruta correctamente mapeada antes de gastar el primer dólar de inversión en ciencia de datos.

 

Descubre la innovación

Para asegurar el éxito empresarial, ahora y a futuro, es imprescindible maximizar el retorno de la inversión existente en software, a la vez que innovar y adoptar nuevas tecnologías. Los retos que hay abordar para competir en un mundo de TI Híbrida incluyen DevOps, Seguridad, Gestión de riesgos y Análisis predictivo. Puedes obtener más información sobre cómo abordar estos retos e innovar en este enlace.