Los 4 desafíos a los que se enfrenta la ciencia de datos en 2020

  • Gestión de información

Según un informe, encontrar valor en los datos, integrar software de código abierto, un pequeño grupo de talentos y cuestiones éticas son áreas problemáticas.

Un informe sobre el estado de la ciencia de datos concluye que hay 4 grandes desafíos.

1. Obtener valor de la ciencia de datos

Este problema se debe principalmente a obstáculos de producción como la gestión de dependencias y entornos, la falta de habilidades organizativas necesarias para implementar modelos de producción y problemas de seguridad.

Combinados, estos tres problemas llevan al 52% de los profesionales de la ciencia de datos a decir que tienen problemas para demostrar el impacto que la ciencia de datos tiene en los resultados comerciales. Esto varía de un sector a otro, ya que los profesionales de datos de atención médica tienen la mayor cantidad de problemas para probar los beneficios, donde el 66% dijo que a veces o nunca pueden hacerlo, a la consultoría, donde solo el 29% dijo lo mismo.

2. Dificultad para integrar herramientas de ciencia de datos de código abierto

Según el informe, el lenguaje de programación de código abierto Python domina entre los científicos de datos, y el 75% dice que lo usan con frecuencia o siempre en sus trabajos.

A pesar de la popularidad del software de código abierto en el mundo de la ciencia de datos, el 30% de los encuestados dijeron que no están haciendo nada para asegurar su canalización de código abierto. Los encuestados prefieren el software de análisis de código abierto porque lo ven como innovador más rápido y más adecuado a sus necesidades, pero concluyó que los problemas de seguridad pueden indicar que las organizaciones tardan en adoptar herramientas de código abierto.

3. Problemas para encontrar y mantener científicos de datos calificados

El informe encontró que lo que los estudiantes están aprendiendo y lo que enseñan las universidades no es necesariamente lo que las empresas necesitan de los nuevos científicos de datos. Las dos brechas de habilidades citadas con mayor frecuencia por las empresas (gestión de big data y habilidades de ingeniería) ni siquiera se ubicaron entre las 10 mejores habilidades que las universidades ofrecen a sus estudiantes de ciencias de datos.

Otra capa de problemas viene en la retención de talento, que según el informe está estrechamente relacionada con la frecuencia con que los profesionales de la ciencia de datos pueden demostrar el valor de su trabajo. Sin embargo, en general, el 44% de los científicos de datos dijeron que planean buscar un trabajo diferente dentro del próximo año.

4. Eliminar sesgos y explicar el aprendizaje automático

A pesar de la importancia de abordar el sesgo inherente a los modelos de aprendizaje automático y la ciencia de datos, hacerlo no está sucediendo: solo el 15% de los encuestados dijo que había implementado una solución de mitigación de sesgos, y solo el 19% lo había hecho por razones de explicación.

El 39% de las empresas encuestadas dijeron que no tenían planes para abordar el sesgo en la ciencia de datos y el aprendizaje automático, y el 27% dijeron que no tenían planes para hacer que el proceso sea más explicable.

Descubre la innovación

Para asegurar el éxito empresarial, ahora y a futuro, es imprescindible maximizar el retorno de la inversión existente en software, a la vez que innovar y adoptar nuevas tecnologías. Los retos que hay abordar para competir en un mundo de TI Híbrida incluyen DevOps, Seguridad, Gestión de riesgos y Análisis predictivo. Puedes obtener más información sobre cómo abordar estos retos e innovar en este enlace.