Discutiendo sobre BigData: La gestión del ciclo de vida de los datos

Últimamente, vayamos donde vayamos, en cuestiones relacionadas con las empresas y las TI, se oye un continuo rumor que habla de BigData: vallas publicitarias, anuncios, conferencias, en nuestra bandeja de entrada, en el timeline de nuestras redes sociales. La variedad, el volumen y la velocidad del flujo de datos a través de sistemas de la empresa están en constante aumento, al igual que el número de discusiones sobre la mejor manera para dar respuestas a los “problemas” que provoca esta nueva situación. Sin embargo, aunque el objeto del  fenómeno BigData es dar a las empresas una amplia gama de nuevas oportunidades a través del análisis de datos, también grava el negocio con los retos asociados a la recolección, manejo, organización y protección de datos.

Para aprovechar con éxito el análisis de grandes volúmenes de datos, las empresas deben desarrollar estrategias para reducir el coste de la gestión de los datos y minimizar los riesgos para su organización, por una mala protección de los datos.

Además de los retos inherentes al propio negocio, las empresas se enfrentan a dificultades técnicas en la gestión de la información ante la rápida expansión, tanto en volumen como en procedencia y tipología, que están teniendo su data. El gran número de fuentes de datos que proliferan continuamente introduce complejidad en los procesos de gestión del ciclo de vida de datos, ya que los Data Scientist deben manejar los datos de manera adecuada, desde el momento de su creación hasta el punto en que puede ser archivada, corren el riesgo de violar los requisitos legales y regulatorios.

Para gestionar eficazmente los datos durante todo su ciclo de vida, los Data Scientist deben tener como objetivos en mente:

  • La veracidad de los datos (fiabilidad) es fundamental tanto para su análisis como para el cumplimiento normativo.
  • No se debe hacer distinciones en la data a la hora de ser tratada. Tanto los datos estructurados y no estructurados deben ser tratados eficazmente.
  • Tanto la privacidad de los datos, como su integridad y su seguridad deben ser cuestiones prioritarias en todo momento.
  • Que los resultados sean aptos para aplicar en los procesos de negocio de su organización y para realimentar la data en los futuros análisis.

¿Hay alguna cuestión más que no deban olvidar las organizaciones a la hora de gestionar el ciclo de vida de sus datos?

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s