Conecta con nosotros

A Fondo

Data Fabric: casi todo lo que tienes que saber

Publicado el

Integrar y centralizar toda la información de la empresa, de modo que las compañías puedan establecer un marco de gobernanza que les permita tomar decisiones informadas. Este es, a grandes rasgos, lo que en el mundo de las TIC se conoce como Data Fabric; un enfoque de gestión de datos del que aunque se comienza a hablar hace casi diez años, es ahora cuando comienza a coger tracción en muchas empresas.

Se considera que fue NetApp la compañía que, en 2016, ya expresaba en un whitepaper la necesidad de gestionar de forma unificada los datos en entornos de nube híbridos y tres años más tarde (2019), consultoras como Gartner o Forrester y distintos analistas, consolidan el concepto «Data Fabric» como un enfoque innovador y al que hay que prestar importancia.

¿Pero en qué consiste exactamente? Más que una tecnología o una solución concreta, Data Fabric es una arquitectura, un conjunto de principios y prácticas que surgen como respuesta a esas necesidades. Simplificando mucho, un enfoque Data Fabric tiene en cuenta los siguientes principios:

  • Orientación a los datos: El foco central de Data Fabric son los datos en sí mismos. Se trata de crear un ecosistema donde la información sea accesible, comprensible y usable para todos los usuarios.
  • Integración y centralización: Data Fabric busca integrar datos de diferentes fuentes, tanto internas como externas, en un único repositorio centralizado.
  • Gobernanza y seguridad: La seguridad y la privacidad de los datos son fundamentales en Data Fabric. Se deben establecer políticas y reglas para el acceso, uso y calidad de la información, protegiendo los datos confidenciales.
  • Escalabilidad y flexibilidad: Data Fabric debe ser capaz de adaptarse a las necesidades cambiantes de la empresa y escalar en función del volumen de datos.
  • Metadatos: Los metadatos son esenciales para comprender el significado y la contextualización de los datos, que se deben gestionar de forma eficiente.
  • Cultura: Es fundamental crear una cultura de datos dentro de la empresa donde se valore la importancia de la información y se fomente su uso responsable.

Cuando se estos principios se integran dentro de las organizaciones, las compañías pueden disfrutar de ventajas como más eficiencia y productividad ya que se reduce el tiempo dedicado a a búsqueda de información y gestión de los datos; es posible tomar decisiones más informadas e inteligentes, ya que se tiene una visión completa de la información y por lo tanto, aumenta la competitividad.

Componentes clave de Data Fabric

En una estrategia de Data Fabric encontramos distintos componentes clave, que habitualmente se dividen en «capas» en función de cómo «trabajan» con la información de la organización. En este sentido, encontramos:

  • Capa de acceso: facilita el acceso a los datos de forma segura y gobernada, independientemente de su ubicación o formato.
  • Capa de integración: integra datos de diferentes fuentes, tanto internas como externas, en un único repositorio.
  • Capa de procesamiento: aplica técnicas de análisis de datos para obtener información valiosa y conocimiento.
  • Capa de almacenamiento: almacena los datos de forma segura y escalable.
  • Capa de gobierno: define las políticas y reglas para el acceso, uso y calidad de los datos.

Teniendo esto en cuenta, las compañías que quieren integrar este enfoque, necesitan en primer lugar, realizar un análisis en profundidad de la situación actual de los datos en la empresa, incluyendo su ubicación, formato, calidad y accesibilidad, para después establecer una estrategia clara que defina los objetivos de la compañía en materia de gestión de datos.

A partir de aquí, se deben seleccionar las tecnologías adecuadas para cada una de las fases de este proceso. Aquí encontramos desde Herramientas ETL (Extract, Transform, Load) que permiten extraer datos de diferentes fuentes y transformarlos para que sean compatibles con el repositorio central, a tecnologías de almacenamiento de datos como pueden ser los Data Lakes, de análisis como puede ser el caso de las soluciones de BI o más recientemente de IA y otras tecnologías asociadas como puede ser el mismo cloud. A estos hay que sumar soluciones específicas que mejoran la gobernanza y la seguridad de los datos.

Además de poder integrar distintas soluciones, también existen propuestas integrales que prometen a las compañías simplificar este proceso. Hablaríamos aquí de propuestas como IBM Cloud Pak for Data, SAP Data Fabric, o Google Cloud Dataproc. Muy interesante por su carácter vertical es por otro lado HPE Ezmeral Data Fabric, ya que se posiciona como una solución integral diseñada para entornos multi-nube e híbridos.

Algunas de las características que la convierten en una solución tan interesante es su ecosistema open source, el hecho de que además se integrarse con las soluciones de HPE también abrace tecnologías de nube de otros proveedores importantes como AWS, Azure o Google Cloud, o su enfoque AI/ML. En este sentido, merece destacar que HPE pone especial atención en optimizar Data Fabric para el entrenamiento de modelos de aprendizaje automático (Machine Learning) e inteligencia artificial (IA) a gran escala. ¿Quieres saber más? En nuestro whitepaper «Cómo escoger el mejor servidor para hacer crecer tu negocio» exploramos los criterios esenciales que debemos considerar a la hora de escoger el mejor servidor con el que gestionar tus datos. ¡No te lo pierdas!

Periodista tecnológico con más de una década de experiencia en el sector. Editor de MuyComputerPro y coordinador de MuySeguridad, la publicación de seguridad informática de referencia.

Lo más leído