Conecta con nosotros

Publicado el

Las compañías se enfrentan en estos momentos a cada vez más retos en sus procesos de transformación digital. Muchos de estos, están directamente relacionados con el gran volumen de datos que tienen que gestionar y que, a menudo, se encuentran almacenados en silos estancos, aplicaciones heredadas o dispersos entre las distintas cloud en las que tiene presencia la empresa.

Para facilitar las cosas a las empresas, cada vez son más las soluciones que buscan cómo proporcionarles una mayor visibilidad sobre el conjunto de datos que se despliegan a lo largo de una infraestructura TI, normalmente incluyendo herramientas de análisis que facilitan poner en marcha nuevos procesos de digitalización.

Una de las más destacadas en este terreno es HPE Ezmeral, la plataforma de software de análisis y datos híbridos de HPE. Para contarnos qué aporta a las empresas y de qué forma pueden beneficiarse de sus capacidades, hemos entrevistado a Carlos Arbesú, HPE Ezmeral Business Developer – Spain &SEU. Esto es lo que nos ha contado.

[MCPRO] ¿En qué consiste una transformación digital basada en datos?

[Carlos Arbesú] La transformación digital, entendida como estrategia empresarial que utiliza la tecnología para conseguir una ventaja competitiva en el mercado, no es algo nuevo. Las empresas llevan ya décadas usando la tecnología para crear ese valor diferencial que les permita triunfar. Pero si observamos con atención las razones del éxito más recientes, está claro que están orientadas los datos, la información y el conocimiento que se pueden extraer de ellos utilizando una nueva generación de herramientas de análisis de datos y de inteligencia artificial.

La digitalización hoy en día se basa fundamentalmente en poder acceder y analizar con estas herramientas el volumen de datos que existen en las organizaciones. El éxito de esta nueva ola de transformación digital, se mide por cómo ese análisis de los datos por medio de algoritmos de aprendizaje automático, nos permiten conocer a los clientes mejor, lo nos permite adaptar rápidamente nuestro negocio a lo que demandan.

El éxito se mide pues, por cómo analizamos unos datos que nos permiten optimizar nuestros procesos internos adaptándonos a las estrategias que queremos adoptar y liberando recursos de tareas repetitivas o de poco valor, para dedicarlos a estos proyectos de transformación.

[MCPRO] ¿Qué herramientas son las que están facilitando esa transformación digital basada en datos?

[Carlos Arbesú] Las empresas están buscando cómo desplegar con rapidez nuevas herramientas de análisis y para ello están abandonando los modelos de trabajo existentes y se están moviendo al paradigma de contenedores. Es una tendencia que parece imparable y datos de Gartner predicen que para finales del 2022, el 75% de las organizaciones tendrán aplicaciones corriendo en contenedores.

Puede parecer que la idea de contenedores está asociada al movimiento de cargas de trabajo a la nube, pero realmente es cada vez más una opción para gestionar cargas de trabajo en local. Los contenedores no son más que una forma de gestionar infraestructura. Simplifican la posibilidad de ejecutar código y ayudan a encapsular la aplicación con todas sus dependencias.

Son similares a las máquinas virtuales, pero son más fáciles de crear, más fáciles de usar y sin coste de licencias. Son también más ligeros, lo que permite que una máquina ejecute más carga corriéndola en contenedores que en máquinas virtuales. La proliferación de contenedores ha hecho necesario disponer de herramientas de coordinación y ahí Kubernetes se ha convertido en el estándar de la industria.

[MCPRO] ¿Cuáles son los principales desafíos a los que se enfrentan las empresas que quieren poner en marcha este tipo de procesos de transformación digital?

[Carlos Arbesú] Realizar estas dos acciones para la transformación digital, acceder a los datos y desplegar contenedores, tiene sus su propio conjunto de desafíos. Extraer la información empresarial es el Santo Grial que todos buscan, pero los datos a menudo se encuentran en silos separados, en aplicaciones legacy, protocolos distintos hojas de cálculo dispersas…

El acceso a todos estos datos es un ejercicio de democratización en el que también hay que evitar también lo que se denomina la fuerza de gravedad de los datos que hacía que, hasta ahora, los datos solo estaban disponibles para las aplicaciones que los creaban con las aplicaciones que estaban cerca.

Para afrontar este reto, las empresas deben modificar la forma en que despliegan y gestionan su operativa, deben enfrentarse a tener que manejar diversos clústeres distribuidos en cualquier lugar en la nube. Deben evitar inconsistencias y también en ocasiones, tienen que ser capaces de adaptar esos clústeres al tipo de aplicaciones que están corriendo.

[MCPRO] ¿Qué es HPE Ezmeral y cómo da respuesta a estos desafíos?

[Carlos Arbesú] HPE Ezmeral es la propuesta de HPE para apoyar a las empresas en la transformación digital actual, ayudándolas a liberar el potencial de sus datos e innovar más rápidamente con más opciones, más eficiencia y con más flexibilidad que en otras ofertas alternativas que están disponibles en proveedores en la nube.

HPE Ezmeral es también la primera plataforma optimizada para entornos híbridos, donde cada nodo se puede instalar indistintamente en un equipo físico, en una máquina virtual, en un una infraestructura disponible en el edge, en el data center o en la nube, y en la que todos estos nodos se pueden combinar para crear los clúster que constituyen la plataforma.

HPE Ezmeral está constituido por tres bloques. El primero es el el producto HPE Data Fabric, que es nuestra plataforma de almacenamiento. Está optimizada para las necesidades de estas nuevas aplicaciones de analítica de grandes volúmenes de datos e inteligencia artificial, y nos va a permitir unificar el acceso a los datos donde quiera que esto se encuentre.

El segundo componente es HPE Ezmeral Runtime. Esnuestra plataforma para modernizar y desarrollar estas aplicaciones en entornos de contenedores. Y finalmente tenemos el HPE Ezmeral ML Ops, que es nuestra propuesta para automatizar el ciclo de vida de los proyectos de aprendizaje autónomo.

Suministra un entorno consistente y colaborativo para que los grupos de analítica de ingenieros y científicos de datos puedan desarrollar aplicaciones y algoritmos con nuestras nuevas herramientas en un entorno de contenedores. Permite también un acceso flexible a los datos y gestiona el desarrollo de estas aplicaciones mediante las mejores prácticas.

Todos los componentes de HPE Ezmeral están disponibles como un modelo de licenciamiento de software para que nuestro canal, nuestros colaboradores y los integradores creen sus propios proyectos de transformación digital. Además HPE Ezmeral también está disponible en un modelo de pago por uso dentro del programa HPE GreenLake.

[MCPRO] ¿Qué ventajas ofrece a la hora de visualizar y acceder a los datos una solución como HPE Ezmeral Data Fabric?

[Carlos Arbesú] Tenemos que destacar sobre todo cuatro aspectos. El primero es que ofrece unas una escalabilidad casi sin límites. Un clúster de HPE Ezmeral Data Fabric puede empezar con solo 3 nodos instalados. A partir de aquí, tiene una capacidad casi infinita para crecer, llegando a gestionar miles miles de nodos y cientos de Petabytes distribuidos geográficamente entre miles de máquinas. Además tiene la capacidad de poder desplegarse en cualquier infraestructura, extendiéndose por entornos mixtos, simultáneamente tanto en máquinas están en local, en la periferia o en la nube pública.

Una segunda característica es que todos los datos estaban disponibles para los usuarios y las aplicaciones mediante un direccionamiento único global, sin preocuparse por saber dónde se encuentran físicamente estos datos. Esto permite también unificar las políticas de acceso, la seguridad y la administración. HPE Ezmeral Data Fabric también la capacidad para soportar soluciones multiusuario: la infraestructura se comparte por distintos grupos o departamentos sin interferirse entre sí, con segmentación total de los datos de cada grupo y pudiendo definir cada grupo sus propias políticas de acceso y seguridad.

En tercer lugar, los datos están disponibles a través de distintos protocolos y APIS simultáneamente, sin necesidad de crear copias o de montar clusters con protocolos de acceso distintos. Dispone además como característica única, un tipo de conexión de alta velocidad para contenedores que nos facilita mover a contenedores tanto las aplicaciones persistentes legacy como estas aplicaciones de inteligencia artificial que son tan sensibles al acceso a grandes volúmenes de datos.

Finalmente, HPE Ezmeral Data Fabric mantiene internamente información de la topología y del almacenamiento desplegado, conociendo dónde están situados geográficamente los nodos y los rack. Esto permite que los volúmenes se creen en el lugar apropiado y también permite definir estrategias de redundancia relacionadas con el uso frecuente de esos datos. El departamento de IT puede así determinar qué políticas son más efectivas en cuanto al coste de la infraestructura y de los datos que se utilizan, balanceando el coste, con la velocidad de acceso a los mismos.

[MCPRO] HPE Ezmeral Runtime es la propuesta de HPE para el despliegue y orquestación de contenedores. ¿En qué se diferencia de otras soluciones de Kubernetes y para qué tipo de empresas es la más indicada?

[Carlos Arbesú] HPE Ezmeral Runtime es una plataforma de orquestación de contenedores basada en código abierto y orientada a las necesidades de los entornos empresariales. Utiliza una versión de Kubernetes certificada como 100% Open Source, sin extensiones propietarias que comprometan las opciones de los clientes en el futuro.

Una aplicación desarrollada en HPE Ezmeral Runtime se ejecutará sin cambios en cualquier otro entorno Kubernetes del mercado, algo que no siempre ocurre a la inversa. Como está orientado a entornos empresariales, permite reducir riesgos y aumentar la seguridad, ya que incluye una capa de gestión y de control. Además tiene la posibilidad de definir políticas de acceso o niveles de confianza y privilegios tanto a nivel usuario, como a nivel grupo, como a nivel espacio de datos.

Es una solución agnóstica con respecto al hardware y se puede desplegar en cualquier máquina, bien sea máquina física, máquina virtual, entorno edge o cloud local. El resultado final es que las organizaciones pueden extender la eficiencia y la agilidad de su modelo de contenedores a más tipos de aplicaciones, optimizando la infraestructura.

Y en este a más tipo de aplicaciones, entramos en el terreno de la inteligencia artificial y el análisis de grandes volúmenes de datos. Esta solución incluye por defecto HPE Data Fabric como capa de almacenamiento, lo que facilita el poder utilizar esta plataforma en este tipo de aplicaciones que habíamos mencionado.

Entre las empresas están más indicada para esta solución se encuentran en primer lugar, todas las que quieran desplegar entornos de inteligencia artificial y de machine learning. También las que quieran realizar data analytics en contenedores, las que necesiten manejar entornos híbridos en los que desplegar clústeres, tanto en un entorno local como en la nube; o a empresas que quieran modernizar sus aplicaciones, moviéndolas desde las máquinas virtuales a un entorno de contenedores… incluso aquellas que tengan aplicaciones legacy que quieran migrar a este nuevo entorno.

Al ser una plataforma Kubernetes 100% Open Source también es válida para entornos de desarrollo basados en metodología continuous integration and continuous delivery, siendo útil también para clientes que quieren hacer esto sin estar atados a extensiones propietarias de otros fabricantes que puedan comprometer sus opciones en el futuro.

[MCPRO] ¿De qué forma facilita HPE Ezmeral ML Ops el desarrollo de aplicaciones o el entrenamiento de modelos de aprendizaje automático?

[Carlos Arbesú] HPE Ezmeral ML Ops facilita la gestión de todas las fases del ciclo de vida de los modelos de aprendizaje autónomo, tanto en la fase de construcción, como entrenamiento, despliegue y monitorización.

Pone el potencial de los contenedores al servicio de la creación de clústeres de cómputo, seguros y escalables que permitan acceder a grandes volúmenes de datos para para estos entornos. También facilita la colaboración entre equipos de científicos de datos, la estandarización de procesos y monitoriza el comportamiento de modelos ya desplegados en producción que los usuarios pueden lanzar, sin necesidad de intervención del Departamento de IT.

HPE Ezmeral ML Ops incluye además utilidades que permiten a los científicos de datos incorporar también sus propias herramientas y librerías, además de las principales aplicaciones de terceros. Los responsables de los proyectos también pueden configurar las fuentes de datos compartidas por adelantado y permite a todos los usuarios acceder a ellas con controles de acceso corporativo. Esto nos evita la duplicidad de los datos y mejora la seguridad de acceso a los mismos. Los usuarios pueden además en este en esta fase de construcción, explorar los datos hacia sus análisis iniciales, ver qué tipo de información tienen que manejar, y aclerar el tiempo que van a emplear en esta fase en la que están construyendo del modelo de entrenamiento.

También hay que tener en cuenta que la mayoría de los proyectos de aprendizaje autónomo necesitan poder acceder a entornos intensivos en cómputo, utilizando para ello aplicaciones como TensorFlow. Para ello es necesario contar con un una infraestructura específica, como puede ser el uso de GPUs de cómputo intensivo. Esto puede suponer un reto para los departamentos de IT que deben proveer estas soluciones y estos productos.

HPE Ezmeral ML Ops incluye por defecto imágenes preconfiguradas de estos productos y están disponibles para ser desplegadas en un solo clic, incluyendo su integración en las políticas de seguridad y de acceso a datos corporativos. Estos clústeres desplegados para entrenamiento tienen la capacidad de auto dimensionarse según las necesidades de la empresa y en base a políticas acordadas y definidas por medio de simples ficheros de texto.

HPE Ezmeral también facilita la colaboración con los científicos de datos porque permite la definición de un repositorio de información para cada proyecto y permite también mecanismos de control de versiones y un repositorio de los modelos finales con vista a estandarizar el ciclo de vida de la generación de estos modelos. El control de versiones es un componente crítico para permitir el uso de mejores prácticas en desarrollo de aplicaciones, y en este caso, la solución también es compatible con GitHub.

El repositorio de proyectos permite almacenar múltiples versiones de código fuente de datos (parámetros de entrenamiento, modelos generados…) permitiendo a los científicos acceder a toda la información disponible de cada proyecto. HPE Ezmeral suministra también un repositorio de los modelos finales, con sus metadatos asociados. Cuando un modelo está listo para ser desplegado, los usuarios solo necesitan hacer clic en ese repositorio de modelos, lo que les permite también acelerar en esa fase de despliegue y ejecución de su proyecto.

Finalmente, en fase de monitorización, HPE Ezmeral ML Ops suministra visibilidad del uso de los recursos de la infraestructura, tanto por parte de los clústeres de entrenamiento como por parte de los clúster de despliegue, los costes de producción de la información como uso de de GPU, memoria, número de peticiones que recibió el modelo, etcétera. Además, permite su integración con productos de terceros para hacer análisis predictivos.

Periodista tecnológico con más de una década de experiencia en el sector. Editor de MuyComputerPro y coordinador de MuySeguridad, la publicación de seguridad informática de referencia.

Lo más leído