Conecta con nosotros
Antonio Pita Antonio Pita

Entrevistas

Antonio Pita: «Un verdadero científico de datos necesita que la inquietud y la curiosidad le guíen»

Publicado el

Antonio Pita fue reconocido recientemente como el mejor científico de datos en los Data Science Awards organizados por Synergic Partners (Grupo Telefónica). Este premio, junto a su dilatada trayectoria como especialista en el ámbito del Big Data, nos parecía lo suficientemente interesante para hablar con él. No obstante, Pita es actualmente director de Business Analytics de Liberbank y ha realizado gran cantidad de colaboraciones como experto en la materia a través de la participación en conferencias tanto a nivel nacional como internacional, así como mediante la impartición de clases en diferentes masters de varias instituciones del ámbito educativo.

MuyComputerPRO: ¿Qué es un científico de datos, según usted?

Antonio Pita: Científico de datos es un término sobre el que no hay unanimidad en el sector. A mí me gusta partir de la definición que estableció Josh Wills de Cloudera en 2012: “Un científico de datos es una persona que es mejor estadístico que un ingeniero informático y mejor ingeniero informático que un estadístico”. La idea subyacente es que es una persona que sin ser necesariamente un experto en ningún campo tiene un conocimiento multidisciplinar suficiente en estadística e informática. Yo, además incluiría las matemáticas. Pero esto no es suficiente, tiene que tener un perfil investigador para poder analizar las técnicas que utiliza con el fin de comprenderlas y seleccionar la más adecuada, tiene que tener experiencia en un campo de negocio para rentabilizar sus descubrimientos y tiene que dominar capacidades sociales como las presentaciones y las visualizaciones para poder mostrar sus resultados a todo tipo de públicos y perfiles.

MuyComputerPRO: ¿Cómo se forma un científico de datos?

Antonio Pita: Hasta hace pocos años, en nuestro país no existían títulos que preparasen a estos profesionales. Los primeros científicos de datos que vienen del mundo del tratamiento de la información, principalmente con dos perfiles: informáticos dedicados al Business Intelligence o Reporting que quieren ampliar su valor incluyendo técnicas analíticas, y matemáticos y estadísticos, expertos en Minería de Datos que están desarrollando capacidades de programación. Actualmente, se ha disparado la oferta de másters relacionados con la ciencia de los datos y el Big Data. Pero hay que dejar claro que con uno o dos años de máster no es posible desplegar todas las capacidades que necesita un científico de datos para poder desarrollar todo su potencial.

Para convertirse en un verdadero científico de datos es necesario que la inquietud y la curiosidad te guíen en la búsqueda del conocimiento. Esto puede conseguirse a través de formación, competiciones de modelado como Kaggle o meet-ups con otros científicos de datos. Un científico de datos no deja nunca de estudiar y desarrollarse, sobre todo en un entorno cambiante como el actual donde las tecnologías varían constantemente, por lo que continuamente hay que adaptar las técnicas de análisis de datos para aprovechar todo el potencial de las nuevas tecnologías con el fin de resolver los problemas de la forma más eficiente posible.

MuyComputerPRO: ¿Cree que podría tratarse de una moda pasajera, o «mutar» acorde a la rápida transformación digital a la que estamos expuestos?

Antonio Pita: La ciencia de los datos no es una moda pasajera, ha venido para quedarse, ya que cada vez tenemos más información y es necesario una combinación de tecnología y ciencia que permita extraer el valor de la misma y ayudar a la toma de decisiones. Además, la bajada de costes de la tecnología está reduciendo el coste del almacenaje y tratamiento de la información y por otro lado, los nuevos dispositivos están generando cantidades ingentes de información.

Pero no está claro el ámbito de aplicación de la ciencia de los datos, ya que tampoco está clara la frontera entre la ciencia de datos y otras disciplinas como la estadística o la informática. Esta ciencia va a tener que establecer sus postulados, su ámbito de desarrollo y sus metodologías, pero para esto todavía falta mucho tiempo. Lo que es innegable es que de alguna forma tenemos que gestionar la información para comprenderla y utilizarla en la mejora de los procesos y procedimientos empresariales.

antonio-pita-ganador-en-los-data-science-awards

MuyComputerPRO: Recibió el premio como mejor Data Scientist de España en los premios data Science Awards 2016, cuéntenos en qué se basa este reconocimiento.

Antonio Pita: Esta competición organizada por Synergic Partners del grupo Telefónica pretende impulsar la ciencia de los datos y darle mayor relevancia. En este caso se propuso el reto de desarrollar un sistema de recomendación de películas personalizado en función de los gustos y preferencias de los usuarios y las propias películas.

La dificultad radicaba en dos aspectos fundamentales, el plazo era únicamente de un mes y no se disponía de ninguna información, por lo que era necesario capturar la información de internet. Las soluciones presentadas fueron evaluadas por un jurado internacional de alto nivel formado por expertos académicos y empresariales. Es un orgullo haber sido distinguido con este premio y espero estar al nivel para poder colaborar en el desarrollo de esta ciencia.

MuyComputerPRO: ¿Están las empresas españolas muy verdes en cuanto a análisis de datos?

Antonio Pita: En España hay de todo, tenemos empresas del IBEX35 que están desarrollando plataformas informacionales en la nube, con una legión de analistas y start-ups que están exportando sus productos y servicios a otros países y recibiendo premios, mientras que otras siguen realizando sus informes en papel. En general tenemos un problema cultural dado que pensamos en el análisis de datos como una función externa al negocio focalizada en extraer datos con los que realizar informes.

Tenemos que cambiar culturalmente para comprender que, en todos los procesos que realizamos, se generan datos que pueden ayudarnos a optimizar nuestros procesos, mejorar nuestros productos y servicios, optimizar los precios… Hay empresas que ya lo han comprendido y están pivotando su organización hacia una organización orientada al dato o data-driven, donde el dato está presente en todos los ámbitos de la empresa, no como un folio con números y gráficos sino como un flujo continuo de conocimiento que detecta los problemas y evalúa las soluciones. Este cambio se está denominando Transformación Digital y la mayoría de empresas medianas y grandes están afrontándolo ya o lo tienen en un horizonte cercano.

MuyComputerPRO: ¿Cómo de importante es contar con algún científico de datos en las plantillas? ¿En qué departamento o departamentos deberían integrarse?

Antonio Pita: Voy a contar una anécdota. En el cumpleaños de una compañera de mi hija, estábamos charlando un grupo de padres y me preguntaron a qué me dedicaba, durante la conversación comenté que todas las empresas deberían tener un científico de datos. Un padre, panadero de profesión, me dijo que eso a él no le ayudaba, que él no tenía datos. Le hice ver que se equivocaba, que sí generaba muchos datos, aunque no los capturaba ni los almacenaba.

Pero, si lo hiciese, podría predecir la demanda de cada uno de sus productos para establecer la producción a realizar minimizando los productos no vendidos, optimizar las rutas de reparto para ahorrar tiempo y gasolina, analizar las elasticidades de precios para valorar las subidas y bajadas, etc. Es probable que a mi amigo no le compense contratar a un científico de datos para su panadería, pero hay alternativas para los negocios pequeños, las universidades tienen muchos alumnos que están deseando aplicar sus conocimientos en la resolución de problemas reales. El empresario obtiene conocimiento y el alumno, además de la experiencia, tiene el material necesario para escribir su trabajo fin de grado o master.

La resolución de estos o similares problemas presenta la misma dificultad independientemente del tamaño de la empresa, pero su efecto es mayor cuanto más grande es la misma, y lo mismo ocurre con la relevancia que cobra la figura del científico de datos. Una cadena de panaderías sí podría estar interesada en optimizar las rutas de reparto, una pequeña reducción en cada transporte se traduce en una gran reducción de los costes totales y, por ende, un incremento de los beneficios. Del mismo modo, una cadena de supermercados está interesada en conocer cómo colocar sus artículos en los lineales para vender más o qué productos recomendar a sus clientes para que compren más, estén más satisfechos, estén más fidelizados y vuelvan.

Sobre en qué departamento deberían estar los científicos de datos, hay dos corrientes. Algunas empresas crean un único departamento que aglutine todas las capacidades analíticas de la compañía. Este modelo tiene la ventaja de unir el conocimiento y aprovechar las economías de escala, pero suele estar alejada de las necesidades del negocio y desconoce las problemáticas concretas de los ámbitos de la compañía. Mientras que otras crean diferentes departamentos analíticos en función de las áreas que los necesiten. Con esto se consigue que los científicos de datos comprendan mejor el negocio y aporten mayor valor en sus modelos, por el contrario el conocimiento se dispersa y suele especializarse tanto en técnicas como en casos de uso perdiendo la transversalidad propia de los científicos de datos, además de ser menos eficiente al perderse las economías de escala.

Las dos opciones tienen sus pros y sus contras y la estrategia óptima dependerá de las personas de la compañía. Así, muchas empresas van cambiando de un modelo al otro y vuelven al primero tratando de buscar el adecuado o mantienen modelos mixtos con equipos en determinados departamentos clásicos como el de riesgos en el caso de entidades financieras y equipos generalistas para el resto de áreas. Es importante realizar un análisis minucioso para elegir la estrategia adecuada y tener la flexibilidad necesaria para adaptarse.

 

Periodista especializada en tecnologías corporate, encargada de las entrevistas en profundidad y los reportajes de investigación en MuyComputerPRO. En el ámbito del marketing digital, gestiono y ejecuto las campañas de leads generation y gestión de eventos.

Lo más leído