Conecta con nosotros

Noticias

IBM COVID Notebooks, solución open source para análisis de datos del coronavirus

Publicado el

IBM COVID Notebooks, solución open source para análisis de datos del coronavirus

IBM ha desarrollado una solución open source destinada a desarrolladores y científicos de datos que quieran ayudar a identificar tendencias en la pandemia del COVID-19. Conocida como COVID Notebooks, la solución está compuesta por varios cuadernos Jupyter pensados para el desarrollo y diseñados como un punto de partida para iniciar un análisis en profundidad. Por ejemplo, con uno de estos cuadernos un usuario podría analizar datos a nivel regional y comarcal en Estados Unidos para encontrar correlaciones entre niveles de pobreza y tasas de infección.

La solución, disponible en un repositorio de GitHub, se encarga de agregar y limpiar datos de COVID-19 de fuentes de prestigio, formateándolos para que se puedan analizar con herramientas como Pandas y Scikit-Learn. Los cuadernos recogen datos para, por ejemplo, contar con información en Estados Unidos a nivel de condados, de fuentes como el COVID-19 Data Repository, puesto en marcha por el Centro de Sistemas de Ciencia e Ingeniería (CSSE) de la Universidad Johns Hopkins.

Para completar su información, los cuadernos utilizan información del Coronavirus (Covid-19) Data en Estados Unidos del New York Times, así como del compendio de las informaciones diarias del Departamento de salud e higiene mental de la ciudad de Nueva York que compila el periódico The City. Para otros países, los cuadernos toman información de los datos de la distribución geográfica de los casos de COVID-19 en el mundo del Centro europeo para la prevención y control de enfermedades.

Los cuadernos descargan los conjuntos de datos de manera automática cuando cambian, lo que hacen a diario. Así que, para ayudar a los usuarios a tener su cuadernos a la última con la información más reciente, IBM ha creado también unos canales de proceso de datos. Para procesarlos, los cuadernos utilizan el editor visual de canales Elyra Notebook, así como canales KubeFlow. Con ellos, la compañía se asegura de que los investigadores tienen conjuntos de datos limpios y actualizados, y no se tienen que preocupar de estar tareas para centrarse en la investigación.

Según Frederick Reiss, Arquitecto jefe del Centro de datos y tecnologías de Inteligencia Artificial open source de IBM, tanto la compañía como su equipo «en la importancia de la democratización de la tecnología, activando a los desarrolladores con los conjuntos de datos y herramientas más actualizados, que pueden ayudar a quienes hacen las normas a tomar decisiones fundamentadas para el bienestar de los ciudadanos«.

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Lo más leído