Conecta con nosotros

Noticias

El Instituto Nacional de Cáncer de USA elige la plataforma de Denodo para la virtualización de datos

Publicado el

nationalcancerinstitute02

Denodo acaba de anunciar que el Instituto Nacional el Cáncer, (NCI) de Estados Unidos, integrado dentro de los Institutos Nacionales de la Salud (NIH) y del Departamento de Salud y Servicios Humanos de los Estados Unidos, ha elegido la plataforma de virtualización de datos de Denodo para transferir grandes conjuntos de datos garantizando al mismo tiempo eficiencia y exactitud.

El Instituto Nacional del Cáncer (NCI) y el Instituto de Investigación Nacional del Genoma Humano (NHGRI), se han unido recientemente en la ejecución del proyecto conocido como “El Atlas del Genoma del Cáncer” (TCGA). Su misión es catalogar las mutaciones genéticas responsables del cáncer mediante la secuenciación del genoma y la bioinformática, haciendo estos datos genómicos disponibles para una comunidad de investigación más amplia.

El NIH utiliza la plataforma de virtualización de datos de Denodo para conectarse a las distintas fuentes de los datos del genoma, aplicar transformaciones, producir los conjuntos de datos finales y subir periódicamente estos conjuntos de datos en los servidores ICGC.

Necesidades del NIH

En su trabajo diario el NIH se enfrentaba a importantes obstáculos a la hora de mover de forma eficiente y segura grandes volúmenes datos del genoma del cáncer de TCGA y al resto de las organizaciones involucradas en este proyecto. Al llevar a cabo este trabajo el NIH se encontró con que la información no era escalable, no permitía incluir todos los datos del genoma del TCGA, que formaban parte de cientos de millones de filas de datos a través de más de 25 variaciones de cáncer.

La solución. Plataforma de Virtualización

El NIH decidió entonces que la virtualización de datos sería el método preferido para transferir datos entre los distintos sistemas involucrados en el proceso, y en concreto la plataforma elegida fue la desarrollada por Denodo.

El proceso de transformación incluyó tres pasos importantes: la suma del paciente y los datos de prueba, la conversión de estos datos en los formatos necesarios, utilizando la información de mapas, y en tercer lugar la creación de los archivos de resultados finales en formato CSV. Por último, el programador incorporado dentro de la plataforma de virtualización de datos de Denodo ejecuta un proceso FTP una vez al trimestre, para cargar los archivos en los servidores de los distintos organismos colaboradores.

Beneficios

Mediante el despliegue de la plataforma de virtualización de datos de Denodo, NIH obtuvo una serie de beneficios entre los que cabria destacar una mayor escalabilidad, un aumento de la eficiencia y un incremento de la precisión, y como consecuencia de todo ello una mayor precisión en los datos finales.

Lo más leído