Noticias

El MIT desarrolla un algoritmo que ayuda a predecir patrones en grandes flujos de datos

Publicado el

1 abril, 2019

por

DocuWare - Automatizar flujos de trabajo

Un equipo de investigadores del Laboratorio de Informática e Inteligencia Artificial (CSAIL) del MIT ha desarrollado un algoritmo capaz de predecir patrones en grandes flujos de datos. Este algoritmo, que saca partido al Machine Learning, ha recibido, según VentureBeat, el nombre de LearnedSketch, por la forma que tiene de hacer un esbozo de los datos en un flujo.

El algoritmo lleva a cabo este esbozo de manera que puede adelantar si habrá elementos de datos concretos que aparecerán con más frecuencia en dicho flujo que otros, y que, si lo de hecho lo hacen, lo separa del resto de las porciones de datos analizadas. Así se ha descrito en un artículo que ha publicado el equipo que lo ha desarrollado, titulado Algoritmos de estimación de frecuencia basados en el aprendizaje, que se presentará el próximo mes de mayo en la Conferencia internacional de aprendizaje de Nueva Orleans.

Los autores del estudio aseguran que es el primer enfoque basado en Machine Learning no sólo para la estimación de frecuencias. También para los algoritmos de streaming, un tipo de algoritmo en el que los datos se presentan como una secuencia y pueden examinarse sólo durante unas cuantas pasadas. Son bastante populares en sistemas de seguridad y estructuras de proceso de lenguaje natural, entre otras aplicaciones.

En las pruebas que se han llevado a cabo hasta ahora del algoritmo, LearnedSketch ha mostrado su aptitud en la detección y aislamiento de trozos de datos enriquecidos. Así, en pruebas en las que se le ha entrenado con 210 millones de paquetes de datos, se comportó mejor que le resto de enfoques en la estimación de tráfico de Internet en una red, consiguiendo un 57% menos de error. Y cuando se le han dado 3,8 millones de preguntas de AOL únicas, consiguió estimar el número de preguntas de un término de búsqueda en Internet con un 71% menos de error.

Además, con LearnedSketch se puede generalizar con mucha frecuencia, gracias a las estructuras aprendidas, que se pueden aplicar a elementos no vistos con anterioridad. Así, en una prueba en la que el algoritmo tenía que identificar qué conexiones a Internet eran los que tenían más tráfico, encapsuló distintas conexiones por prefijo o IP de desatino, subrayando la percepción de la regla de que los suscriptores de Internet que generan mucho tráfico tienden a compartir un prefijo en concreto.

Los investigadores que han desarrollador LearnedSketch creen que este sistema, o uno parecido a él, podría utilizarse en el futuro para rastrear trending topics en redes sociales, o para identificar picos de tráfico web problemáticos y mejorar las recomendaciones de producto de sitios de comercio electrónico.

Categorías relacionadas:algoritmo Big Data Datos MIT

A continuación

MuySeguridad Recaps (IV): ataque ministerio de Defensa, vulnerabilidades LTE, RootedCON

No te pierdas

El mercado del hogar inteligente crecerá por encima del 25% en 2019

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

Click para comentar

EntrevistasHace 5 días

«Proporcionamos ciberseguridad de gama alta a nuestros clientes, sin importar su tamaño»

NoticiasHace 4 días

DEV presenta el Libro Blanco del Desarrollo Español de Videojuegos 2025

Virtual Cable y HPE colaborarán en puesto de trabajo inteligente con UDS Enterprise

NoticiasHace 4 días

Virtual Cable y HPE colaborarán en puesto de trabajo inteligente con UDS Enterprise

Cloudflare bloqueará los rastreadores web mixtos que presten servicio a las empresas de IA

NoticiasHace 5 días

Cloudflare bloqueará los rastreadores web mixtos que presten servicio a las empresas de IA

MuyComputerPRO

El MIT desarrolla un algoritmo que ayuda a predecir patrones en grandes flujos de datos

Noticias

El MIT desarrolla un algoritmo que ayuda a predecir patrones en grandes flujos de datos

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

Nextcloud lanza oficialmente su programa para ISV

Dell ampliará los centros de datos de Vodafone en España

Las ventas de ordenadores caen un 3,6%, lastradas por el precio de memoria y almacenamiento

«La clave no es la IA, es la confianza en el dato»

La mayoría de españoles cree que depender de tecnología ajena a la UE es peligroso para la seguridad

Anthropic suspende el acceso a sus modelos de IA, Fable 5 y Mythos 5

ASUS lanza la supercomputadora de IA de escritorio, ExpertCenter Pro ET900N G3

Synology lanza DiskStation Manager 7.4

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

El Gobierno destina 719 millones a un proyecto español de desarrollo de una gigafactoría de IA

«La digitalización hospitalaria ya no es una promesa: es una realidad en marcha»

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

VeeamON Tour Madrid: cómo construir infraestructuras de confianza para la era de la IA agéntica

El 35% de las pymes españolas invertirá en IA en 2026

El consumo de electricidad de los centros de datos crecerá un 26% en 2026

D-Matrix, respaldada por Microsoft, es otra de las que quieren desafiar a NVIDIA

El shopping algorítmico está lejos de lograr la confianza de los compradores

Lo más leído

MuyComputerPRO

El MIT desarrolla un algoritmo que ayuda a predecir patrones en grandes flujos de datos

También te puede gustar

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

Nextcloud lanza oficialmente su programa para ISV

Dell ampliará los centros de datos de Vodafone en España

Las ventas de ordenadores caen un 3,6%, lastradas por el precio de memoria y almacenamiento

«La clave no es la IA, es la confianza en el dato»

La mayoría de españoles cree que depender de tecnología ajena a la UE es peligroso para la seguridad

Anthropic suspende el acceso a sus modelos de IA, Fable 5 y Mythos 5

ASUS lanza la supercomputadora de IA de escritorio, ExpertCenter Pro ET900N G3

Synology lanza DiskStation Manager 7.4

LineShine: China supera a EE.UU alcanzando el primer puesto del TOP500 de supercomputadoras

El Gobierno destina 719 millones a un proyecto español de desarrollo de una gigafactoría de IA

«La digitalización hospitalaria ya no es una promesa: es una realidad en marcha»

Bitdefender Sovereign Acceleration Program, soberanía europea también en ciberseguridad

VeeamON Tour Madrid: cómo construir infraestructuras de confianza para la era de la IA agéntica

El 35% de las pymes españolas invertirá en IA en 2026

El consumo de electricidad de los centros de datos crecerá un 26% en 2026

D-Matrix, respaldada por Microsoft, es otra de las que quieren desafiar a NVIDIA

El shopping algorítmico está lejos de lograr la confianza de los compradores

Lo más leído