Noticias

Snowflake anuncia Arctic, su propio modelo grande de lenguaje para empresas

Publicado el

26 abril, 2024

por

Snowflake anuncia Arctic, su propio modelo grande de lenguaje para empresas

Snowflake ha anunciado el lanzamiento de su propio modelo grande de lenguaje para empresas, al que ha llamado Arctic. Incorpora la arquitectura MoE (Mezcla de Expertos), y está optimizado para cargas de trabajo empresariales complejas. Así, supera varios puntos de referencia en generación de código SQL o seguimiento de instrucciones. La compañía ha decidido publicar los pesos del modelo bajo una licencia Apache 2.0, acompañada por los detalles de su creación y entrenamiento, lo que lo convierte en un modelo caracterizado por su apertura.

El modelo grande de lenguaje Snowflake Arctic forma parte de la familia de modelos Snowflake Arctic, de la que también forman parte varios modelos prácticos de texto embebido y pensados para casos de uso de recuperación.

Con este modelo bajo licencia Apache 2.0, Snowflake permite su uso personal, comercial y de investigación sin restricciones. Además, Snowflake ofrece plantillas de código y opciones flexibles de inferencia y formación. De esta manera, los usuarios agilizarán el despliegue y personalización de Arctic en sus entornos de trabajo de preferencia. Entre ellos están Nvidia NIM con Nvidia Tensor RT-LLM, vLLM y Hugging Face.

En caso de necesitar utilizarlo de manera inmediata, está disponible para inferencia sin servidor en Snowflake Cortex, el servicio totalmente gestionado de Snowflake con soluciones de machine learning e IA en Data Cloud. También estará disponible en AWS, junto a otros archivos y catálogos de modelos, entre los que están Hugging Face, Lamini, Microsoft Azure, el catálogo de API de Nvidia, Perplexity o Together AI.

En el desarrollo de Artic, el equipo de investigación de IA de Snowflake invirtió menos de tres meses, y gastó alrededor de una octava parte de lo que cuesta entrenar modelos parecidos. El entrenamiento de Arctic se llevó a cabo mediante instancias P5 de Amazon Elastic Compute Cloud (Amazon EC2).

Con esto, Snowflake está estableciendo un nuevo referente en cuanto a la rapidez en el entrenamiento de modelos empresariales abiertos. Incluso en el caso de los más avanzados. Esto llevará a que los usuarios lleguen a ser capaces de crear modelos personalizados rentables a gran escala.

El diseño diferenciado de la. arquitectura MoE de Arctic mejora los sistemas de entrenamiento y el rendimiento de los modelos, con una composición de datos diseñada de manera meticulosa, y centrada en las necesidades de las empresas. Este modelo también ofrece resultados considerados de alta calidad, activando 17 de los 480.000 millones de parámetros a la vez. Así logra una mayor calidad con una elevada eficiencia simbólica.

Durante la inferencia o el entrenamiento, Arctic activa alrededor de un 50% menos de parámetros que otro de los principales modelos abiertos, DBRX. También un 75% menos que Llama 3 70B. Además, supera a DBRX y Mixtral-8x7B en codificación, según los resultados obtenidos en los bancos de pruebas HumanEval+ y MBPP+. También supera a Spider en generación de SQL, y consigue un resultado notable en comprensión general del lenguaje, según el banco MMLU.

La familia de modelos Snowflake Arctic, compuesta ya con este LLM que se acaba de anunciar por cinco modelos, está disponible en Hugging Face para su uso inmediato. Además, pronto llegará también como parte de la función embebida de Snowflake Cortex, en fase de prueba privada.

Relacionados:modelo grande de lenguaje Snowflake Snowflake Arctic

A continuación

La valoración de Google ya supera el PIB de España

No te pierdas

Dropbox añade cifrado de extremo a extremo e integraciones con Teams y Copilot

Celia Valdeolmillos

Redactora de tecnología con más de 15 años de experiencia, salté del papel a la Red y ya no me muevo de ella. Inquieta y curiosa por naturaleza, siempre estoy al día de lo que pasa en el sector.

NoticiasHace 6 días

La inteligencia artificial generativa podría cobrarse pronto su primera víctima: los centros de llamadas

A FondoHace 6 días

Un «sweetspot» para la realidad mixta

A FondoHace 7 días

Las principales estrategias de marketing digital para impulsar tus ventas en 2024

Thales se interesa por la división de defensa de Atos

NoticiasHace 7 días

Thales se interesa por la división de defensa de Atos

MuyComputerPRO

Snowflake anuncia Arctic, su propio modelo grande de lenguaje para empresas

Noticias

Snowflake anuncia Arctic, su propio modelo grande de lenguaje para empresas

En 2023 se instalaron más de 5.000 robots industriales en España

Estos son los finalistas de los CTO Awards 2024

Ayuntamiento de Barcelona y Generalitat de Catalunya valoran instalar un centro de datos subterráneo en La Sagrera

El Gobierno pone en marcha el Kit Consulting para facilitar la digitalización de las pymes

Amazon Q: Disponible el asistente de IA generativa más avanzado de AWS

Inteligencia Artificial y Criptomonedas

«No tiene sentido una estrategia tecnológica que no encaje al 100% con la del CEO»

El hackeo de caras, un peligro que acecha a los sistemas de seguridad biométrica

Huawei Enterprise Roadshow para en abril en Bilbao, Barcelona, Albacete y Madrid

«La IA hará que la analítica sea más potente y que genere insights de manera más eficiente»

Automatizando el Cloud Journey con myCloudDoor y Microsoft Azure

Pantallas que venden: cómo conectar el retail con el consumidor digital

En 2023 se instalaron más de 5.000 robots industriales en España

El hackeo de caras, un peligro que acecha a los sistemas de seguridad biométrica

Knowmad mood compra Interwor para mejorar en seguridad, infraestructura y comunicaciones

MSG, primera marca de soluciones de mecatrónica de origen español, inicia su andadura

Onepoint, principal accionista de Atos, inicia los pasos para rescatar el grupo

El futuro buscador potenciado por IA de Google podría ser de pago

Lo más leído

MuyComputerPRO

Snowflake anuncia Arctic, su propio modelo grande de lenguaje para empresas

También te puede gustar

En 2023 se instalaron más de 5.000 robots industriales en España

Estos son los finalistas de los CTO Awards 2024

Ayuntamiento de Barcelona y Generalitat de Catalunya valoran instalar un centro de datos subterráneo en La Sagrera

El Gobierno pone en marcha el Kit Consulting para facilitar la digitalización de las pymes

Amazon Q: Disponible el asistente de IA generativa más avanzado de AWS

Inteligencia Artificial y Criptomonedas

«No tiene sentido una estrategia tecnológica que no encaje al 100% con la del CEO»

El hackeo de caras, un peligro que acecha a los sistemas de seguridad biométrica

Huawei Enterprise Roadshow para en abril en Bilbao, Barcelona, Albacete y Madrid

«La IA hará que la analítica sea más potente y que genere insights de manera más eficiente»

Automatizando el Cloud Journey con myCloudDoor y Microsoft Azure

Pantallas que venden: cómo conectar el retail con el consumidor digital

En 2023 se instalaron más de 5.000 robots industriales en España

El hackeo de caras, un peligro que acecha a los sistemas de seguridad biométrica

Knowmad mood compra Interwor para mejorar en seguridad, infraestructura y comunicaciones

MSG, primera marca de soluciones de mecatrónica de origen español, inicia su andadura

Onepoint, principal accionista de Atos, inicia los pasos para rescatar el grupo

El futuro buscador potenciado por IA de Google podría ser de pago

Lo más leído