Llama 3.1: el nuevo modelo de IA de Meta que será una joya para los desarrolladores ¿Por qué?

Meet Llama 3.1

Holberton Banner 2Meta lanzó Llama 3.1 405B, su modelo de inteligencia artificial de código abierto más ambicioso hasta la fecha. La compañía de Mark Zuckerberg pretende establecer nuevos estándares en la industria y superar a sus competidores, incluyendo ChatGPT de OpenAI. 

El nuevo modelo cuenta  con una longitud de contexto ampliada a 128K y soporte en ocho idiomas, este modelo se posiciona como una herramienta poderosa para una variedad de aplicaciones, desde la generación de datos sintéticos hasta la destilación de modelos. 

En una carta de Mark Zuckerberg señala  la importancia del código abierto para Meta, argumentando que esta estrategia no solo beneficia a la empresa, sino también a los desarrolladores y a la sociedad en general. 

Te puede interesar: OpenAI sorprende con GPT-4o mini, el nuevo modelo barato para desarrolladores

Según Zuckerberg, la apertura del código es vital para garantizar que la tecnología de inteligencia artificial esté accesible a un público más amplio y no quede concentrada en manos de unos pocos.

¿Cómo es Llama 3.1 405B?

De acuerdo con el gigante tecnológico su entrenamiento se optimizó de manera significativa, utilizando más de 16,000 GPU H100 para entrenar el modelo con más de 15 billones de tokens.

Lo que permite al nuevo modelo de IA alcanzar un rendimiento superior a otros modelos  como GPT o Gimine en conocimientos generales, matemáticas, uso de herramientas y traducción multilingüe. Las técnicas de ajuste fino supervisado y optimización directa de preferencias han sido fundamentales para mejorar la calidad de los datos sintéticos y, en consecuencia, el rendimiento del modelo.

Meta explica que una de las grandes ventajas de Llama 3.1 405B es su naturaleza de código abierto. A diferencia de los modelos cerrados, este puede descargarse y personalizarse completamente, permitiendo a los desarrolladores adaptarlo a sus necesidades específicas y entrenarlo con nuevos conjuntos de datos. 

Esta flexibilidad no solo impulsa la innovación, sino que también facilita el acceso a la inteligencia artificial, reduciendo los costos operativos y permitiendo que más personas se beneficien de sus capacidades. Mark Zuckerberg asegura que esta apertura garantiza que la IA no se convierta en una tecnología elitista, sino que esté disponible para una audiencia global.

¿Competitivo con modelos como GPT-4 y Claude 3.5 Sonnet?

Las evaluaciones realizadas  en más de 150 conjuntos de datos de referencia demuestran que Llama 3.1 405B es competitivo con modelos como GPT-4 y Claude 3.5 Sonnet. Las pruebas humanas también han confirmado su capacidad para manejar tareas complejas y ofrecer respuestas detalladas y útiles. 

Según la compañía, esta evaluación  asegura que Llama 3.1 405B no solo cumple con los estándares actuales, sino que también establece nuevos puntos de referencia en términos de rendimiento y funcionalidad.

Te puede interesar: Así es Life2vec, el algoritmo que predice tu muerte

La visión de Meta para Llama va más allá de los modelos básicos, es decir quieren que este sea un enfoque holístico que permite a los desarrolladores diseñar y crear ofertas personalizadas que se ajusten a sus necesidades específicas. 

Desde su lanzamiento, Llama ha sido utilizado para crear aplicaciones, como un “compañero de estudio” en WhatsApp y Messenger, y un modelo de lenguaje para decisiones clínicas. 

Con Llama 3.1 405B, Meta espera ver una expansión aún mayor en el uso de su IA, impulsando la creación de nuevas experiencias y soluciones en diversas áreas. La comunidad ya ha demostrado su capacidad para desarrollar aplicaciones sorprendentes y útiles, y con el poder de Llama 3.1 405B, las posibilidades son prácticamente ilimitadas.

Imagen: Archivo Particular

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos