IBM lanza Granite 3.0, modelo de lenguaje de última generación ¿Caballo de batalla para empresas?

inteligencia artificial pensando

BANNER IA

Los nuevos modelos IBM Granite 3.0 ofrecen un rendimiento de última generación en relación con el tamaño del modelo, al tiempo que maximizan la seguridad, la velocidad y la rentabilidad para los casos de uso empresarial. Los nuevos modelos IBM utilizan un novedoso método de dos fases en más de 12 billones de tokens de datos, cuidadosamente examinados en 12 lenguajes naturales diferentes y 116 lenguajes de programación diferentes.


Granite 3.0 8B Instruct es fácil de desarrollar como un modelo empresarial de caballo de batalla destinado a servir como bloque de construcción principal para flujos de trabajo sofisticados y casos de uso basados en herramientas.
Este, iguala a los principales modelos abiertos de tamaño similar en los puntos de referencia académicos y, al mismo tiempo, supera a sus pares en los puntos de referencia para tareas empresariales y seguridad.

IBM Granite 3.0 es la tercera generación de la serie Granite de modelos de lenguajes grandes (LLM) y herramientas complementarias.

Te puede interesar: ¡Por fin! App de ChatGPT llega Windows Store, ventajas y condiciones

“Como reflejo de nuestro enfoque en el equilibrio entre potencia y practicidad, los nuevos modelos IBM Granite 3.0 ofrecen un rendimiento de última generación en relación con el tamaño del modelo, al tiempo que maximizan la seguridad, la velocidad y la rentabilidad para los casos de uso empresarial”.

El ajuste de modelos más pequeños y adaptados a su propósito, como Granite, permite a las empresas alcanzar el rendimiento de modelos de vanguardia a una fracción del costo.

“Adaptar los modelos de Granite a las necesidades únicas de su organización a través de InstructLab, un enfoque colaborativo de código abierto para aumentar el conocimiento y las habilidades del modelo con datos sintéticos generados sistemáticamente y protocolos de capacitación por fases, puede reducir aún más los costos y los plazos”.

Todos los modelos Granite se lanzan bajo la permisiva licencia Apache 2.0, contrariando la tendencia reciente de modelos cerrados o modelos abiertos lanzados bajo acuerdos de licencia de propiedad idiosincrásicos.

“En otra divergencia con las tendencias de la industria para los modelos abiertos, IBM proporciona una divulgación detallada de los conjuntos de datos y metodologías de capacitación en el documento técnico Granite 3.0, reafirmando la dedicación de IBM para generar transparencia, seguridad y confianza en los productos de IA”.

En su totalidad, la versión IBM Granite 3.0 incluye: LLM densos y de uso general: Granite-3.0-8B-Instruct, Granite-3.0-8B-Base, Granite-3.0-2B-Instruct y Granite-3.0-2B-Base.

Modelos de barandillas de entrada y salida basados en LLM: Granite-Guardian-3.0-8B, Granite-Guardian-3.0-2B
Combinación de modelos expertos (MoE) para latencia mínima: Granite-3.0-3B-A800M-Instruct, Granite-3.0-1B-A400M-Instruct

Te puede interesar: Tu nombre puede afectar las respuestas de ChatGPT: no responde igual si te llamas John o Guillermo

Decodificador especulativo para aumentar la velocidad y la eficiencia de la inferencia: Granite-3.0-8B-Instruct-Accelerator

Las actualizaciones inminentes planificadas para el resto de 2024 incluyen una expansión de todas las ventanas de contexto del modelo a 128.000 tokens, mejoras adicionales en el soporte multilingüe para 12 lenguajes naturales y la introducción de capacidades multimodales de entrada y salida de texto de imágenes.

Granite 3.0 8B Instruct y Granite 3.0 2B Instruct, así como ambos modelos de seguridad Guardian 3.0, están disponibles hoy para uso comercial en la plataforma IBM watsonx.

Los modelos Granite 3.0 también están disponibles a través de socios de plataforma, incluido Google Vertex AI (a través de las integraciones Vertex AI Model Garden de Google Cloud con Hugging Face), Hugging Face, NVIDIA (como microservicios NIM), Ollama y Replicate.

“Continuando con el compromiso de IBM con la sostenibilidad, los modelos de lenguaje IBM Granite 3.0 se entrenan en Blue Vela, impulsado por energía 100% renovable”.

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos