OpenAI sorprende con GPT-4o mini, el nuevo modelo barato para desarrolladores

Holberton Banner 2OpenAI lanzó GPT-4o mini, su modelo más rentable hasta la fecha, diseñado para hacer la inteligencia artificial más accesible. La compañía promete una amplia gama de aplicaciones gracias a su asequibilidad y capacidad. GPT-4o mini es significativamente más económico que sus predecesores, incluyendo el popular GPT-3.5 Turbo.

GPT-4o mini no solo es asequible, sino que también ofrece un rendimiento importante, por ejemplo, obtuvo un 82% en el MMLU (Massive Multitask Language Understanding), superando a modelos como GPT-4 en preferencias de chat según la clasificación de LMSYS.

Este modelo es ideal para tareas que requieren bajo costo y baja latencia, como aplicaciones que encadenan múltiples llamadas de modelo, manipulan grandes volúmenes de datos o interactúan con los usuarios en tiempo real a través de chatbots.

Te puede interesar: ChatGPT ‘engañó’ a académicos de prestigiosa facultad de psicología, ¿cómo pasó?

Además, GPT-4o mini admite texto y visión en su API, y se espera que en el futuro también soporte entradas y salidas de texto, imágenes, video y audio. Con una ventana de contexto de 128,000 tokens y la capacidad de generar hasta 16,000 tokens por solicitud, este modelo es perfecto para manejar bases de código completas o historiales de conversaciones extensos.

Comparado con otros modelos pequeños, GPT-4o mini sobresale en varias áreas. En tareas de razonamiento, ha demostrado ser superior con una puntuación del 82% en MMLU, frente al 77.9% de Gemini Flash y el 73.8% de Claude Haiku. En matemáticas y codificación, también ha mostrado un rendimiento excepcional, con una puntuación del 87% en MGSM y del 87.2% en HumanEval, superando claramente a otros modelos pequeños en el mercado.

En términos de razonamiento multimodal, GPT-4o mini logró un 59.4% en MMMU, superando nuevamente a sus competidores. Este modelo ha sido evaluado en colaboración con empresas como Ramp y Superhuman, que encontraron que GPT-4o mini supera a GPT-3.5 Turbo en tareas como la extracción de datos estructurados de recibos y la generación de respuestas de correo electrónico de alta calidad.

¿Qué tan seguro es el nuevo modelo?

OpenAI ha integrado medidas de seguridad robustas en GPT-4o mini, alineando su comportamiento con las políticas de la empresa a través de técnicas como el aprendizaje de refuerzo con retroalimentación humana (RLHF).

Además, el modelo ha sido sometido a evaluaciones tanto automatizadas como humanas para garantizar su fiabilidad y seguridad. Más de 70 expertos en campos como la psicología social y la desinformación han participado en estas evaluaciones, ayudando a identificar y mitigar posibles riesgos.

Basándose en estos aprendizajes, OpenAI ha implementado nuevas técnicas para mejorar la seguridad de GPT-4o mini, incluyendo un método jerárquico de instrucciones que aumenta la resistencia del modelo a fugas de información y ataques de inyección de mensajes.

Te puede interesar: Así funciona Project Oscar, la plataforma de agentes de IA de Google para desarrolladores

GPT-4o mini ya está disponible como modelo de texto y visión en la API de OpenAI, con un costo de 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida. En ChatGPT, los usuarios de las versiones Free, Plus y Team podrán acceder a GPT-4o mini a partir de hoy, y los usuarios de Enterprise tendrán acceso a partir de la próxima semana.

Imagen: OpenAI

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos