La compañía estadounidense presentó GPT-4o, un modelo que apunta a tener una interacción persona-computadora mucho más natural. OpenIA señala que ahora, podrás generar contenido, pero no solo se limitará al texto, sino que permitirá entradas de audio e imagen; estas respuestas serán tan sólo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humano. “Con GPT-4o, entrenamos un único modelo nuevo de extremo a extremo en texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal. Debido a que GPT-4o es nuestro primer modelo que combina todas estas modalidades, todavía estamos apenas rascando la superficie para explorar lo que el modelo puede hacer y sus limitaciones”, explica OpenIA.
Te puede interesar: Entrevista: «Las personas sí tienen que prepararse más porque la IA viene a sustituir»: Daniel Camacho, director de Michael Page
¿Pero cuáles son sus novedades?
- Mejoras en comprensión de imágenes: GPT-4o ahora puede comprender y analizar imágenes con una precisión notable. Por ejemplo, puede tomar una foto de un menú en un idioma diferente, traducirlo, brindar información sobre la comida y ofrecer recomendaciones.
- Conversación de voz en tiempo real: Se planea una mejora para permitir una conversación de voz más natural en tiempo real con ChatGPT, así como la capacidad de interactuar a través de video en tiempo real, lo que abriría nuevas posibilidades, como obtener explicaciones sobre eventos en vivo.
- Soporte para más de 50 idiomas: Ahora, ChatGPT admite más de 50 idiomas, lo que hace que la IA sea más accesible y útil para una audiencia global.
- Implementación para diferentes tipos de usuarios: GPT-4o se está implementando primero para usuarios de ChatGPT Plus y Team, y pronto estará disponible para usuarios empresariales.
- Funciones avanzadas para usuarios gratuitos: Los usuarios de ChatGPT Free ahora tendrán acceso a características avanzadas, como la capacidad de experimentar la inteligencia de nivel GPT-4, obtener respuestas tanto del modelo como de la web, analizar datos y crear gráficos, conversar sobre fotos, subir archivos para obtener ayuda y utilizar la tienda GPT y la función Memory para crear una experiencia más útil.
- Los usuarios gratuitos y pagos, tendrán nueva aplicación de escritorio ChatGPT para macOS que está diseñada para integrarse perfectamente con cualquier cosa que esté haciendo en su computadora. Con un simple atajo de teclado (Opción + Espacio), puedes hacerle una pregunta a ChatGPT instantáneamente. También puedes tomar y discutir capturas de pantalla directamente en la aplicación
- ChatGPT tendrá una nueva apariencia, según OpenAI, el diseño está pensado para ser más amigable y conversacional.
Cabe mencionar, que pese a que las nuevas herramientas son gratuitas, OpenAI, limitará la cantidad de mensajes que pondrás enviar, aunque no dice la cantada advierte que será por uso y demanda. “Cuando se alcance el límite, ChatGPT cambiará automáticamente a GPT-3.5 para que los usuarios puedan continuar sus conversaciones”, explica.
Te puede interesar: OpenAI desarrolló un software que no solo identifica imágenes creadas con IA, también audios
Finalmente, para los desarrolladores podrán acceder a GPT-4o en la API como modelo de texto y visión. GPT-4o es 2 veces más rápido, la mitad de precio y tiene límites de velocidad 5 veces más altos en comparación con GPT-4 Turbo.
Imagen: OpenAI