OpenAI lanza o1, un modelo de IA que razona y resuelve problemas difíciles ¿Cuáles?

Holberton Banner 2La desarrolladora estadounidense lanzó modelos de inteligencia artificial (IA) de razonamiento para resolver problemas complicados. Según OpenAI, pueden razonar sobre tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencia, programación y matemáticas.
De acuerdo con la compañía, estos modelos fueron entrenados para que las personas dediquen su tiempo a pensar y la inteligencia a responder de manera similar  a como lo haría una persona.La inteligencia es capaz de aprender a refinar su proceso de pensamiento, a probar diferentes estrategias y a reconocer sus errores. 

Te puede interesar: ¿Entiendes bien cómo funciona la IA? Conceptos básicos

OpenAI asegura que los resultados de pruebas hechas al modelo,  muestran que este se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia  en física, química y biología. También se destaca en matemáticas y codificación. Por ejemplo, en un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83%. Sus habilidades de codificación se evaluaron en concursos y alcanzaron el perceptible 89 en las competencias de Codeforces. Por otra parte, la compañía explica que “como modelo preliminar, aún no cuenta con muchas de las funciones que hacen que ChatGPT sea útil, como navegar por la web en busca de información y cargar archivos e imágenes”. 

Te puede interesar: CodeVita abre inscripciones para participar en concurso de programación, entregan 85 millones a ganadores

¿A quiénes va dirigido?

Pues bien, OpenAI señaló que o1 puede ser utilizado por investigadores del sector sanitario para anotar datos de secuenciación celular; por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos. 

Los usuarios de ChatGPT Plus y Team podrán acceder a los modelos o1 en ChatGPT a partir de hoy. Tanto o1-preview como o1-mini se pueden seleccionar manualmente en el selector de modelos.

El uso por parte de los usuarios, tendrá un límite semanal de 30 mensajes para o1-preview y 50 para o1-mini.

Finalmente en tanto a seguridad, la desarrolladora explicó que una forma de medir la seguridad es probando qué tan bien el modelo sigue sus reglas de seguridad si un usuario intenta eludirlas (lo que se conoce como “jailbreaking”).

Según en una de las pruebas de jailbreaking más difíciles, GPT-4o obtuvo una puntuación de 22 (en una escala de 0 a 100), mientras que el modelo o1-preview obtuvo una puntuación de 84.

Imagen: OPENAI

Digna Irene Urrea

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

Archivos