OpenAI o1: El nuevo modelo IA que "razona"

OpenAI lanzó o1. Su nuevo LLM que "razona". Es mejor en cálculos matemáticos y científicos, pero no en todo. Averigua más en este artículo.

OpenAI o1: El nuevo modelo IA que "razona"

OpenAI ha revolucionado nuevamente la industria con el lanzamiento de su nuevo modelo de lenguaje, o1.

A diferencia de las actualizaciones incrementales anteriores, o1 no es una versión mejorada de GPT, sino un modelo completamente nuevo que, según OpenAI, ""aprende a razonar"".

En este capítulo bonus de nuestro podcast "Inteligencia Artificial para los Negocios" cubrimos los detalles de este anuncio. Revisa el capítulo en este video o en Spotify.

Razonamiento: La Clave de o1

o1 se presenta como un "reasoning model", capaz de realizar funciones analíticas de forma mucho más eficiente que otros modelos de lenguaje. Las pruebas realizadas por OpenAI, incluso con estándares más complejos, muestran resultados sorprendentes.

Empezamos a escuchar de que, por ejemplo, este nivel del desempeño del modelo está equivalente al desempeño de los 500 mejores estudiantes en las clasificatorias de las olimpiadas de matemáticas de EE. UU.

¿Cómo funciona el razonamiento en o1?

El modelo utiliza "reasoning tokens", que permiten a o1 reflexionar sobre la respuesta que va a dar, similar al pensamiento humano en la resolución de problemas. Estos ""tokens"" forman parte de la salida del modelo y se consideran en el costo de utilización.

La imagen muestra que ahora los reasoning tokens acompañan la respuesta del modelo, pero no es parte del siguiente turno de una conversación.

Cuando una persona le manda un input, en la respuesta del modelo viene un razonamiento de cómo el modelo llegó a ese resultado.

Mejoras y limitaciones

o1 presenta mejoras significativas en áreas como la programación, el análisis de datos y los cálculos matemáticos. Sin embargo, no supera a GPT-4 en tareas que involucran la escritura y edición de texto.

Sebastián Cisterna, cofundador de EvoAcademy, destaca esta diferencia: "Este modelo no es necesariamente mejor en todo. Sí es mejor en cosas más complejas que requieren planificación, como la programación, el análisis de datos, y los cálculos matemáticos, pero no lo es en generación y edición de texto. Esto muestra que o1 no es siempre mejor en todo".

Además, estos modelos son más lentos. Cuando razonan les toma un tiempo "pensar", parte en la que dividen las tareas en partes. Después de haber terminado eso, la generación también es más lenta que los modelos de GPT.

0:00
/0:35

El video muestra el mismo prompt en 3 modelos: GPT-4o, o1-mini y o1-preview. GPT es rápido pero alucina

Costos

Es importante mencionar que o1 está disponible en diferentes versiones: preview, mini y regular (aún no lanzada).

Cada una tiene un costo y velocidad diferentes, siendo o1 mini la opción más económica y o1 preview la más costosa de las lanzadas hasta el momento.

Benchmark de este y otros LLM de la industria

o1-preview, la versión con mejor desempeño, es 100 veces más costosa por output token que gpt-4o-mini, que es la versión que podemos experimentar gratuitamente en la página web o aplicación de ChatGPT.

Aplicaciones y futuro de o1

Los casos de uso de o1 son prometedores. Desde la medicina hasta la programación, este modelo tiene el potencial de impactar diversas industrias.

En estos videos podemos ver algunos casos de uso que OpenAI desarrolló con algunos profesionales.

OpenAI continúa trabajando en su desarrollo, con planes para integrar funciones como navegación web y carga de archivos.

Cabe destacar que OpenAI declara que seguirá construyendo avances para los modelos GPT.

Disponibilidad

El modelo ya está disponible para los usuarios de ChatGPT Plus, y a través de la API para aquellos desarrolladores que hayan alcanzado el nivel 5 según los criterios de OpenAI.

Se espera que en las próximas semanas esté disponible para los usuarios de ChatGPT Plus.