OpenAI presentó el primer modelo de inteligencia artificial de su serie, OpenAI o1, capaz de razonar y pensar sus respuestas a través de la matemáticas y la ciencia para cometer menos errores. La empresa explicó que estos modelos son entrenados para dedicar más tiempo a pensar en los problemas antes de responder, de manera similar a como lo haría una persona. A través de este entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores.
Hasta ahora, OpenAI había enseñado a sus modelos a imitar patrones de sus datos de entrenamiento, basándose en información de internet, lo que provocaba la repetición de información falsa. Sin embargo, o1 utiliza una técnica de aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones. Al resolver problemas matemáticos, por ejemplo, el modelo puede aprender qué métodos conducen a la respuesta correcta y cuáles no.
Gracias a esta nueva metodología de entrenamiento, OpenAI afirma que el modelo será más preciso y capaz de evitar las 'alucinaciones', es decir, dar respuestas bien estructuradas pero falsas. En una demostración para The New York Times, el chatbot resolvió un acróstico, respondió a una pregunta de química de nivel de doctorado y diagnosticó una enfermedad basándose en un informe detallado sobre los síntomas y el historial del paciente. Comparado con el modelo anterior, GPT-4o, o1 obtuvo una puntuación mucho más alta en un examen de clasificación para la Olimpiada Internacional de Matemáticas.
Gigantes tecnológicos como Google y Meta están construyendo tecnologías similares, y Microsoft, socio de OpenAI, incorporará pronto el nuevo sistema de OpenAI en sus productos. Además, OpenAI también presentó una versión más eficiente del modelo, llamada OpenAI o1-mini, diseñada para ofrecer una solución más rápida y económica para los desarrolladores. Los usuarios de ChatGPT Plus y Team ya tienen acceso tanto a o1 como a o1-mini, mientras que los usuarios de las suscripciones de Enterprise y Edu tendrán acceso en breve.
En resumen, OpenAI o1 es un importante avance en inteligencia artificial, ya que permite a los modelos de IA razonar y pensar sus respuestas a través de la matemáticas y la ciencia, reduciendo la posibilidad de cometer errores. Gracias a la técnica de aprendizaje de refuerzo, el modelo puede aprender de sus aciertos y errores al resolver problemas matemáticos y otros desafíos. Este nuevo enfoque de entrenamiento ha demostrado ser efectivo, ya que o1 ha logrado puntuaciones mucho más altas que sus predecesores en pruebas de competencia matemática. Además, la colaboración con gigantes tecnológicos y la disponibilidad de versiones especializadas como o1-mini, demuestran el impacto y el potencial de esta nueva tecnología en diversos campos y aplicaciones.