in

Descifrando la familia o1 de modelos de lenguaje de gran tamaño de OpenAI

Descifrando la familia o1 de modelos de lenguaje de gran tamaño de OpenAI

Además, Fan dijo que OpenAI debe haber descubierto la ley de escalamiento de inferencia hace mucho tiempo, algo que el mundo académico está descubriendo recientemente. Sin embargo, señaló que llevar o1 a la producción es mucho más difícil que cumplir con los parámetros académicos y planteó varias preguntas.

“Para los problemas de razonamiento en la naturaleza, ¿cómo (el modelo) decide cuándo dejar de buscar? ¿Cuál es la función de recompensa? ¿Criterio de éxito? ¿Cuándo llamar a herramientas como el intérprete de código en el bucle? ¿Cómo tener en cuenta el costo computacional de esos procesos de CPU? Su publicación de investigación no compartió mucho.

OpenAI también ha dicho en una de sus publicaciones del blog que el nuevo modelo, que todavía se encuentra en las primeras etapas de desarrollo y se espera que experimente una iteración significativa, aún no tiene muchas de las características que hacen que ChatGPT sea útil, como navegar por la web en busca de información y cargar archivos e imágenes.

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

El iPhone 16 ya está disponible para preordenar, aquí están las ofertas y descuentos

Los despidos de Xbox afectaron a los equipos de Call Of Duty: Warzone Mobile y Warcraft Rumble, según un informe

Los despidos de Xbox afectaron a los equipos de Call Of Duty: Warzone Mobile y Warcraft Rumble, según un informe