Alibaba dice que su nuevo modelo de IA rivaliza con Deepseeks's R-1, Openi's O1

Alibaba Cloud lanzó el jueves QWQ-32B, un modelo de razonamiento compacto basado en su último modelo de lenguaje grande (LLM), Qwen2.5-32b, uno dice que ofrece un rendimiento comparable a otros modelos de vanguardia grandes, incluidos los rivales chinos Deepseek y Openi’s O1, con solo 32 mil millones de parámetros.

Según un liberar De Alibaba, “El rendimiento de QWQ-32B destaca el poder del aprendizaje de refuerzo (RL), la técnica central detrás del modelo, cuando se aplica a un modelo de base robusto como Qwen2.5-32b, que se captura previamente en un amplio conocimiento mundial. Al aprovechar la escala continua de RL, QWQ-32B demuestra mejoras significativas en el razonamiento matemático y el dominio de la codificación «.

AWS define RL como «una técnica de aprendizaje automático que entrena el software para tomar decisiones para lograr los resultados más óptimos e imita el proceso de aprendizaje de prueba y error que los humanos usan para lograr sus objetivos. Las acciones de software que funcionan hacia su objetivo se refuerzan, mientras que las acciones que rayan de la meta se ignoran «.

Fuente

Battlefield 6 alcanza los 10 millones de copias vendidas, pero no será suficiente para derribar a Call Of Duty, dice un analista

La primera versión beta de iOS 26.2 sugiere una nueva función AirDrop para compartir de forma segura

Un tribunal de EE. UU. ordena a Samsung pagar 191 millones de dólares por infracción de patente OLED

La mayoría de los desarrolladores dicen que Steam tiene el monopolio de los juegos de PC en una nueva encuesta

watchOS 26.2 actualiza los rangos de puntuación del sueño

Se revela el avance de DJI Osmo Action 6: diseño cuadrado, lanzamiento el 18 de noviembre y especificaciones

Alibaba dice que su nuevo modelo de IA rivaliza con Deepseeks’s R-1, Openi’s O1

¿Qué son las ‘mejoras de seguridad en segundo plano’ en los dispositivos Apple?

El Louvre retrasó las actualizaciones de seguridad de Windows antes del robo

Los navegadores web con IA son geniales, útiles y completamente poco confiables

Apple puede recurrir a Google Gemini para Apple Intelligence AI

Experimentos antrópicos con introspección de IA

OpenAI gasta aún más dinero del que no tiene

Deja una respuestaCancelar la respuesta

Se rumoreaba que ‘iPhone 17 Air’ cuenta con batería ‘de alta densidad’

Pokemon Go Fest Heads a París este verano