Los modelos Qwen ahora están disponibles en Amazon Bedrock | Servicios web de Amazon

Hoy estamos agregando Modelos qwen de Alibaba en Amazon Bedrock. Con este lanzamiento, Amazon Bedrock continúa expandiendo la elección del modelo al agregar acceso a los modelos de Fundación de peso abierto QWEN3 (FMS) de una manera completa y sin servidor administrada. Esta versión incluye cuatro modelos: Qwen3-coder-480b-A35B-Instructo, QWEN3-CODER-30B-A3B-INSTRUG, QWEN3-235B-A22B-INSTRUCT-2507y Qwen3-32b (denso). Juntos, estos modelos cuentan con la mezcla de expertos (MOE) y arquitecturas densas, proporcionando opciones flexibles para diferentes requisitos de aplicación.

Amazon Bedrock proporciona acceso a FMS líderes en la industria a través de una API unificada sin requerir gestión de infraestructura. Puede acceder a modelos de múltiples proveedores de modelos, integrar modelos en sus aplicaciones y el uso de escala en función de los requisitos de carga de trabajo. Con Amazon Bedrock, los datos del cliente nunca se usan para entrenar los modelos subyacentes. Con la adición de modelos QWEN3, Amazon Bedrock ofrece aún más opciones para casos de uso como:

Generación de códigos y análisis de repositorio con comprensión de contexto extendido
Creación de flujos de trabajo de agente que orquestan múltiples herramientas y API para la automatización de negocios
Equilibrar los costos de IA y el rendimiento utilizando modos de pensamiento híbrido para razonamiento adaptativo

Modelos QWEN3 en Amazon Bedrock
Estos cuatro modelos QWEN3 ahora están disponibles en Amazon Bedrock, cada uno optimizado para diferentes requisitos de rendimiento y costos:

Qwen3-coder-480b-A35B-Instructo -Este es un modelo de mezcla de expertos (MOE) con parámetros totales 480b y 35b de parámetros activos. Está optimizado para la codificación y las tareas de agente y logra fuertes resultados en puntos de referencia, como codificación de agente, uso del navegador y uso de herramientas. Estas capacidades lo hacen adecuado para el análisis de código a escala de repositorio y la automatización de flujo de trabajo de varios pasos.
QWEN3-CODER-30B-A3B-INSTRUG – Este es un modelo MOE con parámetros totales de 30B y parámetros activos 3B. Específicamente optimizado para la codificación de tareas y escenarios de seguimiento de instrucciones, este modelo demuestra un fuerte rendimiento en la generación de códigos, el análisis y la depuración en múltiples lenguajes de programación.
QWEN3-235B-A22B-INSTRUCT-2507 -Este es un modelo MOE ajustado a instrucciones con parámetros totales de 235b y 22B de parámetros activos. Ofrece un rendimiento competitivo en las tareas de codificación, matemáticas y razonamiento general, la capacidad de equilibrio con eficiencia.
Qwen3-32b (denso) – Este es un modelo denso con parámetros 32B. Es adecuado para entornos en tiempo real o limitados por recursos, como dispositivos móviles e implementaciones de computación de borde, donde el rendimiento consistente es crítico.

Características arquitectónicas y funcionales en Qwen3
Los modelos QWEN3 introducen varias características arquitectónicas y funcionales:

MOE en comparación con densas arquitecturas – Modelos MOE como QWEN3-Coder-480B-A35B, QWEN3-Coder-30B-A3B-Instructo y QWEN3-235B-A22B-Instructo 25507, activan solo una parte de los parámetros para cada solicitud, proporcionando un alto rendimiento con inferencia eficiente. El denso QWEN3-32B activa todos los parámetros, ofreciendo un rendimiento más consistente y predecible.

Capacidades de agente – Los modelos QWEN3 pueden manejar razonamiento de varios pasos y planificación estructurada en un modelo de invocación. Pueden generar salidas que llaman herramientas o API externos cuando se integran en un marco de agente. Los modelos también mantienen un contexto extendido en sesiones largas. Además, admiten la llamada de herramientas para permitir una comunicación estandarizada con entornos externos.

Modos de pensamiento híbrido – QWEN3 presenta un enfoque híbrido para la resolución de problemas, que admite dos modos: pensar y no pensar. El modo de pensamiento aplica razonamiento paso a paso antes de entregar la respuesta final. Esto es ideal para problemas complejos que requieren un pensamiento más profundo. Mientras que el modo no pensativo proporciona respuestas rápidas y casi instantes para tareas menos complejas donde la velocidad es más importante que la profundidad. Esto ayuda a los desarrolladores a administrar el rendimiento y las compensaciones de costos de manera más efectiva.

Manejo de contexto largo- Los modelos de codificadores QWEN3 admiten ventanas de contexto extendidas, con hasta 256k tokens de forma nativa y hasta 1 millón de tokens con métodos de extrapolación. Esto permite que el modelo procese repositorios completos, grandes documentos técnicos o largas historias de conversación dentro de una sola tarea.

Cuándo usar cada modelo
Los cuatro modelos QWEN3 sirven casos de uso distintos. QWEN3-Coder-480B-A35B-Instructo está diseñado para escenarios complejos de ingeniería de software. Es adecuado para la generación de código avanzado, el procesamiento de contexto largo, como el análisis a nivel de repositorio e integración con herramientas externas. QWEN3-Coder-30B-A3B-Instructo es particularmente efectivo para tareas como la finalización del código, la refactorización y la respuesta de consultas relacionadas con la programación. Si necesita un rendimiento versátil en múltiples dominios, QWEN3-235B-A22B-Instructo-2507 ofrece un equilibrio, ofreciendo fuertes capacidades de razonamiento de uso general y seguimiento de instrucciones al tiempo que aprovecha las ventajas de eficiencia de su arquitectura MOE. QWEN3-32B (DENSE) es apropiado para escenarios donde el rendimiento consistente, la baja latencia y la optimización de costos son importantes.

Comenzando con modelos Qwen en Amazon Bedrock
Para comenzar a usar modelos Qwen, en la consola de rock de Amazon, elijo Acceso modelo desde Configurar y aprender sección del panel de navegación. Luego navego a los modelos QWEN para solicitar acceso. En el Patio de recreo de chat/texto Sección del panel de navegación, puedo probar rápidamente los nuevos modelos QWEN con mis indicaciones.

Para integrar los modelos QWEN3 en mis aplicaciones, puedo usar cualquier SDK de AWS. Los SDK de AWS incluyen el acceso a Amazon Bedrock Invokemodel y Converse API. También puedo usar este modelo con cualquier marco de agente que admita Amazon Bedrock e implementar los agentes con Amazon Bedrock AgentCore. Por ejemplo, aquí está el código de Python de un agente simple con acceso a la herramienta creado usando Agentes de hilos:

from strands import Agent
from strands_tools import calculator

agent = Agent(
    model="qwen.qwen3-coder-480b-instruct-v1:0",
    tools=[calculator]
)

agent("Tell me the square root of 42 ^ 9")

with open("function.py", 'r') as f:
    my_function_code = f.read()

agent(f"Help me optimize this Python function for better performance:\n\n{my_function_code}")

Ahora disponible
Los modelos QWEN están disponibles hoy en las siguientes regiones de AWS:

QWEN3-Coder-480B-A35B-Instructo está disponible en las regiones de los EE. UU. (Oregón), Asia Pacífico (Mumbai, Tokio) y Europa (Londres, Estocolmo).
QWEN3-CODER-30B-A3B-INSTRUCT, QWEN3-235B-A22B-INSTRUCT-2507 y QWEN3-32B están disponibles en el este de los EE. UU. (N. Virginia), el oeste de los Estados Unidos (Oregón), Asia Pacific (Mumbai, Tokio), Europa (Irlanda, Londres, Milán, Stockholm), y Sudamérica (São) Regions.

Consulte la lista de región completa para obtener actualizaciones futuras. Puede comenzar a probar y construir inmediatamente sin configuración de infraestructura o planificación de capacidad. Para obtener más información, visite la página de productos Qwen en Amazon Bedrock y la página de precios de Amazon Bedrock.

Pruebe los modelos Qwen en la consola de rock de Amazon ahora y ofrezca comentarios a través de AWS Re: Publicación para Amazon Bedrock o sus canales de soporte de AWS típicos.

– Danilo

Fuente

Battlefield Redsec se está deshaciendo del Marauder Marauder tremendamente dominado de Battle Royale

ChatGPT obtiene la actualización instantánea GPT-5.3 con menos ‘vergüenza’ y menos alucinaciones

Las mejores ofertas de Nintendo Switch esta semana (3 de marzo de 2026)

Los AirPods 4 con ANC caen al precio más bajo de 2026

El paquete Story Rich Adventures de Fanatical incluye 17 increíbles juegos narrativos

Primera superficie de pruebas comparativas del iPad Air M4

Los modelos Qwen ahora están disponibles en Amazon Bedrock | Servicios web de Amazon

Resumen semanal de AWS: asociación con OpenAI, AWS Elemental Inference, Strands Labs y más (2 de marzo de 2026) | Servicios web de Amazon

AWS Security Hub Extended ofrece seguridad empresarial completa con soluciones seleccionadas de socios | Servicios web de Amazon

AWS Security Hub Extended ofrece seguridad empresarial completa con soluciones seleccionadas de socios | Servicios web de Amazon

Transforme el video en vivo para audiencias móviles con AWS Elemental Inference | Servicios web de Amazon

Resumen semanal de AWS: Claude Sonnet 4.6 en Amazon Bedrock, Kiro en las regiones de GovCloud, nuevos complementos de agentes y más (23 de febrero de 2026) | Servicios web de Amazon

Las instancias Amazon EC2 Hpc8a con procesadores AMD EPYC de quinta generación ya están disponibles | Servicios web de Amazon

Meta lanza gafas ai

Nuevas notas de parche de Borderlands 4 apuntan a los problemas de estabilidad de la PC y más