|
En marzo, Amazon Web Services (AWS) se convirtió en el primer proveedor de servicios en la nube en entregar Deepseek-R1 de una manera sin servidor al iniciarlo como un modelo totalmente administrado y generalmente disponible en Amazon Bedrock. Desde entonces, los clientes han utilizado las capacidades de Deepseek-R1 a través de Amazon Bedrock para construir aplicaciones generativas de IA, beneficiándose de las sólidas barandillas de la roca y las herramientas integrales para una implementación de IA segura.
Hoy, estoy emocionado de anunciar Deepseek-V3.1 ahora está disponible como modelo de base totalmente administrado en Amazon Bedrock. Deepseek-V3.1 es un modelo de peso abierto híbrido que cambia entre el modo de pensamiento (razonamiento de la cadena de pensamiento) para el análisis detallado paso a paso y el modo no pensativo (respuestas directas) para respuestas más rápidas.
De acuerdo a VeteranoEl modo de pensamiento de Deepseek-V3.1 logra una calidad de respuesta comparable con mejores resultados, un razonamiento de varios pasos más fuerte para tareas de búsqueda complejas y grandes ganancias en la eficiencia de pensamiento en comparación con Deepseek-R1-0528.
Puntos de referencia | Deepseek-v3.1 | Deepseek-r1-0528 |
---|---|---|
Navegación | 30.0 | 8.9 |
Browsecomp_zh | 49.2 | 35.7 |
HLE | 29.8 | 24.8 |
xbench-DeepSearch | 71.2 | 55.0 |
Marcos | 83.7 | 82.0 |
Simpleqa | 93.4 | 92.3 |
Sellar | 42.6 | 29.7 |
Swe-Bench Verificado | 66.0 | 44.6 |
Swe-Bench Multilingüe | 54.5 | 30.5 |
Terminal | 31.3 | 5.7 |
Deepseek-V3.1 El rendimiento del modelo en el uso de la herramienta y las tareas de los agentes ha mejorado significativamente a través de la optimización posterior al entrenamiento en comparación con los modelos anteriores de Deepseek. Deepseek-V3.1 también admite más de 100 idiomas con competencia casi nativa, incluida una capacidad significativamente mejorada en idiomas de baja recursos que carecen de grandes corpus monolingües o paralelos. Puede construir aplicaciones globales para ofrecer una precisión mejorada y alucinaciones reducidas en comparación con los modelos anteriores de Deepseek, al tiempo que mantiene la visibilidad en su proceso de toma de decisiones.
Estos son sus casos de uso clave utilizando este modelo:
- Generación de código -Deepseek-V3.1 sobresale en las tareas de codificación con mejoras en los puntos de referencia de ingeniería de software y las capacidades de agentes de código, lo que lo hace ideal para la generación automatizada de código, la depuración y los flujos de trabajo de ingeniería de software. Se desempeña bien en la codificación de puntos de referencia al tiempo que ofrece resultados de alta calidad de manera eficiente.
- Herramientas de IA de agente -El modelo presenta una herramienta mejorada que llama a través de la optimización posterior al entrenamiento, lo que lo hace fuerte en el uso de la herramienta y los flujos de trabajo de agente. Admite llamadas de herramientas estructuradas, agentes de código y agentes de búsqueda, posicionándola como una opción sólida para construir sistemas de IA autónomos.
- Aplicaciones empresariales – Los modelos Deepseek se integran en varias plataformas de chat y herramientas de productividad, mejorando las interacciones del usuario y admitiendo flujos de trabajo de servicio al cliente. Las capacidades multilingües y la sensibilidad cultural del modelo lo hacen adecuado para aplicaciones empresariales globales.
Como mencioné en mi publicación anterior, al implementar modelos disponibles públicamente, considere cuidadosamente los requisitos de privacidad de los datos al implementar en sus entornos de producción, verificar el sesgo en la salida y monitorear sus resultados en términos de seguridad de datos, IA responsable y evaluación del modelo.
Puede acceder a las características de seguridad de grado empresarial de Amazon Bedrock e implementar salvaguardas personalizadas para los requisitos de su aplicación y las políticas de IA responsables con las barandillas de roca madre de Amazon. También puede evaluar y comparar modelos para identificar el modelo óptimo para sus casos de uso mediante el uso de herramientas de evaluación del modelo de roca madre de Amazon.
Comience con el modelo Deepseek-V3.1 en Amazon Bedrock
Si eres nuevo en usar el modelo Deepseek-V3.1, vaya a la consola de rock de Amazon, elija Acceso modelo bajo Configuraciones de roca madre En el panel de navegación izquierda. Para acceder al modelo de Deepseek-V3.1 totalmente administrado, solicite acceso a Deepseek-v3.1 en el Veterano sección. Luego se le otorgará acceso al modelo en Amazon Bedrock.
A continuación, para probar el modelo Deepseek-V3.1 en Amazon Bedrock, elija Chat/texto bajo Parques infantiles En el panel del menú izquierdo. Luego elija Modelo seleccionado en la esquina superior izquierda y seleccionar Veterano como la categoría y Deepseek-v3.1 como el modelo. Luego elija Aplicar.
Usando el seleccionado Deepseek-v3.1 Modelo, ejecuto el siguiente ejemplo pronta sobre decisión de arquitectura técnica.
Outline the high-level architecture for a scalable URL shortener service like bit.ly. Discuss key components like API design, database choice (SQL vs. NoSQL), how the redirect mechanism works, and how you would generate unique short codes.
Puedes encender y apagar el pensamiento alternando Razonamiento modelo modo para generar la cadena de pensamiento de una respuesta antes de la conclusión final.
También puede acceder al modelo utilizando la interfaz de línea de comando AWS (AWS CLI) y AWS SDK. Este modelo admite ambos InvokeModel
y Converse
API. Puede consultar una amplia gama de ejemplos de código para múltiples casos de uso y una variedad de lenguajes de programación.
Para obtener más información, visite los parámetros y respuestas de inferencia del modelo Deepseek en la documentación de AWS.
Ahora disponible
Deepseek-V3.1 ahora está disponible en el oeste de los EE. UU. (Oregón), Asia Pacífico (Tokio), Asia Pacífico (Mumbai), Europa (Londres) y Europa (Estocolmo) regiones AWS. Consulte la lista de región completa para obtener actualizaciones futuras. Para obtener más información, consulte la página de productos Deepseek en Amazon Bedrock y la página de precios de Amazon Bedrock.
Prueba el modelo Deepseek-V3.1 en la consola de rock de Amazon hoy y envía comentarios a AWS Re: Publicación para Amazon Bedrock o a través de sus contactos habituales de soporte de AWS.
– Canal