Amazon Bedrock presenta una nueva herramienta avanzada de migración y optimización rápida | Servicios web de Amazon

Hoy anunciamos Optimización rápida avanzada de Amazon Bedrockuna nueva herramienta que puede utilizar para optimizar sus indicaciones para cualquier modelo en Amazon Bedrock, mientras compara sus indicaciones originales con indicaciones optimizadas en hasta 5 modelos simultáneamente. Con la nueva optimización rápida, puede migrar a un nuevo modelo o mejorar el rendimiento de su modelo actual. Puede probarlos para asegurarse de que no vean regresiones en casos de uso conocidos y también mejorar las tareas de bajo rendimiento.

El nuevo optimizador de mensajes incorpora su plantilla de mensajes, ejemplos de entradas del usuario para los valores de las variables, respuestas reales y una métrica de evaluación para usar como guía. Incluso puedes usar esto con entradas de usuario multimodales: admite png, jpgy pdf como entradas a sus plantillas de mensajes para que pueda optimizar los mensajes para tareas como el análisis de documentos e imágenes.

También puede proporcionar una función AWS Lambda, una rúbrica de LLM como juez o una breve descripción en lenguaje natural para guiar la optimización. El optimizador de avisos funciona en un ciclo de retroalimentación basado en métricas para optimizar las respuestas del modelo de aviso y resultante para la métrica de evaluación, y genera las plantillas de aviso originales y finales con puntuaciones de evaluación, estimaciones de costos y latencia.

Bedrock Advanced Prompt Optimization en acción

Para comenzar con la nueva optimización rápida, elija Crear optimización rápida en el Optimización de avisos avanzada página de la consola Amazon Bedrock.

Elija hasta 5 modelos de inferencia para optimizar sus indicaciones. Puede utilizar esto si está migrando a un nuevo modelo o simplemente desea obtener un mejor rendimiento en su modelo actual. Si está cambiando de modelo, puede seleccionar su modelo actual como base y hasta 4 modelos más. Si no está cambiando de modelo, simplemente seleccione su modelo actual para ver antes y después de la optimización.

Debe preparar sus plantillas de mensajes en formato JSONL con datos de usuario de ejemplo, respuestas reales y una métrica de evaluación o una guía de reescritura. Para .jsonl archivos, cada objeto JSON debe estar en una sola línea.

{
    "version": "bedrock-2026-05-14",           // required; Fixed value
    "templateId": "string",                    // required
    "promptTemplate": "string",                // required
    "steeringCriteria": ["string"],            // optional
    "customEvaluationMetricLabel": "string",   // required if customLLMJConfig or evaluationMetricLambdaArn is used
    "customLLMJConfig": {                      // optional
        "customLLMJPrompt": "string",          // required if customLLMJConfig present
        "customLLMJModelId": "string"          // required if customLLMJConfig present
    },
    "evaluationMetricLambdaArn": "string",     // optional
    "evaluationSamples": [                     // required
        {
            "inputVariables": [                // required
                {
                    "variableName1": "string",
                    "variableName2": "string"
                }
            ],
            "referenceResponse": "string"      // optional
            "inputVariablesMultimodal": [      // optional
                {
                "Arbitrary_Name": {            // required for your multimodal variable.
                    "type": "string",          // choose from "PDF" or "IMAGE". Acceptable filetypes for IMAGE = png, jpg,  
                    "s3Uri": "string"          // input the S3 path of the file
                }
            ]
        }
    ]
}

Puede cargar archivos directamente o importar plantillas de avisos desde Amazon Simple Storage Service (Amazon S3) y establecer una ubicación de salida de S3 donde se almacenarán los resultados de optimización y los datos de evaluación de los avisos. Luego, elige Crear optimización.

Amazon Bedrock envía automáticamente sus plantillas de mensajes y datos de ejemplo con datos reales opcionales a sus modelos de inferencia, evalúa las respuestas con su métrica de evaluación y luego reescribe el mensaje en un ciclo de retroalimentación para optimizarlo para sus modelos de inferencia. Verá los resultados de la evaluación según la métrica proporcionada y las indicaciones finales optimizadas.

Como señaló, puede evaluar la calidad de las indicaciones de tres maneras: una función Lambda con su propia lógica de puntuación de Python, LLM como juez con una rúbrica personalizada o criterios de dirección en lenguaje natural. Puede elegir simplemente una por plantilla de aviso, pero puede crear varias plantillas de aviso en un trabajo, de modo que puedan usar un método diferente para cada plantilla de aviso si así lo desean.

función lambda — Si tiene una métrica concreta (precisión, F1, precisión de ejecución, coincidencia de JSON estructurado, etc.), puede implementar una función Lambda que contenga su lógica de puntuación personalizada y configurarla. evaluationMetricS3Uri campo de la plantilla de solicitud. Dentro de Lambda, el núcleo es una implementación de cálculo_score que compara mediante programación los resultados del modelo con las respuestas de referencia.
LLM como juez — Si su tarea es abierta (resumen, generación, explicaciones de razonamiento) y desea una puntuación basada en rúbricas, puede configurar el archivo de configuración de S3 en el customLLMJConfig campo de la plantilla de solicitud para definir métricas nombradas con instrucciones estructuradas y una escala de calificación. Un modelo de juez Bedrock evalúa cada par de respuesta rápida y devuelve una puntuación con razonamiento. El modelo predeterminado es Claude Sonnet 4.6 y también puedes seleccionar el tuyo propio de una lista de modelos de jueces.
Criterios de dirección — Si conoce las cualidades que desea (voz de la marca, formato, restricciones de seguridad) pero no desea crear un mensaje de juez completo, puede definir criterios en el conjunto de datos de entrada a través del steeringCriteria matriz de la plantilla de solicitud. En lugar de métricas estructuradas con escalas de calificación, usted proporciona criterios de lenguaje natural de forma libre que el juez de LLM evalúa de manera integral. Si utiliza esta opción, un mensaje predeterminado de LLM como juez evaluará las respuestas e incorporará sus criterios de dirección en el mensaje del juez. El modelo de juez en este caso es Anthropic Claude Sonnet 4.6.

Para obtener más información sobre cómo utilizar la migración y la optimización avanzada de mensajes, visite la guía de optimización avanzada de mensajes en Bedrock y la códigos de muestra en Github.

Ahora disponible

Amazon Bedrock Advanced Prompt Optimization está disponible hoy en las regiones de EE. UU. Este (Norte de Virginia, Ohio), EE. UU. Oeste (Oregón), Asia Pacífico (Mumbai, Seúl, Singapur, Sídney, Tokio), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Zurich) y América del Sur (São Paulo). Se le cobra en función de los tokens de inferencia del modelo de Bedrock consumidos durante la optimización, a las mismas tarifas por token que la inferencia de Bedrock normal. Para obtener más información, visite la página de precios de Amazon Bedrock.

Pruebe la optimización avanzada de avisos en la consola de Amazon Bedrock o con CreateAdvancedPromptOptimizationJob API hoy y envíe comentarios a AWS re: Publicación para Amazon Bedrock o a través de sus contactos habituales de AWS Support.

— chany

Fuente

Esta nueva cámara llavero de $ 30 llega para Kodak Charmera con una pantalla abatible para selfies

La revolución de la IA viene con un impuesto oculto

Nuevos datos de suscripción y compras dentro de la aplicación ahora disponibles en Analytics – Últimas noticias – Desarrollador de Apple

Samsung destaca el ecosistema abierto para acelerar la atención conectada para el bienestar diario en VivaTech 2026

Las ofertas de Apple Watch que vale la pena comprar antes de que comience Prime Day

Los AirPods Pro 3 vuelven a un precio récord mínimo de $ 169 antes del Prime Day

Amazon Bedrock presenta una nueva herramienta avanzada de migración y optimización rápida | Servicios web de Amazon

AWS Security Agent agrega modelado de amenazas, Kiro power y el complemento Claude Code, y más | Servicios web de Amazon

Amazon ECS presenta nuevas métricas de alta resolución para un escalado automático de servicios más rápido | Servicios web de Amazon

Anuncio de instancias Amazon EC2 G7 aceleradas por las GPU NVIDIA RTX PRO 4500 Blackwell Server Edition | Servicios web de Amazon

AWS DevOps Agent agrega capacidades de administración de versiones para evaluar los cambios de código antes de la producción (vista previa) | Servicios web de Amazon

Reduzca proactivamente la deuda tecnológica de forma autónoma con AWS Transform: modernización continua (vista previa) | Servicios web de Amazon

Anuncio de búsqueda web en Amazon Bedrock AgentCore: conecte a sus agentes de inteligencia artificial con conocimientos web actuales y precisos | Servicios web de Amazon

Próximos cambios en las clasificaciones por edad en Australia y Vietnam – Últimas noticias – Desarrollador de Apple

Revisión de HONOR 600 Pro: la bestia de la batería se encuentra con la magia de la IA – Coolsmartphone