|
|
Hoy anunciamos Optimización rápida avanzada de Amazon Bedrockuna nueva herramienta que puede utilizar para optimizar sus indicaciones para cualquier modelo en Amazon Bedrock, mientras compara sus indicaciones originales con indicaciones optimizadas en hasta 5 modelos simultáneamente. Con la nueva optimización rápida, puede migrar a un nuevo modelo o mejorar el rendimiento de su modelo actual. Puede probarlos para asegurarse de que no vean regresiones en casos de uso conocidos y también mejorar las tareas de bajo rendimiento.

El nuevo optimizador de mensajes incorpora su plantilla de mensajes, ejemplos de entradas del usuario para los valores de las variables, respuestas reales y una métrica de evaluación para usar como guía. Incluso puedes usar esto con entradas de usuario multimodales: admite png, jpgy pdf como entradas a sus plantillas de mensajes para que pueda optimizar los mensajes para tareas como el análisis de documentos e imágenes.
También puede proporcionar una función AWS Lambda, una rúbrica de LLM como juez o una breve descripción en lenguaje natural para guiar la optimización. El optimizador de avisos funciona en un ciclo de retroalimentación basado en métricas para optimizar las respuestas del modelo de aviso y resultante para la métrica de evaluación, y genera las plantillas de aviso originales y finales con puntuaciones de evaluación, estimaciones de costos y latencia.
Bedrock Advanced Prompt Optimization en acción
Para comenzar con la nueva optimización rápida, elija Crear optimización rápida en el Optimización de avisos avanzada página de la consola Amazon Bedrock.

Elija hasta 5 modelos de inferencia para optimizar sus indicaciones. Puede utilizar esto si está migrando a un nuevo modelo o simplemente desea obtener un mejor rendimiento en su modelo actual. Si está cambiando de modelo, puede seleccionar su modelo actual como base y hasta 4 modelos más. Si no está cambiando de modelo, simplemente seleccione su modelo actual para ver antes y después de la optimización.

Debe preparar sus plantillas de mensajes en formato JSONL con datos de usuario de ejemplo, respuestas reales y una métrica de evaluación o una guía de reescritura. Para .jsonl archivos, cada objeto JSON debe estar en una sola línea.
{
"version": "bedrock-2026-05-14", // required; Fixed value
"templateId": "string", // required
"promptTemplate": "string", // required
"steeringCriteria": ["string"], // optional
"customEvaluationMetricLabel": "string", // required if customLLMJConfig or evaluationMetricLambdaArn is used
"customLLMJConfig": { // optional
"customLLMJPrompt": "string", // required if customLLMJConfig present
"customLLMJModelId": "string" // required if customLLMJConfig present
},
"evaluationMetricLambdaArn": "string", // optional
"evaluationSamples": [ // required
{
"inputVariables": [ // required
{
"variableName1": "string",
"variableName2": "string"
}
],
"referenceResponse": "string" // optional
"inputVariablesMultimodal": [ // optional
{
"Arbitrary_Name": { // required for your multimodal variable.
"type": "string", // choose from "PDF" or "IMAGE". Acceptable filetypes for IMAGE = png, jpg,
"s3Uri": "string" // input the S3 path of the file
}
]
}
]
}
Puede cargar archivos directamente o importar plantillas de avisos desde Amazon Simple Storage Service (Amazon S3) y establecer una ubicación de salida de S3 donde se almacenarán los resultados de optimización y los datos de evaluación de los avisos. Luego, elige Crear optimización.
Amazon Bedrock envía automáticamente sus plantillas de mensajes y datos de ejemplo con datos reales opcionales a sus modelos de inferencia, evalúa las respuestas con su métrica de evaluación y luego reescribe el mensaje en un ciclo de retroalimentación para optimizarlo para sus modelos de inferencia. Verá los resultados de la evaluación según la métrica proporcionada y las indicaciones finales optimizadas.

Como señaló, puede evaluar la calidad de las indicaciones de tres maneras: una función Lambda con su propia lógica de puntuación de Python, LLM como juez con una rúbrica personalizada o criterios de dirección en lenguaje natural. Puede elegir simplemente una por plantilla de aviso, pero puede crear varias plantillas de aviso en un trabajo, de modo que puedan usar un método diferente para cada plantilla de aviso si así lo desean.
- función lambda — Si tiene una métrica concreta (precisión, F1, precisión de ejecución, coincidencia de JSON estructurado, etc.), puede implementar una función Lambda que contenga su lógica de puntuación personalizada y configurarla.
evaluationMetricS3Uricampo de la plantilla de solicitud. Dentro de Lambda, el núcleo es una implementación de cálculo_score que compara mediante programación los resultados del modelo con las respuestas de referencia. - LLM como juez — Si su tarea es abierta (resumen, generación, explicaciones de razonamiento) y desea una puntuación basada en rúbricas, puede configurar el archivo de configuración de S3 en el
customLLMJConfigcampo de la plantilla de solicitud para definir métricas nombradas con instrucciones estructuradas y una escala de calificación. Un modelo de juez Bedrock evalúa cada par de respuesta rápida y devuelve una puntuación con razonamiento. El modelo predeterminado es Claude Sonnet 4.6 y también puedes seleccionar el tuyo propio de una lista de modelos de jueces. - Criterios de dirección — Si conoce las cualidades que desea (voz de la marca, formato, restricciones de seguridad) pero no desea crear un mensaje de juez completo, puede definir criterios en el conjunto de datos de entrada a través del
steeringCriteriamatriz de la plantilla de solicitud. En lugar de métricas estructuradas con escalas de calificación, usted proporciona criterios de lenguaje natural de forma libre que el juez de LLM evalúa de manera integral. Si utiliza esta opción, un mensaje predeterminado de LLM como juez evaluará las respuestas e incorporará sus criterios de dirección en el mensaje del juez. El modelo de juez en este caso es Anthropic Claude Sonnet 4.6.
Para obtener más información sobre cómo utilizar la migración y la optimización avanzada de mensajes, visite la guía de optimización avanzada de mensajes en Bedrock y la códigos de muestra en Github.
Ahora disponible
Amazon Bedrock Advanced Prompt Optimization está disponible hoy en las regiones de EE. UU. Este (Norte de Virginia, Ohio), EE. UU. Oeste (Oregón), Asia Pacífico (Mumbai, Seúl, Singapur, Sídney, Tokio), Canadá (Central), Europa (Frankfurt, Irlanda, Londres, Zurich) y América del Sur (São Paulo). Se le cobra en función de los tokens de inferencia del modelo de Bedrock consumidos durante la optimización, a las mismas tarifas por token que la inferencia de Bedrock normal. Para obtener más información, visite la página de precios de Amazon Bedrock.
Pruebe la optimización avanzada de avisos en la consola de Amazon Bedrock o con CreateAdvancedPromptOptimizationJob API hoy y envíe comentarios a AWS re: Publicación para Amazon Bedrock o a través de sus contactos habituales de AWS Support.
— chany
