|
Hoy, me complace anunciar la disponibilidad general de Guardrails para Amazon Bedrock, que se lanzó por primera vez en versión preliminar en re: Inventar 2023. Con Guardrails para Amazon Bedrock, puede implementar salvaguardas en sus aplicaciones de inteligencia artificial generativa (IA generativa) que se personalizan según sus casos de uso y políticas de IA responsables. Puede crear múltiples barreras de seguridad adaptadas a diferentes casos de uso y aplicarlas en múltiples modelos básicos (FM), mejorando las experiencias del usuario final y estandarizando los controles de seguridad en todas las aplicaciones de IA generativa. Puede utilizar Guardrails para Amazon Bedrock con todos los modelos de lenguajes grandes (LLM) en Amazon Bedrock, incluidos los modelos optimizados.
Guardrails for Bedrock ofrece protección de seguridad líder en la industria además de las capacidades nativas de los FM, lo que ayuda a los clientes a bloquear hasta un 85 % más de contenido dañino que la protección que brindan de forma nativa algunos modelos básicos en Amazon Bedrock en la actualidad. Guardrails para Amazon Bedrock es la única capacidad de IA responsable ofrecida por un importante proveedor de nube que permite a los clientes crear y personalizar protecciones de seguridad y privacidad para sus aplicaciones de IA generativa en una única solución, y funciona con todos los modelos de lenguajes grandes (LLM) en Amazon. Bedrock, así como modelos perfeccionados.
¡Ajá! es una empresa de software que ayuda a más de 1 millón de personas a dar vida a su estrategia de producto. «Nuestros clientes dependen de nosotros todos los días para establecer objetivos, recopilar comentarios de los clientes y crear hojas de ruta visuales», dijo el Dr. Chris Waters, cofundador y director de tecnología de Aha!. “Es por eso que utilizamos Amazon Bedrock para potenciar muchas de nuestras capacidades de IA generativa. Amazon Bedrock proporciona funciones de IA responsable, que nos permiten tener control total sobre nuestra información a través de sus políticas de privacidad y protección de datos, y bloquear contenido dañino a través de Guardrails for Bedrock. Simplemente lo aprovechamos para ayudar a los gerentes de producto a descubrir información analizando los comentarios enviados por sus clientes. Este es solo el comienzo. Continuaremos basándose en la tecnología avanzada de AWS para ayudar a los equipos de desarrollo de productos de todo el mundo a priorizar con confianza qué construir a continuación”.
En la publicación de vista previa, Antje le mostró cómo usar barreras de seguridad para configurar umbrales para filtrar contenido en categorías dañinas y definir un conjunto de temas que deben evitarse en el contexto de su aplicación. La función de filtros de contenido ahora tiene dos categorías de seguridad adicionales: Mala conducta para detectar actividades delictivas y Ataque rápido para detectar intentos rápidos de inyección y jailbreak. También agregamos nuevas funciones importantes, incluidos filtros de información confidencial para detectar y redactar información de identificación personal (PII) y filtros de palabras para bloquear entradas que contengan palabras profanas y personalizadas (por ejemplo, palabras dañinas, nombres de competidores y productos).
Guardrails para Amazon Bedrock se encuentra entre la aplicación y el modelo. Guardrails evalúa automáticamente todo lo que ingresa al modelo desde la aplicación y sale del modelo hacia la aplicación para detectar y ayudar a prevenir contenido que se incluye en categorías restringidas.
Puede resumir los pasos en el blog de versión preliminar para aprender cómo configurar Temas denegados y Filtros de contenido. Déjame mostrarte cómo funcionan las nuevas funciones.
Nuevas características
Para comenzar a usar Guardrails para Amazon Bedrock, voy a la Consola de administración de AWS para Amazon Bedrock, donde puedo crear guardrails y configurar las nuevas capacidades. En el panel de navegación de la consola de Amazon Bedrock, elijo Barandillasy luego elijo Crear barandilla.
entro a la barandilla Nombre y Descripción. yo elijo Próximo para pasar a la Agregar filtros de información confidencial paso.
yo suelo Filtros de información sensible para detectar información sensible y privada en las entradas del usuario y en las salidas de FM. Según los casos de uso, puedo seleccionar un conjunto de entidades para bloquearlas en las entradas (por ejemplo, un chatbot basado en preguntas frecuentes que no requiere información específica del usuario) o redactarlas en las salidas (por ejemplo, un resumen de conversaciones basado en transcripciones de chat). El filtro de información confidencial admite un conjunto de tipos de PII predefinidos. También puedo definir entidades personalizadas basadas en expresiones regulares específicas para mi caso de uso y mis necesidades.
agrego dos tipos de información personal (Nombre, Correo electrónico) de la lista y agregue un patrón de expresión regular usando Booking ID
como Nombre y [0-9a-fA-F]{8}
como el Patrón de expresiones regulares.
yo elijo Próximo e ingresar mensajes personalizados que se mostrarán si mi barandilla bloquea la entrada o la respuesta del modelo en el Definir mensajes bloqueados paso. Reviso la configuración en el último paso y elijo Crear barandilla.
navego hasta el Página de descripción general de barandillas y elige el Claude antrópico instantáneo 1.2 modelo usando el Prueba sección. Ingreso la siguiente transcripción del centro de llamadas en el Inmediato campo y elija Correr.
Please summarize the below call center transcript. Put the name, email and the booking ID to the top:
Agent: Welcome to ABC company. How can I help you today?
Customer: I want to cancel my hotel booking.
Agent: Sure, I can help you with the cancellation. Can you please provide your booking ID?
Customer: Yes, my booking ID is 550e8408.
Agent: Thank you. Can I have your name and email for confirmation?
Customer: My name is Jane Doe and my email is [email protected]
Agent: Thank you for confirming. I will go ahead and cancel your reservation.
Acción de barandilla muestra que hay tres casos en los que las barandillas entraron en vigor. yo suelo Ver seguimiento para comprobar los detalles. Noto que la barandilla detectó el Nombre Correo Electronico y ID de reserva y los enmascaró en la respuesta final.
yo suelo Filtros de palabras bloquear entradas que contengan palabras obscenas y personalizadas (por ejemplo, nombres de competidores o palabras ofensivas). reviso el Filtrar malas palabras caja. La lista de palabras blasfemias se basa en la definición global de blasfemia. Además, puedo especificar hasta 10.000 frases (con un máximo de tres palabras por frase) para que la barrera de seguridad las bloquee. Un mensaje bloqueado mostrará si mi entrada o respuesta modelo contiene estas palabras o frases.
Ahora elijo Palabras y frases personalizadas bajo Filtros de palabras y elige Editar. yo suelo Agregar palabras y frases manualmente para agregar una palabra personalizada CompetitorY
. Alternativamente, puedo usar Subir desde un archivo local o Cargar desde objeto S3 si necesito subir una lista de frases. yo elijo Guardar y Salir para volver a mi página de barandilla.
Ingreso un mensaje que contiene información sobre una empresa ficticia y su competidor y agrego la pregunta What are the extra features offered by CompetitorY?
. yo elijo Correr.
yo suelo Ver seguimiento para comprobar los detalles. Noto que la barandilla intervino según las políticas que configuré.
Ya disponible
Guardrails para Amazon Bedrock ahora está disponible en las regiones Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón).
Para obtener información sobre precios, visite la página de precios de Amazon Bedrock.
Para comenzar con esta función, visite la página web de Guardrails for Amazon Bedrock.
Para obtener contenido técnico detallado y saber cómo nuestras comunidades de constructores utilizan Amazon Bedrock en sus soluciones, visite nuestro comunidad.aws sitio web.
GIPHY App Key not set. Please check settings