|
Con las bases de conocimiento para Amazon Bedrock, los modelos de base (FM) y los agentes pueden recuperar información contextual de las fuentes de datos privadas de su empresa para la generación aumentada de recuperación (RAG). RAG ayuda a los FM a brindar respuestas más relevantes, precisas y personalizadas.
Durante los últimos meses, hemos agregado continuamente opciones de incrustación de modelos, tiendas de vectores y FM a las Bases de conocimiento.
Hoy, me complace compartir que, además de Amazon Simple Storage Service (Amazon S3), ahora puedes conectar tus dominios web, Confluence, Salesforce y SharePoint como fuentes de datos a tus aplicaciones RAG (en vista previa).
Nuevos conectores de fuentes de datos para dominios web, Confluence, Salesforce y SharePoint
Al incluir sus dominios web, puede dar a sus aplicaciones RAG acceso a sus datos públicos, como las fuentes de redes sociales de su empresa, para mejorar la relevancia, la puntualidad y la exhaustividad de las respuestas a las entradas de los usuarios. Con los nuevos conectores, ahora puede agregar las fuentes de datos de su empresa existentes en Confluence, Salesforce y SharePoint a sus aplicaciones RAG.
Permítame mostrarle cómo funciona esto. En los siguientes ejemplos, utilizaré el rastreador web para agregar un dominio web y conectar Confluence como fuente de datos a una base de conocimiento. La conexión de Salesforce y SharePoint como fuentes de datos sigue un patrón similar.
Agregar un dominio web como fuente de datos
Para probarlo, diríjase a la consola de Amazon Bedrock y cree una base de conocimientos. Proporcione los detalles de la base de conocimientos, incluidos el nombre y la descripción, y cree un nuevo rol de servicio o utilice uno existente con los permisos de AWS Identity and Access Management (IAM) pertinentes.
Luego, elige la fuente de datos que deseas utilizar. Selecciono Rastreador web.
En el siguiente paso, configuro el rastreador web. Ingreso un nombre y una descripción para la fuente de datos del rastreador web. Luego, defino las URL de origen. Para esta demostración, agrego la URL de la página de autor de mi blog de noticias de AWS que incluye todas mis publicaciones. Puede agregar hasta diez URL iniciales o de punto de partida de los sitios web que desea rastrear.
De manera opcional, puede configurar ajustes de cifrado personalizados y la política de eliminación de datos que define si los datos del almacén de vectores se conservarán o eliminarán cuando se elimine la fuente de datos. Mantengo la configuración avanzada predeterminada.
En la sección de alcance de sincronización, puede configurar el nivel de dominios de sincronización que desea usar, la cantidad máxima de URL a rastrear por minuto y patrones de expresiones regulares para incluir o excluir determinadas URL.
Una vez que haya terminado con la configuración de la fuente de datos del rastreador web, complete la configuración de la base de conocimientos seleccionando un modelo de incrustaciones y configurando el almacén de vectores de su elección. Puede consultar los detalles de la base de conocimientos después de la creación para supervisar el estado de sincronización de la fuente de datos. Una vez que se complete la sincronización, puede probar la base de conocimientos y ver las respuestas de FM con las URL web como citas.
Para crear fuentes de datos mediante programación, puede utilizar la interfaz de línea de comandos de AWS (AWS CLI) o los SDK de AWS. Para ver ejemplos de código, consulte la Guía del usuario de Amazon Bedrock.
Conecte Confluence como fuente de datos
Ahora, seleccionemos Confluence como fuente de datos en la configuración de la base de conocimiento.
Para configurar Confluence como fuente de datos, proporciono nuevamente un nombre y una descripción para la fuente de datos, elijo el método de alojamiento e ingreso la URL de Confluence.
Para conectarse a Confluence, puede elegir entre la autenticación básica y OAuth 2.0. Para esta demostración, elegí Autenticación de baseque espera un nombre de usuario (la dirección de correo electrónico de su cuenta de usuario de Confluence) y una contraseña (token de API de Confluence). Guardo las credenciales pertinentes en AWS Secrets Manager y elijo el secreto.
Nota:Asegúrese de que el nombre del secreto comience con “AmazonBedrock-” y que su rol de servicio IAM para Bases de conocimiento tenga permisos para acceder a este secreto en Secrets Manager.
En la configuración de metadatos, puede controlar el alcance del contenido que desea rastrear utilizando patrones de inclusión y exclusión de expresiones regulares y configurar la estrategia de fragmentación y análisis de contenido.
Una vez que haya terminado con la configuración de la fuente de datos de Confluence, complete la configuración de la base de conocimiento seleccionando un modelo de incorporaciones y configurando el almacén de vectores de su elección.
Puede consultar los detalles de la base de conocimientos después de la creación para supervisar el estado de sincronización de la fuente de datos. Una vez completada la sincronización, puede probar la base de conocimientos. Para esta demostración, he añadido algunas notas de reuniones ficticias a mi espacio de Confluence. ¡Preguntemos sobre los elementos de acción de una de las reuniones!
Para obtener instrucciones sobre cómo conectar Salesforce y SharePoint como fuente de datos, consulte la Guía del usuario de Amazon Bedrock.
Cosas que saber
- Filtros de inclusión y exclusión – Todas las fuentes de datos admiten filtros de inclusión y exclusión para que pueda tener un control granular sobre qué datos se rastrean de una fuente determinada.
- Rastreador web – Recuerde que solo debe utilizar el rastreador web en sus propias páginas web o en páginas web que tenga autorización para rastrear.
Ya disponible
Los nuevos conectores de fuentes de datos están disponibles hoy en todas las regiones de AWS donde se encuentra disponible Knowledge Bases for Amazon Bedrock. Consulte la lista de regiones para obtener más información y actualizaciones futuras. Para obtener más información sobre Knowledge Bases, visite la página de productos de Amazon Bedrock. Para obtener información sobre precios, consulte la página de precios de Amazon Bedrock.
Pruebe hoy mismo los nuevos conectores de fuentes de datos en la consola de Amazon Bedrock y envíe sus comentarios a AWS re:Post para Amazon Bedrock o a través de sus contactos habituales de AWS, e interactúe con la comunidad de desarrolladores de IA generativa en comunidad.aws.
— Hormiga
GIPHY App Key not set. Please check settings