|
Hoy anunciamos el soporte para Snowflake y Amazon Athena como nuevas fuentes para colaboraciones de datos de AWS Clean Rooms. AWS Clean Rooms le ayuda a usted y a sus socios a analizar de forma más fluida y segura sus conjuntos de datos colectivos sin compartir ni copiar los datos subyacentes de otros. Esta mejora le ayuda a colaborar con conjuntos de datos almacenados en Snowflake o aquellos que se pueden consultar a través de funciones de Athena, como los permisos de AWS Lake Formation o las vistas de AWS Glue Data Catalog, sin mover ni revelar los datos de origen.
A menudo es necesario colaborar con socios para analizar conjuntos de datos y obtener información para investigación y desarrollo, inversiones o campañas de marketing y publicidad. En algunos casos, los conjuntos de datos de sus socios se almacenan o administran fuera de Amazon Simple Storage Service (Amazon S3) y las empresas desean reducir o eliminar la complejidad, el costo, los riesgos de cumplimiento y los retrasos asociados con el movimiento o la copia de datos. Las empresas también descubren que copiar datos puede hacer que utilicen información desactualizada, lo que podría reducir la calidad de los conocimientos adquiridos.
Este lanzamiento ayuda a las empresas a colaborar en los conjuntos de datos colectivos más actualizados en una colaboración de AWS Clean Rooms con extracción, transformación y carga cero (ETL cero). Esto elimina el costo y la complejidad asociados con la migración de conjuntos de datos fuera de entornos existentes. Por ejemplo, un anunciante con datos almacenados en Amazon S3 y un editor de medios con datos almacenados en Snowflake pueden ejecutar un análisis de superposición de audiencia para determinar el porcentaje de usuarios presentes en sus conjuntos de datos colectivos sin tener que crear canales de datos ETL ni compartir datos subyacentes con unos y otros. No se almacena permanentemente ningún dato subyacente de fuentes de datos externas en AWS Clean Rooms durante el proceso de colaboración y cualquier dato leído temporalmente en el entorno de análisis de AWS Clean Rooms se elimina al finalizar la consulta. Ahora puede trabajar con sus socios independientemente de dónde estén almacenados sus datos, lo que agiliza el proceso de generación de conocimientos.
Déjame mostrarte cómo utilizar esta función.
Cómo utilizar múltiples nubes y fuentes de datos en AWS Clean Rooms
Para demostrar esta característica, utilizo un escenario entre un anunciante, la empresa A, y un editor, la empresa B. La empresa A quiere saber a cuántos de sus usuarios de alto valor se puede llegar en el sitio web de la empresa B antes de ejecutar una campaña publicitaria. La empresa A almacena sus datos en Amazon S3. La empresa B almacena sus datos en Snowflake. Para utilizar AWS Clean Rooms, ambas partes deben tener sus propias cuentas de AWS.
En esta demostración, la empresa A, el anunciante, es el creador de la colaboración. La empresa A crea la colaboración de AWS Clean Rooms e invita a la empresa B, que tiene datos alojados en Snowflake, a colaborar. Puede seguir los pasos específicos para crear una colaboración en la publicación del blog del anuncio de disponibilidad general de AWS Clean Rooms.
A continuación, muestro cómo la empresa B, el editor, crea una tabla configurada en AWS Clean Rooms, especificando Snowflake como fuente de datos y proporcionando el nombre de recurso de Amazon (ARN) de Secrets Manager. AWS Secrets Manager lo ayuda a administrar, recuperar y rotar secretos, como las credenciales de bases de datos, a lo largo de sus ciclos de vida. Su secreto debe contener las credenciales de un usuario de Snowflake con permiso de solo lectura para los datos con los que desea colaborar. AWS Clean Rooms lo utilizará para leer su secreto y acceder a los datos almacenados en Snowflake. Consulte la documentación de Secrets Manager para obtener instrucciones paso a paso para crear su secreto.
Usando la cuenta de AWS de la empresa B, voy a la consola de AWS Clean Rooms y selecciono Mesas bajo Recursos configurados. yo elijo Configurar nueva tabla. yo elijo Copo de nieve bajo Nubes y fuentes de datos de terceros. entro al ARN secreto para el secreto que contiene las credenciales de Snowflake para un rol con acceso de lectura al conjunto de datos almacenado en Snowflake con el que quiero colaborar. Estas son las credenciales que utiliza para verificar la identidad de la entidad que intenta acceder a la tabla y al esquema de Snowflake. Si no tiene un ARN secreto, puede crear un nuevo secreto usando el Almacenar un nuevo secreto para esta tabla. opción.
Para definir el tdetalles de esquema y capacidadyo uso el Importar desde archivo y elija el archivo CSV del esquema de información de vista de columnas que exporté desde Snowflake para completar la información por mí. También puede ingresar la información manualmente.
Para esta demostración, elijo Todas las columnas bajo el Columnas permitidas en colaboraciones.. A continuación elijo Configurar nueva tabla.
Voy a la tabla configurada y observo los detalles de la tabla, como las cuentas de AWS permitidas para crear consultas y las columnas disponibles para realizar consultas. En esta página, puedo editar el nombre de la tabla, la descripción y la regla de análisis.
Como parte de la configuración de una tabla para usar en AWS Clean Rooms para el análisis de colaboración, necesito configurar una regla de análisis. Una regla de análisis es un control de mejora de la privacidad que cada propietario de datos configura en una tabla configurada. Una regla de análisis determina cómo se puede analizar la tabla configurada. yo elijo Configurar regla de análisis para configurar una regla de análisis personalizada que permita ejecutar consultas personalizadas en la tabla configurada.
En el Paso 1, procedo con las selecciones. puedes usar editor JSON para crear, pegar o importar una definición de regla de análisis en formato JSON. yo elijo Próximo.
En el paso 2, elijo Permitir que cualquier consulta creada por colaboradores específicos se ejecute sin revisión en esta tabla bajo Análisis para consulta directa.. Con esta opción, solo se pueden ejecutar en la tabla las consultas proporcionadas por las cuentas de AWS que especifico en la lista de cuentas permitidas. Todas las plantillas de análisis creadas por las cuentas permitidas podrán ejecutarse automáticamente en esta tabla sin requerir una revisión. Elijo la cuenta permitida en ID de cuenta de AWS y elige Próximo.
En el Paso 3, procedo con las selecciones. yo elijo Ninguno bajo Columnas no permitidas en la salida para permitir que todas las columnas se muestren en el resultado de la consulta. yo elijo No permitido bajo Análisis adicionales aplicados a la producción.por lo que no se pueden ejecutar análisis adicionales en esta tabla. yo elijo Próximo.
En el paso final, reviso la configuración y elijo Configurar regla de análisis.
A continuación, asocio la tabla con la colaboración Empresa A, el anunciante, creada usando Asociado a la colaboración.
En la ventana emergente, elijo una colaboración entre las que tienen membresías activas y selecciono Elige la colaboración.
En la página siguiente, elijo el Nombre de la tabla configurada y entrar en el Nombre bajo Detalles de asociaciones de tablas. Elijo un método para autorizar a AWS Clean Rooms a otorgar permiso para consultar la tabla. yo elijo tabla de asociados.
La empresa A, el anunciante, y la empresa B, el editor, ahora pueden ejecutar un análisis de superposición de audiencia para determinar el porcentaje de usuarios presentes en sus conjuntos de datos colectivos sin acceder a los datos sin procesar de cada uno. El análisis ayuda a determinar a qué proporción de la audiencia del anunciante puede llegar el editor. Al evaluar la superposición, los anunciantes pueden determinar si el editor proporciona un alcance único o si la audiencia del editor se superpone predominantemente con la audiencia existente del anunciante, sin que ninguna de las partes tenga que moverse o compartir sus datos de origen. Cambio a la cuenta de la empresa A y voy a la consola de AWS Clean Rooms. Elijo la colaboración que creé y ejecuto la siguiente consulta para obtener el resultado del análisis de superposición de audiencia:
select count (distinct emailaddress)
from customer_data_example as advertiser
inner join synthetic_customer_data as publisher
on 'emailaddress' = 'publisher_hashed_email_address'
En este ejemplo, utilicé Snowflake como fuente de datos. También puede ejecutar consultas sobre estos datos utilizando Athena mientras sigue los permisos de AWS Lake Formation. Esto le ayuda a realizar filtrado a nivel de filas y columnas con el control de acceso detallado de Lake Formation y a transformar datos mediante las vistas de AWS Glue Data Catalog antes de que los conjuntos de datos se asocien a la colaboración.
Voces de clientes y socios
«La seguridad y la privacidad de los datos son esenciales para nuestro trabajo en Kinective Media de United Airlines, la primera red de medios para viajeros del mundo», dijo Khatidja Ajania, directora de asociaciones estratégicas, Kinective Media de United Airlines. “El soporte de AWS Clean Rooms para datos de origen en múltiples nubes y fuentes de AWS nos permite trabajar de forma segura y sin problemas con más marcas para ofrecer mediciones de circuito cerrado y otros casos de uso clave. Esta mejora nos facilitará la entrega segura de experiencias personalizadas, contenido y ofertas relevantes a millones de viajeros de United a través de una colaboración con privacidad mejorada con nuestros anunciantes y socios”.
“Snowflake reconoce los desafíos de la interoperabilidad de los datos de origen entre pilas de tecnología cuando se utiliza tecnología de sala limpia de datos; Estamos entusiasmados de ver el progreso y un paso más hacia un objetivo compartido para capacitar a los usuarios para desbloquear todo el potencial de sus asociaciones de datos a través de la solución de su elección, de forma segura y efectiva”. Kamakshi Sivaramakrishnan, director general, salas limpias de Snowflake Data
Ahora disponible
La compatibilidad con Snowflake y Athena como fuentes de datos en AWS Clean Rooms ofrece importantes beneficios para la colaboración entre nubes. Este lanzamiento elimina la necesidad de mover datos a través de nubes y fuentes de datos y simplifica el proceso de colaboración. Este es un primer paso en nuestros esfuerzos por ampliar las formas en que los clientes pueden colaborar de forma segura con cualquiera de sus socios y al mismo tiempo proteger la información confidencial, independientemente de dónde se almacenen sus datos.
Comience a utilizar AWS Clean Rooms hoy. Para obtener más información sobre cómo colaborar con múltiples fuentes de datos, visite la documentación de AWS Clean Rooms.
GIPHY App Key not set. Please check settings