|
Las organizaciones modernas administran datos en múltiples sistemas desconectados (bases de datos estructuradas, archivos no estructurados y herramientas de visualización separadas) que crean barreras que ralentizan flujos de trabajo de análisis y limitan la generación de información. Las plataformas de visualización separadas a menudo crean barreras que impiden que los equipos extraen información comercial integral.
Estos flujos de trabajo desconectados evitan que sus organizaciones maximicen sus inversiones de datos, creen retrasos en la toma de decisiones y se perdieran las oportunidades de análisis integrales que combinan múltiples tipos de datos.
A partir de hoy, puede usar tres nuevas capacidades en Amazon Sagemaker para acelerar su ruta desde datos sin procesar hasta ideas procesables:
- Integración de Amazon QuickSight – Inicie Amazon Quicksight directamente desde Amazon Sagemaker Unified Studio para construir paneles de paneles utilizando los datos de su proyecto, luego publíquelos en el catálogo de Amazon Sagemaker para un descubrimiento más amplio y compartir en toda su organización.
- Amazon Sagemaker agrega soporte para los cubos de propósito general de Amazon S3 y las subvenciones de acceso de Amazon S3 en el catálogo de Sagemaker-Haga que los datos se almacenen en los cubos de propósito general de Amazon S3 más fáciles para los equipos encontrar, acceder y colaborar en todos los tipos de datos, incluidos los datos no estructurados, al tiempo que mantienen el control de acceso de grano fino utilizando subvenciones de acceso de Amazon S3.
- Datos automáticos que se interponen desde su Lakehouse – incorporación automática de conjuntos de datos de datos de datos de pegamento AWS existentes (GDC) desde la arquitectura de Lakehouse en el catálogo de Sagemaker, sin configuración manual.
Estas nuevas capacidades de Sagemaker abordan el ciclo de vida de datos completo dentro de una experiencia unificada y gobernada. Obtiene la incorporación automática de los datos estructurados existentes de su Lakehouse, la catalogación perfecta del contenido de datos no estructurados en Amazon S3, y la visualización simplificada a través de la visión rápida, todo con controles constantes de gobernanza y acceso.
Echemos un vistazo más de cerca a cada capacidad.
Amazon Sagemaker y Amazon Quicksight Integration
Con esta integración, puede construir paneles en Amazon Quicksight utilizando datos de sus proyectos de Amazon Sagemaker. Cuando lanza QuickSight desde Amazon Sagemaker Unified Studio, Amazon Sagemaker crea automáticamente el conjunto de datos QuickSight y lo organiza en una carpeta segura accesible solo para los miembros del proyecto.
Además, los paneles que construye permanecen dentro de esta carpeta y aparecen automáticamente como activos en su proyecto Sagemaker, donde puede publicarlos en el catálogo de Sagemaker y compartirlos con usuarios o grupos en su directorio corporativo. Esto mantiene sus paneles organizados, descubiertos y gobernados en Sagemaker Unified Studio.
Para utilizar esta integración, tanto el dominio de estudio unificado de Amazon Sagemaker como la cuenta de QuickSight deben integrarse con AWS IAM Identity Center utilizando la misma instancia de IAM Identity Center. Además, su cuenta QuickSight debe existir en la misma cuenta de AWS donde desea habilitar el BluePrint QuickSight. Puede obtener más información sobre los requisitos previos en la página de documentación.
Después de cumplir con estos requisitos previos, puede habilitar el Blueprint para Amazon Quicksight navegando a la consola de Amazon Sagemaker y eligiendo el Planos pestaña. Entonces encontrar Amazon Quicksight y sigue las instrucciones.
También necesita configurar su Análisis SQL Perfil del proyecto para incluir Amazon Quicksight en Agregar configuración de implementación de BluePrint.
Para obtener más información sobre la configuración de incorporación, consulte la página de documentación.
Luego, cuando crea un nuevo proyecto, debe usar el Análisis SQL perfil.
Con su proyecto creado, puede comenzar a construir visualizaciones con QuickSight. Puedes navegar al Datos pestaña, seleccione la tabla o vista para visualizar y elija Abrir a la visión rápida bajo Comportamiento.
Esto lo redirigirá a la vía rápida de Amazon actas Página de conjunto de datos y puede elegir Uso en el análisis para comenzar a explorar los datos.
Cuando crea un proyecto con el BluePrint de Vight, Sagemaker Unified Studio disposición automáticamente una carpeta restringida de vía rápida por proyecto donde Sagemaker alcanza todos los activos nuevos: analizos, conjuntos de datos y paneles. La integración mantiene la sincronización de permiso de la carpeta en tiempo real, manteniendo los permisos de acceso a la carpeta Quicksight alineados con la membresía del proyecto.
Amazon Simple Storage Service (S3) Integración de cubos de propósito general
A partir de hoy, Sagemaker agrega soporte para los cubos de uso general S3 en el catálogo de Sagemaker para aumentar la capacidad de descubrimiento y permite los permisos granulares a través de subvenciones de acceso S3, lo que permite a los usuarios gobernar los datos, incluido el intercambio y la gestión de los permisos. Los consumidores de datos, como científicos de datos, ingenieros y analistas de negocios, ahora pueden descubrir y acceder a los activos S3 a través del catálogo de Sagemaker. Esta expansión también permite a los productores de datos gobernar los controles de seguridad en cualquier activo de datos S3 a través de una sola interfaz.
Para utilizar esta integración, necesita permisos de cubo de propósito general S3 apropiados, y sus proyectos de estudio unificados de Sagemaker deben tener acceso a los cubos S3 que contienen sus datos. Obtenga más información sobre los requisitos previos en los datos de Amazon S3 en la página de documentación de Amazon SageMaker Unified Studio.
Puede agregar una conexión a un cubo S3 existente.
Cuando está conectado, puede navegar por las carpetas accesibles y crear activos descubiertos eligiendo en el cubo o una carpeta y seleccionando Publicar para catálogo.
Esta acción crea un activo de catálogo de Sagemaker de tipo «colección de objetos S3» y abre una página de detalles de activos donde los usuarios pueden aumentar el contexto comercial para mejorar la búsqueda y la capacidad de descubrimiento. Una vez publicados, los consumidores de datos pueden descubrir y suscribirse a estos activos catalogados. Cuando los consumidores de datos se suscriben a los activos de «recopilación de objetos S3», el catálogo de Sagemaker otorga automáticamente el acceso utilizando S3 Access Subdirve tras la aprobación, lo que permite la colaboración del equipo cruzado al tiempo que garantiza que solo los usuarios correctos tengan el acceso correcto.
Cuando tiene acceso, ahora puede procesar sus datos no estructurados en Amazon Sagemaker Jupyter Notebook. La siguiente captura de pantalla es un ejemplo para procesar la imagen en el caso de uso médico.
Si tiene datos estructurados, puede consultar sus datos con Amazon Athena o Process utilizando Spark en cuadernos.
Con este acceso otorgado a través de S3 Access Subvence, puede incorporar a la perfección los datos S3 en mis flujos de trabajo, analizándolo en cuadernos, combinándolo con datos estructurados en Lakehouse y Amazon Redshift para análisis integrales. Puede acceder a datos no estructurados, como documentos, imágenes en cuadernos JupyterLab para entrenar modelos ML o generar información consultable.
Datos automáticos que se interponen desde su Lakehouse
Esta integración ingresa automáticamente todos sus conjuntos de datos Lakehouse en el catálogo de Sagemaker. El beneficio clave para usted es traer conjuntos de datos del Catálogo de datos de pegamento AWS (GDC) al catálogo de Sagemaker, eliminando la configuración manual para catalogarse, compartirlos y gobernarlos centralmente.
Esta integración requiere una configuración de Lakehouse existente con un catálogo de datos que contiene sus conjuntos de datos estructurados.
Cuando configura un dominio de Sagemaker, el catálogo de Sagemaker ingiere automáticamente metadatos de todas las bases de datos y tablas de Lakehouse. Esto significa que puede explorar y usar estos conjuntos de datos desde SageMaker Unified Studio sin ninguna configuración.
La integración lo ayuda a comenzar a administrar, gobernar y consumir estos activos desde Sagemaker Unified Studio, aplicando las mismas políticas de gobierno y controles de acceso que puede usar para otros tipos de datos mientras unifica metadatos técnicos y comerciales.
Cosas adicionales que saber
Aquí hay un par de cosas a tener en cuenta:
- Disponibilidad – Estas integraciones están disponibles en todas las regiones comerciales de AWS donde es compatible con Amazon Sagemaker.
- Fijación de precios – Se aplican los precios estándar de Sagemaker Unified Studio, QuickSight y Amazon S3. No hay cargos adicionales por las integraciones mismas.
- Documentación – Puede encontrar guías de configuración completas en la documentación de SageMaker Unified Studio.
Comience con estas nuevas integraciones a través de la consola de estudio unificada de Amazon Sagemaker.
¡Feliz edificio!
– Donnie