|
|
El catálogo de Amazon SageMaker, que ahora está integrado en Amazon SageMaker, puede ayudarle a recopilar y organizar sus datos con el contexto empresarial que las personas necesitan para comprenderlos. Documenta automáticamente los activos generados por AWS Glue y Amazon Redshift, y se conecta directamente con Amazon Quick Sight, depósitos de Amazon Simple Storage Service (Amazon S3), tablas de Amazon S3 y AWS Glue Data Catalog (GDC).
Con solo unos pocos clics, puede seleccionar activos de inventario de datos con los metadatos comerciales necesarios agregando o actualizando nombres comerciales (activo y esquema), descripciones (activo y esquema), Léame, términos del glosario (activo y esquema) y formularios de metadatos. También puede crear sugerencias generadas por IA, revisar y perfeccionar descripciones y publicar metadatos de activos enriquecidos directamente en el catálogo. Esto ayuda a reducir el esfuerzo de documentación manual, mejora la coherencia de los metadatos y acelera la capacidad de descubrimiento de activos en todas las organizaciones.
A partir de hoy, puede utilizar nuevas capacidades en los metadatos del catálogo de Amazon SageMaker para mejorar los metadatos comerciales y la búsqueda:
- Formularios de metadatos a nivel de columna y descripciones enriquecidas – Puede crear formularios de metadatos personalizados para capturar información específica de la empresa directamente en columnas individuales. Las columnas también admiten descripciones de texto enriquecido habilitadas para rebajas para una documentación de datos completa y un contexto empresarial.
- Aplicar reglas de metadatos para los términos del glosario para la publicación de activos – Puede utilizar reglas de aplicación de metadatos para los términos del glosario, lo que significa que los productores de datos deben utilizar vocabulario empresarial aprobado al publicar activos. Al estandarizar las prácticas de metadatos, su organización puede mejorar el cumplimiento, mejorar la preparación para las auditorías y optimizar los flujos de trabajo de acceso para una mayor eficiencia y control.
Estas nuevas capacidades de metadatos del catálogo de SageMaker ayudan a abordar la clasificación de datos consistente y mejorar la capacidad de descubrimiento en los catálogos de su organización. Echemos un vistazo más de cerca a cada capacidad.
Formularios de metadatos a nivel de columna y descripciones enriquecidas
Ahora puede utilizar formularios de metadatos personalizados y descripciones de texto enriquecido a nivel de columna, ampliando las capacidades de curación existentes para nombres comerciales, descripciones y clasificaciones de términos del glosario. Los valores de los campos de formulario de metadatos personalizados y el contenido de texto enriquecido se indexan en tiempo real y se pueden descubrir inmediatamente mediante la búsqueda.
Para editar metadatos a nivel de columna, seleccione el esquema del recurso de catálogo utilizado en su proyecto y elija el Ver/Editar acción para cada columna.

Cuando elige una de las columnas como propietario de un activo, puede definir formularios de metadatos de valor-clave personalizados y descripciones de rebajas para proporcionar documentación detallada de la columna.

Ahora los analistas de datos de su organización pueden realizar búsquedas utilizando valores de campos de formulario personalizados y contenido de texto enriquecido, junto con nombres de columnas, descripciones y términos del glosario existentes.
Aplicar reglas de metadatos para los términos del glosario para la publicación de activos
Puede definir requisitos de términos de glosario obligatorios para activos de datos durante el flujo de trabajo de publicación. Sus productores de datos ahora deben clasificar sus activos con términos comerciales aprobados de los glosarios organizacionales antes de su publicación, promoviendo estándares de metadatos consistentes y mejorando la capacidad de descubrimiento de datos. Las reglas de cumplimiento validan que se apliquen los términos requeridos del glosario, evitando que los activos se publiquen sin el contexto comercial adecuado.
Para habilitar una nueva regla de metadatos para los términos del glosario, elija Agregar en las unidades de su dominio bajo el Gestión de Dominios sección en el Gobernar menú.

Ahora puedes seleccionar cualquiera Formularios de metadatos o Asociación de glosario como un tipo de requisito para la regla. Cuando seleccionas Asociación de glosariopuede elegir hasta cinco términos de glosario requeridos por regla.

Si intenta publicar recursos sin agregar los términos del glosario requeridos, aparece el mensaje de error que le solicita que aplique la regla del glosario.

La estandarización de los metadatos y la alineación de los esquemas de datos con el lenguaje empresarial mejora la gobernanza de los datos y la relevancia de la búsqueda, lo que ayuda a su organización a comprender y confiar mejor en los datos publicados.
Puede utilizar la interfaz de línea de comandos de AWS (AWS CLI) y SDK de AWS para utilizar estas funciones. Para obtener más información, visite el catálogo de datos de Amazon SageMaker Unified Studio en la Guía del usuario de Amazon SageMaker Unified Studio.
Ahora disponible
Las nuevas capacidades de metadatos ahora están disponibles en las regiones de AWS donde está disponible el catálogo de Amazon SageMaker.
Pruébelo y envíe sus comentarios a AWS re:Post para el catálogo de Amazon SageMaker o a través de sus contactos habituales de AWS Support.
— chany


