in

Nuevo: Amazon SageMaker Ground Truth ahora es compatible con la generación de datos sintéticos | Servicios web de Amazon

Hoy, me complace anunciar que ahora puede usar Amazon SageMaker Ground Truth para generar datos de imágenes sintéticas etiquetadas.

La creación de modelos de aprendizaje automático (ML) es un proceso iterativo que, en un alto nivel, comienza con la recopilación y preparación de datos, seguido por el entrenamiento y la implementación del modelo. Y especialmente el primer paso, recopilar conjuntos de datos grandes, diversos y etiquetados con precisión para el entrenamiento de su modelo, a menudo es un desafío y requiere mucho tiempo.

Tomemos como ejemplo las aplicaciones de visión artificial (CV). Las aplicaciones CV han llegado a desempeñar un papel clave en el panorama industrial. Ayudan a mejorar la calidad de fabricación o automatizar almacenes. Sin embargo, la recopilación de datos para entrenar estos modelos CV a menudo lleva mucho tiempo o puede ser imposible.

Como científico de datos, puede pasar meses recopilando cientos de miles de imágenes de los entornos de producción para asegurarse de capturar todas las variaciones en los datos que encontrará el modelo. En algunos casos, encontrar todas las variaciones de datos puede ser incluso imposible, por ejemplo, obtener imágenes de defectos de productos raros, o costoso, si tiene que dañar intencionalmente sus productos para obtener esas imágenes.

Y una vez que se recopilan todos los datos, debe etiquetar con precisión las imágenes, lo que a menudo es una lucha en sí misma. El etiquetado manual de imágenes es lento y está abierto a errores humanos, y la creación de herramientas de etiquetado personalizadas y la configuración de operaciones de etiquetado a escala pueden llevar mucho tiempo y ser costosas. Una forma de mitigar este desafío de datos es agregar datos sintéticos a la mezcla.

Ventajas de combinar datos del mundo real con datos sintéticos
Combinar sus datos del mundo real con datos sintéticos ayuda a crear conjuntos de datos de entrenamiento más completos para entrenar sus modelos de ML.

Los datos sintéticos en sí mismos se crean mediante reglas simples, modelos estadísticos, simulaciones por computadora u otras técnicas. Esto permite crear datos sintéticos en cantidades enormes y con etiquetas muy precisas para anotaciones en miles de imágenes. La precisión de la etiqueta se puede realizar con una granularidad muy fina, como en un subobjeto o nivel de píxel, y en todas las modalidades. Las modalidades incluyen cuadros delimitadores, polígonos, profundidad y segmentos. Los datos sintéticos también se pueden generar por una fracción del costo, especialmente en comparación con las imágenes de detección remota que, de lo contrario, se basan en la recopilación de imágenes satelitales, aéreas o de drones.

Si combina sus datos del mundo real con datos sintéticos, puede crear conjuntos de datos más completos y equilibrados, agregando una variedad de datos de la que podrían carecer los datos del mundo real. Con datos sintéticos, tiene la libertad de crear cualquier entorno de imágenes, incluidos casos extremos que pueden ser difíciles de encontrar y replicar en datos del mundo real. Puede personalizar objetos y entornos con variaciones, por ejemplo, para reflejar diferentes luces, colores, texturas, poses o fondos. En otras palabras, puede «ordenar» el caso de uso exacto para el que está entrenando su modelo ML.

Ahora, permítame mostrarle cómo puede comenzar a obtener imágenes sintéticas etiquetadas utilizando SageMaker Ground Truth.

Comience su proyecto de datos sintéticos con Amazon SageMaker Ground Truth
Para solicitar un nuevo proyecto de datos sintéticos, vaya a la consola de Amazon SageMaker Ground Truth y seleccione Datos sintéticos.

Amazon SageMaker Ground Truth Datos sintéticos

Luego, seleccione Abrir portal de proyectos. En el portal de proyectos, puede solicitar nuevos proyectos, monitorear proyectos que están en progreso y ver lotes de imágenes generadas una vez que estén disponibles para su revisión. Para iniciar un nuevo proyecto, seleccione Solicitar proyecto.

Portal de proyectos de datos sintéticos Ground Truth de Amazon SageMaker

Describa sus necesidades de datos sintéticos y proporcione información de contacto.

Solicitar un proyecto de datos sintéticos

Después de enviar el formulario de solicitud, puede verificar el estado de su proyecto en el panel del proyecto.

Se crea el proyecto de datos sintéticos Ground Truth de Amazon SageMaker

En el siguiente paso, un experto de AWS se comunicará con usted para analizar los requisitos de su proyecto con más detalle. Tras la revisión, el equipo compartirá un presupuesto personalizado y un cronograma del proyecto.

Si desea continuar, los artistas digitales de AWS comenzarán creando un pequeño lote de prueba de imágenes sintéticas etiquetadas como producción piloto para que usted las revise.

Recopilan las entradas de su proyecto, como fotos de referencia y activos 2D y 3D disponibles. Luego, el equipo personaliza esos activos, agrega las inclusiones especificadas, como rayones, abolladuras y texturas, y crea la configuración que describe todas las variaciones que deben generarse.

También pueden crear y agregar nuevos objetos según sus requisitos, configurar distribuciones y ubicaciones de objetos en una escena, así como modificar el tamaño, la forma, el color y la textura de la superficie de los objetos.

Una vez que los objetos están preparados, se renderizan utilizando un motor de física fotorrealista, capturando una imagen de la escena desde un sensor que se coloca en el mundo virtual. Las imágenes también se etiquetan automáticamente. Las etiquetas incluyen cuadros delimitadores 2D, segmentación de instancias y contornos.

Puede monitorear el progreso de los trabajos de generación de datos en la página de detalles del proyecto. Una vez que el lote de prueba de producción piloto esté disponible para su revisión, puede verificar las imágenes y proporcionar comentarios para cualquier reelaboración que pueda ser necesaria.

Revisar los lotes disponibles de datos sintéticos

Seleccione el lote que desea revisar y Ver detalles.
Lote de muestra de datos sintéticos en Amazon SageMaker Ground Truth

Además de las imágenes, también recibirá etiquetas de imágenes de salida, metadatos como posiciones de objetos y métricas de calidad de imagen como archivos JSON compatibles con Amazon SageMaker.

Informe de diversidad y fidelidad de imágenes sintéticas
Con cada lote de imágenes disponible, también recibe un informe sintético de fidelidad y diversidad de imágenes. Este informe proporciona gráficos y estadísticas a nivel de imagen y objeto que le ayudan a dar sentido a las imágenes sintéticas generadas.

Las estadísticas se utilizan para describir la diversidad y la fidelidad de las imágenes sintéticas y compararlas con imágenes reales. Ejemplos de estadísticas y gráficos proporcionados son las distribuciones de clases de objetos, tamaños de objetos, brillo de imagen y contraste de imagen, así como gráficos que evalúan la indistinguibilidad entre imágenes sintéticas y reales.

Informe de diversidad y fidelidad de imágenes sintéticas

Una vez que apruebe el lote de prueba de producción piloto, el equipo pasará a la fase de producción y comenzará a generar lotes más grandes de imágenes sintéticas etiquetadas con los tipos de etiquetas que desee, como cuadros delimitadores 2D, segmentación de instancias y contornos. De manera similar al lote de prueba, cada lote de producción de imágenes estará disponible para usted junto con el informe de fidelidad y diversidad de imágenes para verificar, aceptar o rechazar.

Todas las imágenes y artefactos estarán disponibles para que los descargue desde su depósito S3 una vez que se complete la producción final.

Disponibilidad
Los datos sintéticos de Amazon SageMaker Ground Truth están disponibles en EE. UU. Este (Norte de Virginia). Los datos sintéticos tienen un precio por etiqueta. Puede solicitar un presupuesto personalizado que se adapte a su caso de uso y requisitos específicos completando el formulario de requisitos del proyecto.

Obtenga más información sobre los datos sintéticos de SageMaker Ground Truth en nuestra página de etiquetado de datos de Amazon SageMaker.

¡Solicite su proyecto de datos sintéticos a través de la consola de Amazon SageMaker Ground Truth hoy mismo!

Antje



Fuente

Características ocultas de iOS 16 que quizás no conozcas

Microsoft comienza a probar nuevos cambios en la interfaz de usuario de la barra de tareas de Windows 11

Microsoft comienza a probar nuevos cambios en la interfaz de usuario de la barra de tareas de Windows 11