in

Los mejores modelos de generación de imágenes de Stability AI ahora en Amazon Bedrock | Amazon Web Services

A partir de hoy, puedes utilizar tres nuevos modelos de texto a imagen desde Estabilidad IA en Amazon Bedrock: Stable Image Ultra, Stable Diffusion 3 Large y Stable Image Core. Estos modelos mejoran enormemente el rendimiento en indicaciones multitemáticas, la calidad de la imagen y la tipografía, y se pueden utilizar para generar rápidamente imágenes de alta calidad para una amplia gama de casos de uso en marketing, publicidad, medios, entretenimiento, venta minorista y más.

Estos modelos se destacan por producir imágenes con un fotorrealismo sorprendente, con detalles, colores e iluminación excepcionales, y por abordar desafíos comunes como la reproducción realista de manos y rostros. La comprensión avanzada de las indicaciones de los modelos les permite interpretar instrucciones complejas que involucran razonamiento espacial, composición y estilo.

Los tres nuevos modelos de IA de estabilidad disponibles en Amazon Bedrock cubren diferentes casos de uso:

Imagen estable ultra – Produce resultados fotorrealistas de la más alta calidad, perfectos para medios de impresión profesionales y aplicaciones de gran formato. Stable Image Ultra se destaca por reproducir detalles y realismo excepcionales.

Difusión estable 3 grande – Logra un equilibrio entre la velocidad de generación y la calidad de salida. Ideal para crear activos digitales de gran volumen y alta calidad, como sitios web, boletines informativos y materiales de marketing.

Núcleo de imagen estable – Optimizado para una generación de imágenes rápida y asequible, ideal para iterar rápidamente conceptos durante la ideación.

Esta tabla resume las características clave del modelo:

Características Imagen estable ultra Difusión estable 3 grande Núcleo de imagen estable
Parámetros 16 mil millones 8 mil millones 2.6 mil millones
Aporte Texto Texto o imagen Texto
Tipografía Diseñado para
exhibición a gran escala
Diseñado para
exhibición a gran escala
Versatilidad y legibilidad en todos los formatos
Diferentes tamaños y aplicaciones
Visual
estética
Fotorrealista
salida de imagen
Altamente realista con
mayor atención a los detalles
Buena representación;
no tan orientado a los detalles

Una de las mejoras clave de Stable Image Ultra y Stable Diffusion 3 Large en comparación con Stable Diffusion XL (SDXL) es la calidad del texto en las imágenes generadas, con menos errores de ortografía y tipografía gracias a su innovadora Transformador de difusión arquitectura, que implementa dos conjuntos separados de pesos para imagen y texto, pero permite el flujo de información entre las dos modalidades.

Aquí hay algunas imágenes creadas con estos modelos.

Imagen Estable Ultra – Inmediato: Foto realista, una mujer sentada en un campo mirando una cometa volar en el cielo, cielo tormentoso, muy detallado, arte conceptual, composición intrincada y profesional.

Stable Diffusion 3 Ultra – Indicación: fotografía, realista, una mujer sentada en un campo mirando una cometa volar en el cielo, cielo tormentoso, muy detallado, arte conceptual, composición intrincada y profesional.

Difusión estable 3 grande – Indicación: cIlustración de estilo ómico, detective masculino parado debajo de una farola, ciudad negra, vistiendo una gabardina, sombrero fedora, oscuridad y lluvia, letreros de neón, reflejos en el pavimento mojado, iluminación detallada y cambiante.

Difusión estable 3 grande: mensaje: ilustración estilo cómic, detective masculino parado debajo de una farola, ciudad negra, vistiendo una gabardina, sombrero fedora, oscuridad y lluvia, letreros de neón, reflejos en el pavimento mojado, iluminación detallada y cambiante.

Núcleo de imagen estable – Inmediato: Render 3D profesional de una zapatilla blanca y naranja, flotando en el centro, flotando, flotando, alta calidad, fotorrealista.

Núcleo de imagen estable: mensaje: representación 3D profesional de una zapatilla blanca y naranja, flotando en el centro, flotando, de alta calidad, fotorrealista

Casos de uso de los nuevos modelos de IA de estabilidad en Amazon Bedrock
Los modelos de conversión de texto a imagen ofrecen un potencial transformador para empresas de diversos sectores y pueden optimizar significativamente los flujos de trabajo creativos en los departamentos de marketing y publicidad, lo que permite generar rápidamente elementos visuales de alta calidad para campañas, contenido de redes sociales y maquetas de productos. Al acelerar el proceso creativo, las empresas pueden responder más rápidamente a las tendencias del mercado y reducir el tiempo de comercialización de nuevas iniciativas. Además, estos modelos pueden mejorar las sesiones de intercambio de ideas, proporcionando representaciones visuales instantáneas de conceptos que pueden generar más innovación.

Para las empresas de comercio electrónico, las imágenes generadas por IA pueden ayudar a crear presentaciones de productos diversas y materiales de marketing personalizados a gran escala. En el ámbito de la experiencia del usuario y el diseño de interfaces, estas herramientas pueden producir rápidamente wireframes y prototipos, acelerando el proceso de iteración del diseño. La adopción de modelos de texto a imagen puede generar importantes ahorros de costos, mayor productividad y una ventaja competitiva en la comunicación visual en diversas funciones comerciales.

A continuación se muestran algunos ejemplos de casos de uso en diferentes industrias:

Publicidad y marketing

  • Stable Image Ultra para publicidad de marcas de lujo y presentaciones de productos fotorrealistas
  • Stable Diffusion 3 Large para imágenes de marketing de productos y campañas impresas de alta calidad
  • Utilice Stable Image Core para realizar pruebas A/B rápidas de conceptos visuales para anuncios en redes sociales

Comercio electrónico

  • Stable Image Ultra para personalización de productos de alta gama y artículos hechos a pedido
  • Difusión estable 3 Grande para la mayoría de las imágenes de productos en un sitio de comercio electrónico
  • Núcleo de imagen estable para generar rápidamente imágenes de productos y mantener los listados actualizados

Medios y entretenimiento

  • Stable Image Ultra para imágenes de juegos, materiales de marketing y arte clave ultra realistas
  • Stable Diffusion 3 Large para texturas ambientales, arte de personajes y recursos del juego.
  • Núcleo de imagen estable para la creación rápida de prototipos y la exploración del arte conceptual

Ahora, veamos estos nuevos modelos en acción, primero utilizando la consola de administración de AWS, luego con la interfaz de línea de comandos de AWS (AWS CLI) y los SDK de AWS.

Uso de los nuevos modelos de Stability AI en la consola de Amazon Bedrock
En la consola de Amazon Bedrock, elijo Acceso al modelo desde el panel de navegación para habilitar el acceso a los tres nuevos modelos en el Estabilidad IA sección.

Ahora que tengo acceso, elijo Imagen en el Parques infantiles sección del panel de navegación. Para el modelo, elijo Estabilidad IA y Imagen estable ultra.

Como aviso, escribo:

A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says "Stable Image Ultra in Amazon Bedrock".

Dejo todas las demás opciones con sus valores predeterminados y elijo CorrerDespués de unos segundos, obtengo lo que pedí. Aquí está la imagen:

Una imagen estilizada de un lindo robot antiguo de estilo steampunk con un cartel escrito con tiza en sus manos que dice "Imagen estable Ultra en Amazon Bedrock".

Uso de Stable Image Ultra con AWS CLI
Mientras todavía estoy en la consola Zona de juegos con imágenesElijo los tres pequeños puntos en la esquina de la ventana del patio de juegos y luego Ver solicitud de APIDe esta manera, puedo ver el comando de la interfaz de línea de comandos de AWS (AWS CLI) equivalente a lo que acabo de hacer en la consola:

aws bedrock-runtime invoke-model \
--model-id stability.stable-image-ultra-v1:0 \
--body "{\"prompt\":\"A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says \\\"Stable Image Ultra in Amazon Bedrock\\\".\",\"mode\":\"text-to-image\",\"aspect_ratio\":\"1:1\",\"output_format\":\"jpeg\"}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
invoke-model-output.txt

Para utilizar Stable Image Core o Stable Diffusion 3 Large, puedo reemplazar el ID del modelo.

El comando anterior genera la imagen en Base64 formato dentro de un objeto JSON en un archivo de texto.

Para obtener la imagen con un solo comando, escribo el archivo JSON de salida en la salida estándar y uso el yo q herramienta para extraer la imagen codificada para que pueda decodificarse sobre la marcha. La salida se escribe en el img.png archivo. Aquí está el comando completo:

aws bedrock-runtime invoke-model \
--model-id stability.stable-image-ultra-v1:0 \
--body "{\"prompt\":\"A stylized picture of a cute old steampunk robot with in its hands a sign written in chalk that says \\\"Stable Image Ultra in Amazon Bedrock\\\".\",\"mode\":\"text-to-image\",\"aspect_ratio\":\"1:1\",\"output_format\":\"jpeg\"}" \
--cli-binary-format raw-in-base64-out \
--region us-west-2 \
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg

Uso de Stable Image Ultra con los SDK de AWS
A continuación, se muestra cómo puede utilizar Stable Image Ultra con el SDK de AWS para Python (Boto3). Esta sencilla aplicación solicita de forma interactiva un mensaje de conversión de texto a imagen y luego llama a Amazon Bedrock para generar la imagen.

import base64
import boto3
import json
import os

MODEL_ID = "stability.stable-image-ultra-v1:0"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")

print("Enter a prompt for the text-to-image model:")
prompt = input()

body = {
    "prompt": prompt,
    "mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))

model_response = json.loads(response["body"].read())

base64_image_data = model_response["images"][0]

i, output_dir = 1, "output"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
    i += 1

image_data = base64.b64decode(base64_image_data)

image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
    file.write(image_data)

print(f"The generated image has been saved to {image_path}")

La aplicación escribe la imagen resultante en un output directorio que se crea si no está presente. Para no sobrescribir los archivos existentes, el código verifica si hay archivos existentes para encontrar el primer nombre de archivo disponible con el img_.png formato.

Hay más ejemplos de cómo utilizar modelos de difusión estable disponibles en la biblioteca de códigos de la documentación de AWS.

Voces de clientes
Aprenda de Ken Hoge, director de alianza global de Stability AI, cómo los modelos de difusión estable están transformando la industria desde texto a imagen hasta video, audio y 3D, y cómo Amazon Bedrock brinda a los clientes una solución todo en uno, segura y escalable.

Adéntrese en un mundo donde la lectura cobra vida con Nicolette Han, propietaria de productos de Stride Learning. Con el apoyo de Amazon Bedrock y AWS, la biblioteca Legend de Stride Learning está transformando la forma en que las mentes jóvenes interactúan con la literatura y la comprenden mediante el uso de inteligencia artificial para crear ilustraciones sorprendentes y seguras para historias infantiles.

Cosas que debes saber
Los nuevos modelos de inteligencia artificial de estabilidad (Stable Image Ultra, Stable Diffusion 3 Large y Stable Image Core) ya están disponibles en Amazon Bedrock en la región de AWS del oeste de EE. UU. (Oregón). Con este lanzamiento, Amazon Bedrock ofrece un conjunto más amplio de soluciones para impulsar su creatividad y acelerar los flujos de trabajo de generación de contenido. Consulte la página de precios de Amazon Bedrock para conocer los costos para su caso de uso.

Puede encontrar más información en Difusión estable 3 en el trabajo de investigación que describe en detalle la tecnología subyacente.

Para comenzar, consulte la sección de modelos de IA de estabilidad de la Guía del usuario de Amazon Bedrock. Para descubrir cómo otros utilizan la IA generativa en sus soluciones y aprender con contenido técnico detallado, visite comunidad.aws.

Danilo



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Las fundas del iPhone 16 de Apple podrían no tener un recorte para el nuevo botón de captura

Lanzamientos de Frostpunk 2 este mes: cómo ahorrar un 30 % en tu reserva

Lanzamientos de Frostpunk 2 este mes: cómo ahorrar un 30 % en tu reserva