in

Amazon Titan Image Generator v2 ya está disponible en Amazon Bedrock | Amazon Web Services

Hoy anunciamos la disponibilidad general del modelo Amazon Titan Image Generator v2 con nuevas funciones en Amazon Bedrock. Con Amazon Titan Image Generator v2, puede guiar la creación de imágenes utilizando imágenes de referencia, editar elementos visuales existentes, eliminar fondos, generar variaciones de imágenes y personalizar de forma segura el modelo para mantener el estilo de la marca y la coherencia temática. Esta potente herramienta optimiza los flujos de trabajo, aumenta la productividad y da vida a las visiones creativas.

Amazon Titan Image Generator v2 incorpora una serie de nuevas funciones además de todas las funciones de Amazon Titan Image Generator v1, entre las que se incluyen:

  • Acondicionamiento de imagen – Proporcionar una imagen de referencia junto con un mensaje de texto, lo que genera resultados que siguen el diseño y la estructura de la referencia proporcionada por el usuario.
  • Guía de imágenes con paleta de colores – Controle con precisión la paleta de colores de las imágenes generadas proporcionando una lista de códigos hexadecimales junto con el mensaje de texto.
  • Eliminación de fondo – Elimina automáticamente el fondo de las imágenes que contienen varios objetos.
  • Consistencia del tema – Ajuste el modelo para preservar un sujeto específico (por ejemplo, un perro, un zapato o un bolso en particular) en las imágenes generadas.

Nuevas funciones en Amazon Titan Image Generator v2
Antes de comenzar, si no tienes experiencia en el uso de los modelos de Amazon Titan, ve a la consola de Amazon Bedrock y elige Acceso al modelo en el panel inferior izquierdo. Para acceder a los últimos modelos de Amazon Titan desde Amazonassolicitar acceso por separado para Generador de imágenes Titan G1 v2 de Amazon.

A continuación se muestran los detalles del generador de imágenes Amazon Titan v2 en Amazon Bedrock:

Acondicionamiento de imagen
Puede utilizar la función de condicionamiento de imágenes para dar forma a sus creaciones con precisión e intención. Al proporcionar una imagen de referencia (es decir, una imagen de condicionamiento), puede indicarle al modelo que se centre en características visuales específicas, como bordes, contornos de objetos y elementos estructurales, o mapas de segmentación que definen regiones y objetos distintos dentro de la imagen de referencia.

Admitimos dos tipos de condicionamiento de imágenes: Canny edge y segmentación.

  • El algoritmo de bordes Canny se utiliza para extraer los bordes prominentes dentro de la imagen de referencia, creando un mapa que el generador de imágenes Amazon Titan puede utilizar para guiar el proceso de generación. Puede «dibujar» las bases de la imagen deseada y el modelo completará los detalles, las texturas y la estética final según sus instrucciones.
  • La segmentación proporciona un nivel de control aún más granular. Al proporcionar la imagen de referencia, puede definir áreas u objetos específicos dentro de la imagen e indicarle al generador de imágenes Amazon Titan que genere contenido que se alinee con esas regiones definidas. Puede controlar con precisión la ubicación y la representación de personajes, objetos y otros elementos clave.

A continuación se muestran ejemplos de generaciones que utilizan el condicionamiento de imágenes.

Para utilizar la función de acondicionamiento de imágenes, puede utilizar la API de Amazon Bedrock, el SDK de AWS o la interfaz de línea de comandos de AWS (AWS CLI) y elegir CANNY_EDGE o SEGMENTATION para controlMode de textToImageParams con su imagen de referencia.

	"taskType": "TEXT_IMAGE",
	"textToImageParams": {
 		"text": "a cartoon deer in a fairy world.",
        "conditionImage": input_image, # Optional
        "controlMode": "CANNY_EDGE" # Optional: CANNY_EDGE | SEGMENTATION
        "controlStrength": 0.7 # Optional: weight given to the condition image. Default: 0.7
     }

El siguiente ejemplo de código Python que utiliza AWS SDK para Python (Boto3) muestra cómo invocar Amazon Titan Image Generator v2 en Amazon Bedrock para usar el condicionamiento de imágenes.

import base64
import io
import json
import logging
import boto3
from PIL import Image
from botocore.exceptions import ClientError

def main():
    """
    Entrypoint for Amazon Titan Image Generator V2 example.
    """
    try:
        logging.basicConfig(level=logging.INFO,
                            format="%(levelname)s: %(message)s")

        model_id = 'amazon.titan-image-generator-v2:0'

        # Read image from file and encode it as base64 string.
        with open("/path/to/image", "rb") as image_file:
            input_image = base64.b64encode(image_file.read()).decode('utf8')

        body = json.dumps({
            "taskType": "TEXT_IMAGE",
            "textToImageParams": {
                "text": "a cartoon deer in a fairy world",
                "conditionImage": input_image,
                "controlMode": "CANNY_EDGE",
                "controlStrength": 0.7
            },
            "imageGenerationConfig": {
                "numberOfImages": 1,
                "height": 512,
                "width": 512,
                "cfgScale": 8.0
            }
        })

        image_bytes = generate_image(model_id=model_id,
                                     body=body)
        image = Image.open(io.BytesIO(image_bytes))
        image.show()

    except ClientError as err:
        message = err.response["Error"]["Message"]
        logger.error("A client error occurred: %s", message)
        print("A client error occured: " +
              format(message))
    except ImageError as err:
        logger.error(err.message)
        print(err.message)

    else:
        print(
            f"Finished generating image with Amazon Titan Image Generator V2 model {model_id}.")

def generate_image(model_id, body):
    """
    Generate an image using Amazon Titan Image Generator V2 model on demand.
    Args:
        model_id (str): The model ID to use.
        body (str) : The request body to use.
    Returns:
        image_bytes (bytes): The image generated by the model.
    """

    logger.info(
        "Generating image with Amazon Titan Image Generator V2 model %s", model_id)

    bedrock = boto3.client(service_name="bedrock-runtime")

    accept = "application/json"
    content_type = "application/json"

    response = bedrock.invoke_model(
        body=body, modelId=model_id, accept=accept, contentType=content_type
    )
    response_body = json.loads(response.get("body").read())

    base64_image = response_body.get("images")[0]
    base64_bytes = base64_image.encode('ascii')
    image_bytes = base64.b64decode(base64_bytes)

    finish_reason = response_body.get("error")

    if finish_reason is not None:
        raise ImageError(f"Image generation error. Error is {finish_reason}")

    logger.info(
        "Successfully generated image with Amazon Titan Image Generator V2 model %s", model_id)

    return image_bytes
	
class ImageError(Exception):
    "Custom exception for errors returned by Amazon Titan Image Generator V2"

    def __init__(self, message):
        self.message = message

logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)

if __name__ == "__main__":
    main()

Acondicionamiento del color
La mayoría de los diseñadores desean generar imágenes que cumplan con las pautas de la marca de color, por lo que buscan controlar la paleta de colores en las imágenes generadas.

Con Amazon Titan Image Generator v2, puede generar imágenes con colores condicionados según una paleta de colores (una lista de colores hexadecimales que se proporciona como parte de las entradas que cumplen con las pautas de marca de color). También puede proporcionar una imagen de referencia como entrada (opcional) para generar una imagen con los colores hexadecimales proporcionados y heredar el estilo de la imagen de referencia.

En este ejemplo, el mensaje describe:
a jar of salad dressing in a rustic kitchen surrounded by fresh vegetables with studio lighting

La imagen generada refleja tanto el contenido del mensaje de texto como el esquema de color especificado para alinearse con las pautas de color de la marca.

Para utilizar la función de acondicionamiento de color, puede configurar taskType a COLOR_GUIDED_GENERATION con sus códigos rápidos y hexadecimales.

       "taskType": "COLOR_GUIDED_GENERATION",
       "colorGuidedGenerationParam": {
             "text": "a jar of salad dressing in a rustic kitchen surrounded by fresh vegetables with studio lighting",                         
	         "colors": ['#ff8080', '#ffb280', '#ffe680', '#e5ff80'], # Optional: list of color hex codes 
             "referenceImage": input_image, #Optional
        }

Eliminación de fondo
Ya sea que desees componer una imagen sobre un fondo de color sólido o superponerla sobre otra escena, la capacidad de eliminar el fondo de manera limpia y precisa es una herramienta esencial en el flujo de trabajo creativo. Puedes eliminar instantáneamente el fondo de tus imágenes con un solo paso. Amazon Titan Image Generator v2 puede detectar y segmentar de manera inteligente varios objetos en primer plano, lo que garantiza que incluso las escenas complejas con elementos superpuestos queden perfectamente aisladas.

El ejemplo muestra una imagen de una iguana sentada en un árbol en un bosque. El modelo pudo identificar a la iguana como el objeto principal y eliminar el fondo del bosque, reemplazándolo por un fondo transparente. Esto permite que la iguana se destaque claramente sin el bosque que la rodea.

Para utilizar la función de eliminación de fondo, puede configurar taskType a BACKGROUND_REMOVAL con su imagen de entrada.

    "taskType": "BACKGROUND_REMOVAL",
    "backgroundRemovalParams": {
 		"image": input_image,
    }

Coherencia del sujeto con ajuste fino
Ahora puedes incorporar temas específicos sin problemas en escenas visualmente cautivadoras. Ya sea el producto de una marca, el logotipo de una empresa o una querida mascota familiar, puedes ajustar el modelo Amazon Titan utilizando imágenes de referencia para conocer las características únicas del tema elegido.

Una vez que el modelo esté ajustado, puede simplemente proporcionar un mensaje de texto y el generador Amazon Titan generará imágenes que mantengan una representación coherente del tema, ubicándolo de manera natural en contextos diversos e imaginativos. Esto abre un mundo de posibilidades para el marketing, la publicidad y la narración visual.

Por ejemplo, podrías usar una imagen con el título Ron the dog Durante el ajuste fino, dé el mensaje como Ron the dog wearing a superhero cape durante la inferencia con el modelo ajustado y obtener una imagen única en respuesta.

Para obtener más información, visite los parámetros de inferencia del modelo y los ejemplos de código para Amazon Titan Image Generator en la documentación de AWS.

Ya disponible
El modelo Amazon Titan Generator v2 ya está disponible en Amazon Bedrock en las regiones Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón). Consulta la lista completa de regiones para obtener actualizaciones futuras. Para obtener más información, consulta la página de productos Amazon Titan y la página de precios de Amazon Bedrock.

Pruebe hoy mismo Amazon Titan Image Generator v2 en Amazon Bedrock y envíe sus comentarios a AWS re:Post para Amazon Bedrock o a través de sus contactos habituales de soporte de AWS.

Visita nuestro Sitio de community.aws para encontrar contenido técnico profundo y descubrir cómo nuestras comunidades de Builder utilizan Amazon Bedrock en sus soluciones.

Channy



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Reseña de Foxit PDF Editor: un excelente editor de documentos con tecnología ChatGPT

Actualizaciones del martes de parches de Microsoft: mantenerse al día con las últimas correcciones

Actualizaciones del martes de parches de Microsoft: mantenerse al día con las últimas correcciones