|
Hoy anunciamos la disponibilidad general de ajustes para el modelo Claude 3 Haiku de Anthropic en Amazon Bedrock en la región de AWS Oeste de EE. UU. (Oregón). Amazon Bedrock es el único servicio totalmente administrado que le brinda la posibilidad de ajustar los modelos de Claude. Ahora puede ajustar y personalizar el modelo Claude 3 Haiku con su propio conjunto de datos de entrenamiento para tareas específicas para aumentar la precisión, la calidad y la coherencia del modelo y adaptar aún más la IA generativa a su negocio.
El ajuste fino es una técnica en la que un modelo de lenguaje grande (LLM) previamente entrenado se personaliza para una tarea específica actualizando los pesos y ajustando los hiperparámetros como la tasa de aprendizaje y el tamaño del lote para obtener resultados óptimos.
El modelo Claude 3 Haiku de Anthropic es el modelo más rápido y compacto de la familia de modelos Claude 3. La puesta a punto de Claude 3 Haiku ofrece importantes ventajas para las empresas:
- Personalización – Puede personalizar modelos que sobresalgan en áreas cruciales para su negocio en comparación con modelos más generales codificando el conocimiento de la empresa y el dominio.
- Rendimiento especializado – Puede generar resultados de mayor calidad y crear experiencias de usuario únicas que reflejen la información, la marca, los productos y más de propiedad exclusiva de su empresa.
- Optimización específica de tareas – Puede mejorar el rendimiento de acciones específicas de dominio, como clasificación, interacciones con API personalizadas o interpretación de datos específicos de la industria.
- Seguridad de datos – Puede realizar ajustes con tranquilidad en su entorno seguro de AWS. Amazon Bedrock crea una copia separada del modelo de base base a la que solo usted puede acceder y entrena esta copia privada del modelo.
Ahora puede optimizar el rendimiento para casos de uso empresarial específicos proporcionando datos etiquetados específicos del dominio para ajustar el modelo Claude 3 Haiku en Amazon Bedrock.
A principios de 2024, comenzamos a involucrar a los clientes con un equipo de expertos del Centro de innovación de IA generativa de AWS para ayudar a ajustar los modelos Claude de Anthropic con sus fuentes de datos patentadas. Me complace compartir que ahora puede ajustar el modelo Claude 3 Haiku de Anthropic en Amazon Bedrock directamente en la consola de Amazon Bedrock.
Comience a ajustar el modelo Claude 3 Haiku de Anthropic en Amazon Bedrock
Demostraré cómo ajustar fácilmente el modelo Claude 3 Haiku en Amazon Bedrock. Para obtener más información sobre el flujo de trabajo de ajuste en detalle, visite la publicación del blog de aprendizaje automático de AWS, Ajuste fino de Claude 3 Haiku de Anthropic en Amazon Bedrock para aumentar la precisión y la calidad del modelo.
Para crear un trabajo de ajuste simple en la consola de Amazon Bedrock, vaya a la Modelos de cimentacion sección en el panel de navegación y seleccione Modelos personalizados. En el Modelos sección, seleccione la Personalizar modelo y luego seleccione Crear trabajo de ajuste.
A continuación, elija el modelo que desea personalizar con sus propios datos, asigne un nombre al modelo resultante y, opcionalmente, agregue claves de cifrado y cualquier etiqueta para asociar con el modelo en el Detalles del modelo sección. Ingrese un nombre para el trabajo y, opcionalmente, agregue cualquier etiqueta para el trabajo en el Configuración de trabajo sección.
Puede seleccionar la ubicación de Amazon S3 del archivo del conjunto de datos de entrenamiento y, si corresponde, el archivo del conjunto de datos de validación en el Datos de entrada sección.
Cada conjunto de datos se puede crear utilizando un Líneas JSON (JSONL) archivo con varias líneas JSON utilizando el formato de mensajería de un solo turno o de varios turnos. Cada línea JSON es una muestra que contiene un system
y mensaje, una variedad de message
objetos.
Preparé la información más reciente sobre el modelo Claude 3.5 Sonnet de Anthropic en Amazon Bedrock. Para obtener más información, visite Prepare los conjuntos de datos en la documentación de Amazon Bedrock.
{"system": "You are an helpful assistant.","messages":[{"role": "user", "content": "What’s the latest models to support Amazon Bedrock"},{"role": "assistant", "content": "Amazon Bedrock is a fully managed service that support Anthropic’s Claude 3 Sonnet, Haiku, and Opus models and the latest Claud 3.5 Sonnet model."}]}
{"system": "You are an helpful assistant.","messages":[{"role": "user", "content": "How long context window of Claude 3.5?"},{"role": "assistant", "content": "Anthropic's Claude 3 models have a 200,000 token context window enabling you to relay a large volume of information to Claude. This translates to roughly 150,000 words, or over 500 pages of material."}]}
{"system": "You are an helpful assistant.","messages":[{"role": "user", "content": "Is Claude 3.5 available in Bedrock?"},{"role": "assistant", "content": "Anthropic’s most intelligent and advanced model, Claude 3.5 Sonnet, demonstrates exceptional capabilities across a diverse range of tasks and evaluations while also outperforming Claude 3 Opus."}]}
En el Hiperparámetros En la sección, ingrese valores para los hiperparámetros que se usarán en el entrenamiento, como épocas, tamaño de lote y multiplicador de tasa de aprendizaje. Si ha incluido un conjunto de datos de validación, puede habilitar Parada anticipadauna técnica utilizada para evitar el sobreajuste y detener el proceso de entrenamiento cuando la pérdida de validación deja de mejorar. Puede establecer un umbral de parada anticipada y un valor de paciencia.
También puede seleccionar la ubicación de salida donde Amazon Bedrock debe guardar la salida del trabajo en el Datos de salida sección. Elija un rol de servicio personalizado de AWS Identity and Access Management (IAM) con los permisos adecuados en el Acceso al servicio sección. Para obtener más información, consulte Crear un rol de servicio para la personalización del modelo en la documentación de Amazon Bedrock.
Finalmente, elige Crear trabajo de ajuste y espere a que comience su trabajo de ajuste.
Puedes seguir su progreso o detenerlo en el Empleos pestaña en el Modelos personalizados sección.
Una vez completado un trabajo de personalización del modelo, puede analizar los resultados del proceso de capacitación mirando los archivos en la carpeta de salida de Amazon Simple Storage Service (Amazon S3) que especificó cuando envió el trabajo, o puede ver detalles sobre el modelo.
Antes de utilizar un modelo personalizado, debe adquirir Provisioned Throughput para Amazon Bedrock y luego utilizar el modelo aprovisionado resultante para realizar inferencias. Cuando compra Rendimiento aprovisionado, puede seleccionar un plazo de compromiso, elegir una cantidad de unidades de modelo y ver los costos estimados por hora, día y mes. Para obtener más información sobre los precios del modelo personalizado para el modelo Claude 3 Haiku, visite Precios de Amazon Bedrock.
Ahora puedes probar tu modelo personalizado en el patio de juegos de la consola. Elijo mi modelo personalizado y pregunto si el modelo Claude 3.5 Sonnet de Anthropic está disponible en Amazon Bedrock.
Recibo la respuesta:
Yes. You can use Anthropic’s most intelligent and advanced model, Claude 3.5 Sonnet in the Amazon Bedrock. You can demonstrate exceptional capabilities across a diverse range of tasks and evaluations while also outperforming Claude 3 Opus.
Puede completar este trabajo utilizando las API de AWS, los SDK de AWS o la interfaz de línea de comandos de AWS (AWS CLI). Para obtener más información sobre el uso de AWS CLI, visite Ejemplos de código para la personalización de modelos en la documentación de AWS.
Si está utilizando Jupyter Notebook, visite el repositorio de GitHub y siga una guía práctica para modelos personalizados. Para crear una operación a nivel de producción, recomiendo leer Optimice la creación e implementación de modelos personalizados para Amazon Bedrock con rendimiento aprovisionado usando Terraform en el blog de aprendizaje automático de AWS.
Conjuntos de datos y parámetros
Al ajustar Claude 3 Haiku, lo primero que debe hacer es mirar sus conjuntos de datos. Hay dos conjuntos de datos que intervienen en el entrenamiento de Haiku: el conjunto de datos de entrenamiento y el conjunto de datos de validación. Hay parámetros específicos que debes seguir para que tu entrenamiento sea exitoso, los cuales se describen en la siguiente tabla.
Datos de entrenamiento | Datos de validación | |
Formato de archivo | JSONL | |
Tamaño del archivo | ||
recuento de líneas | 32 – 10.000 líneas | 32 – 1000 líneas |
Suma Formación + Validación | ||
Límite de tokens | ||
Palabras clave reservadas | Evite tener “\nHuman: » o «\nAssistant: » en indicaciones |
Cuando prepare los conjuntos de datos, comience con un conjunto de datos pequeño de alta calidad y repita según los resultados del ajuste. Puedes considerar el uso de modelos más grandes de Anthropic como Claude 3 Opus o Claude 3.5 Sonnet para ayudar a refinar y mejorar tus datos de entrenamiento. También puede usarlos para generar datos de entrenamiento para ajustar el modelo Claude 3 Haiku, lo que puede ser muy efectivo si los modelos más grandes ya funcionan bien en su tarea objetivo.
Para obtener más orientación sobre cómo seleccionar los hiperparámetros adecuados y preparar los conjuntos de datos, lea la publicación del blog de aprendizaje automático de AWS, Mejores prácticas y lecciones para ajustar Claude 3 Haiku de Anthropic en Amazon Bedrock.
Vídeo de demostración
Mire este vídeo de demostración en profundidad para ver un tutorial paso a paso que le ayudará a empezar a ajustar el modelo Claude 3 Haiku de Anthropic en Amazon Bedrock.
Ahora disponible
El ajuste fino del modelo Claude 3 Haiku de Anthropic en Amazon Bedrock ahora está disponible de forma generalizada en la región de AWS Oeste de EE. UU. (Oregón); consulte la lista completa de regiones para futuras actualizaciones. Para obtener más información, visite Modelos personalizados en la documentación de Amazon Bedrock.
Pruebe el ajuste fino del modelo Claude 3 Haiku en el Consola Amazon Bedrock hoy y enviar comentarios a AWS re: Publicación para Amazon Bedrock o a través de sus contactos habituales de AWS Support.
Espero ver lo que usted construye cuando pone esta nueva tecnología a trabajar para su negocio.
— chany
GIPHY App Key not set. Please check settings