|
|
Esta semana, la ciudad de Nueva York organiza la Cumbre AWS, que reúne a desarrolladores, clientes y equipos de AWS durante un día completo de anuncios, demostraciones y sesiones técnicas en el Javits Center. Escribí publicaciones de blog para algunos de los lanzamientos de la Cumbre, por lo que estoy emocionado de verlos publicarse esta semana. Simplemente no estaré mirando desde el Centro Javits. Estaré en un festival de música de cuatro días, siguiendo los lanzamientos en mi teléfono mientras intento descubrir cómo montar una tienda de campaña. Si no pudiste asistir en persona como yo, la keynote transmisión en vivo está disponible el 17 de junio, con el Dr. Swami Sivasubramanian, vicepresidente de IA agente, y Chet Kapoor, vicepresidente de servicios de seguridad y observabilidad, y cubre nuevas capacidades en herramientas de desarrollo, infraestructura de IA y seguridad.

Esto es lo que pasó esta semana.
Titulares
Cómo los equipos fronterizos están reinventando el desarrollo nativo de IA: Swami publicó una publicación detallada esta semana basándose en datos de experimentos realizados en cientos de equipos de ingeniería de Amazon. Vale la pena leer atentamente los hallazgos si está pensando en cómo estructurar la adopción de la IA en su propio equipo.
Un equipo de seis ingenieros reconstruyó el motor de inferencia de Amazon Bedrock en 76 días, un proyecto originalmente previsto para 30 desarrolladores durante 12 a 18 meses. El aumento medio de la productividad en los pilotos estructurados con equipos de Amazon Stores fue de 4,5 veces la velocidad de implementación normalizada, y algunos equipos superaron las 10 veces. Perfect Order Experience pasó de un ciclo de funciones de dos semanas a enviarse en una tarde. WW Grocery redujo la creación de documentos de diseño de cinco días a unas pocas horas.
La publicación resume estos resultados en cinco prácticas para convertirse en un equipo de vanguardia. Primero, invierta en el contexto del agente: cree archivos de dirección, estándares de codificación y repositorios estructurados antes de escribir el código de producción. En segundo lugar, hay que esperar una desaceleración inicial mientras se reestructuran los flujos de trabajo y superarla. En tercer lugar, mantenga una acumulación constante de tareas bien delimitadas para que los agentes puedan ejecutarse en paralelo sin una supervisión constante. Cuarto, hacer explícita la intención a través de especificaciones estructuradas antes de que comience la generación del código. En quinto lugar, desplace las pruebas hacia la izquierda para que los agentes puedan autocorregirse antes de que el código llegue al proceso.
La publicación cierra con una nota de que la velocidad de confirmación es solo una parte del panorama y que un seguimiento cubrirá la gestión de lanzamientos, las operaciones, las operaciones de seguridad y las actualizaciones de EOL.
AWS FinOps Agent ahora está disponible en versión preliminar: AWS FinOps Agent es un nuevo agente para profesionales de FinOps y equipos de ingeniería que responde preguntas sobre costos, presenta oportunidades de optimización, investiga anomalías de costos y ejecuta flujos de trabajo recurrentes de FinOps en un cronograma definido. Puede usarlo para consultar sus costos de AWS, generar informes de costos para los equipos de finanzas e ingeniería y recomendaciones de redimensionamiento de superficie, recursos inactivos y planes de ahorro de AWS Cost Optimization Hub y AWS Compute Optimizer. El agente puede abrir tickets de Jira en su nombre según esas recomendaciones. Cuando se detecta una anomalía en los costos, FinOps Agent puede investigar automáticamente la causa raíz y publicar los hallazgos en un canal de Slack.
Lanzamientos de la semana pasada
Comenzaré con uno que escribí esta semana y luego cubriré los otros lanzamientos que llamaron mi atención:
- Las instancias Amazon EC2 M9g y M9gd ya están disponibles de forma generalizada: impulsadas por procesadores AWS Graviton5 y construidas sobre el sistema AWS Nitro de sexta generación, las instancias M9g ofrecen un rendimiento informático hasta un 25 % mejor en comparación con las instancias basadas en Graviton4, con un rendimiento hasta un 35 % más rápido para aplicaciones web, hasta un 35 % para inferencia de aprendizaje automático y hasta un 30 % para bases de datos. Graviton5 es el primer procesador de la flota de AWS que admite memoria PCIe Gen6 y DDR5-8800, e incluye una caché L3 5 veces más grande en comparación con la generación anterior. Las instancias M9g y M9gd ofrecen hasta un 15 % más de ancho de banda de red y un 20 % más de ancho de banda de Amazon EBS en promedio en todos los tamaños en comparación con M8g. Esta versión también presenta Nitro Isolation Engine, una mejora del sistema Nitro que utiliza verificación formal para proporcionar un aislamiento matemáticamente probado entre máquinas virtuales, estableciendo a Nitro como el primer hipervisor en la nube verificado formalmente. Las instancias M9gd agregan hasta 11,4 TB de almacenamiento local SSD NVMe con un 30 % más de IOPS en comparación con las M8gd. Ambos tipos de instancias admiten la configuración de ancho de banda de instancia (IBC) para ajustar la asignación de ancho de banda entre las redes EBS y VPC hasta en un 25 %.
- Anthropic Claude Fable 5 en Amazon Bedrock: Claude Fable 5 se lanzó en Amazon Bedrock el 9 de junio y ofrece ejecución extendida de tareas asincrónicas, capacidades de visión avanzadas en diagramas, cuadros y archivos PDF, y autoverificación proactiva. El acceso requiere optar por compartir datos a través de la API de retención de datos antes de invocar el modelo; Anthropic requiere una retención de 30 días de entradas y salidas para los modelos de clase Mythos. Nota importante sobre disponibilidad: El 12 de junio, Anthropic solicitó a AWS que revocara el acceso a Claude Fable 5 y Claude Mythos 5 para todos los usuarios para respaldar el cumplimiento de una directiva de control de exportaciones del gobierno de EE. UU. Todos los demás modelos, incluido el Opus 4.8, no se ven afectados. Lea el declaración antrópica para más detalles. AWS compartirá más actualizaciones a medida que estén disponibles.
- Los modelos Gemma 4 ahora están disponibles en Amazon Bedrock: la familia Gemma 4 de Google DeepMind ahora está disponible en Amazon Bedrock en tres variantes: Gemma 4 31B (ventana de contexto densa de 256 000 tokens, adecuada para cargas de trabajo de razonamiento y codificación), Gemma 4 26B-A4B (arquitectura de mezcla de expertos, orientada a cargas de trabajo sensibles a costos y latencia) y Gemma 4 E2B (el modelo más pequeño). variante, diseñada para casos de uso interactivos de baja latencia). Los tres admiten llamadas de funciones nativas, salida estructurada, razonamiento, transmisión de respuestas, entrada multimodal en texto, imágenes, video y audio, y más de 35 idiomas.
- Amazon OpenSearch Service lanza aplicaciones MCP para observabilidad agente: Amazon OpenSearch Service ahora admite aplicaciones MCP, lo que permite flujos de trabajo de observabilidad dentro de IDE agentes compatibles, incluidos Claude Desktop y VS Code. Un agente de IA en su entorno local puede investigar incidentes utilizando registros, seguimientos, métricas y alertas almacenados en dominios, colecciones y Amazon Managed Service for Prometheus de OpenSearch. Cada llamada a la herramienta de la aplicación MCP devuelve una respuesta dual: un resumen de texto para que el agente razone y una visualización interactiva representada en el mismo hilo de conversación. Las herramientas disponibles de la aplicación MCP cubren registros, métricas e investigación de seguimiento; desempeño del servicio; topología; visualizaciones dinámicas; salud del agente; salud del clúster; y puntuación de instrumentación.
Otras noticias de AWS
Aquí hay algunas publicaciones y actualizaciones adicionales que pueden resultarle útiles:
- AWS CLI v1 ingresa al modo de mantenimiento: cuando CLI v1 ingresa al modo de mantenimiento, las dependencias de botocore y s3transfer se proporcionarán directamente en el código base de CLI v1 en lugar de instalarse como paquetes separados. Esto significa que la actualización de CLI v1 ya no actualizará los paquetes independientes botocore o s3transfer, y la instalación de esos paquetes de forma independiente no tendrá ningún efecto en las versiones utilizadas por CLI v1. Los entornos con CLI v1 y boto3 instalados contendrán copias separadas de estas bibliotecas. Las nuevas versiones de CLI v1 se limitarán a correcciones de errores críticos y problemas de seguridad. La ruta recomendada es migrar a AWS CLI v2.
- El proveedor de credenciales de carga de trabajo de AWS ya está disponible: AWS ha lanzado un nuevo proveedor de credenciales de carga de trabajo que permite que las cargas de trabajo obtengan credenciales de AWS a corto plazo sin necesidad de claves de acceso a largo plazo. Esto admite la administración de credenciales para aplicaciones que se ejecutan fuera de AWS, lo que brinda a los equipos una forma de seguir patrones de acceso con privilegios mínimos para cargas de trabajo en entornos locales o de terceros.
- Kiro Pro Max ya está disponible — Kiro ha introducido un nuevo nivel Pro Max, agregando límites de uso más altos, acceso a los últimos modelos de frontera y capacidades de agente adicionales para los equipos de desarrollo. Kiro Pro Max está diseñado para desarrolladores profesionales que necesitan un uso sostenido y de gran volumen en codificación, generación de especificaciones y tareas impulsadas por agentes.
Próximos eventos de AWS
Consulte su calendario e inscríbase para los próximos eventos de AWS:
- Cumbres de AWS: las cumbres de AWS son eventos presenciales gratuitos que cubren la nube y la inteligencia artificial. Próximamente: Ciudad de Nueva York (17 de junio), Hong Kong (17 de junio), Shanghai (23 y 24 de junio), Japón (25 de junio), Washington, DC (30 de junio – 1 de julio), Taipei (15 de julio) y Bogotá (30 de julio).
- Días de la comunidad de AWS: conferencias dirigidas por la comunidad planificadas e impartidas por líderes comunitarios. Los próximos eventos incluyen Montréal, Canadá (20 de junio), Indianápolis, Estados Unidos (24 de junio), Hangzhou, China (28 de junio), Bangalore, India (11 de julio), y Yaundé, Camerún (25 de julio).
Visita el Centro de creación de AWS para conocer a otros constructores, aportar soluciones y encontrar recursos que le ayuden a seguir construyendo. También puede explorar los próximos eventos virtuales y presenciales dirigidos por AWS, además sesiones centradas en desarrolladores.
Esta publicación es parte de nuestra serie de resumen semanal. Vuelva a consultar cada semana para obtener un resumen rápido de noticias y anuncios interesantes de AWS.


