in

Serie Meta-Upveils Llama 4 AI con una nueva arquitectura basada en expertos

Imagen: Meta

Meta dio a conocer el 5 de abril Su nueva serie de modelos de IA: Llama 4, que incluye LLAMA 4 Maverick y Llama 4 Scout, diseñado para conversar y procesar archivos grandes, respectivamente, junto con un modelo inédito «Maestro» llamado Llama 4 Behemoth.

LLAMA 4 es la primera serie de Meta en adoptar una «mezcla de expertos (MOE) arquitectura». Este enfoque activa solo partes selectas de la red neuronal, denominadas «expertos», para manejar subtareas específicas. La tarea se dividirá en subtareas y cada una enrutada a los expertos más apropiados, mejorando la eficiencia de los recursos.

¿Cuáles son los detalles sobre Llama 4 Maverick y Scout?

Llama 4 Maverick presenta 128 expertos y 17 mil millones de parámetros activos, que representan la parte del conocimiento de un modelo utilizado para procesar una entrada dada. Meta lo describe como el «modelo de caballo de batalla de productos para asistentes generales y casos de uso de chat», especializado en interpretación de imágenes y escritura creativa.

Curiosamente, la compañía de Mark Zuckerberg se jacta de que Maverick ofrece «una mejor relación rendimiento a costo» cuando se trata de conversaciones. El costo ha estado jugando en las mentes de los gigantes de IA desde el lanzamiento sorpresa de Deepseek en enero, que solo tomó $ 5.6 millones para entrenar.

Ver: la oferta de Meta de $ 800 millones a la inicio de chips fue rechazada, aquí está por qué

Sin embargo, los expertos en IA han notado que la versión de Llama 4 Maverick publicada en Lmarena, que clasifica los principales modelos de idiomas grandes en varias tareas, es «optimizado para la conversación» y funciona de manera diferente de la versión públicamente disponible. Esto sugiere que Meta presentó una versión alterada a Lmarena que se ubicaría más alto en su tabla de clasificación.

Llama 4 Scout también tiene 17 mil millones de parámetros activos y solo 16 expertos, pero Meta dice que es el «mejor modelo multimodal del mundo de su clase». Tiene una ventana de contexto inusualmente grande de 10 millones de tokens, que representan la cantidad de información que puede procesar en un aviso, por lo que funciona bien al resumir documentos grandes y en un razonamiento secuencial.

Meta dice que tanto Scout como Maverick son sus «mejores hasta ahora» debido a que se destilan de Llama 4 Behemoth, con la friolera de 28 mil millones de parámetros activos y 16 expertos. Si bien ya ocupa un lugar destacado en Lmarena, todavía está siendo entrenado y no ha sido liberado. De acuerdo a La informaciónel anuncio de Llama 4 se retrasó al menos dos veces debido a los modelos de bajo rendimiento en puntos de referencia técnicos y conversación.

¿Cómo puedes acceder a Llama 4 Maverick y Scout?

Scout y Maverick se pueden descargar en Llama.com y abrazar la cara, o usarse a través de los chatbots Meta AI en WhatsApp, Messenger e Instagram en 40 países. Las características multimodales solo se pueden usar en los EE. UU. Y en inglés, actualmente.

Algunos socios ya han anunciado integraciones; Los desarrolladores pueden construir e implementar aplicaciones AI con los modelos LLAMA 4 en Azure AI Foundry y Azure Databricks de Microsoft.

Llama 4 es apolítico

Meta declaró que ha funcionado específicamente para «eliminar el sesgo» de los modelos LLAMA 4. La tasa de rechazo de las preguntas sobre «temas políticos y sociales debatidos» es más del 5% más baja que la de Llama 3.3 y, entre las preguntas que disminuye, sus respuestas se describen como «dramáticamente más equilibradas».

El equipo del presidente de los Estados Unidos, Donald Trump, ha expresado el escepticismo sobre la neutralidad de los modelos de IA, con su IA y Crypto zar David Sacks sugiriendo que el chatgpt de Opensei es «Programado para ser despertado«En un podcast. Los expertos en IA dicen que el sesgo finalmente proviene de los datos de entrenamiento y puede conducir a inclinación política En cualquier dirección, no solo la izquierda.

Sin embargo, la firma de Zuckerberg ha realizado una serie de movimientos recientes que sugieren que quiere mantenerse al lado de la administración de los Estados Unidos. El estratega republicano Joel Kaplan fue contratado como el líder de la política de Meta poco después de que Trump asumiera el cargo; Él ve la regulación de las redes sociales como un desafío directo a la libertad de expresión.

En enero, Meta reveló que la compañía estaba suspendiendo su programa de verificación de hechos de terceros y reubicar sus equipos de moderación de contenido de California a Texas para «ayudar a eliminar la preocupación de que los empleados sesgados censuren demasiado el contenido». Meta también ha eliminado sus iniciativas de diversidad, equidad e inclusión después de que Trump criticó tales programas.

Además, Meta dijo que los modelos de Llama 4 responden con una «fuerte inclinación política» en los temas «contenciosos» a un ritmo similar a Grok, el chatbot producido por Xai, una compañía propiedad del actual asesor de la Casa Blanca Elon Musk.

Llama 4 no se puede usar en la UE

Según el LLAMA 4 Política de uso aceptablelas personas «domiciliadas» o empresas con un «lugar principal de negocios» en la Unión Europea no pueden usar o distribuir los modelos. Sin embargo, esas personas o empresas pueden usar los modelos LLAMA 4 si se incorporan a un producto o servicio al que tienen acceso en la región.

Esto es probablemente el resultado de los problemas de Meta con la legislación de la UE, particularmente cuando se trata de IA. En junio de 2024, Meta retrasó la capacitación de su modelos de idiomas grandes En el contenido público compartido en Facebook e Instagram después de la UE, los reguladores sugirieron que podría necesitar un consentimiento explícito de los propietarios de contenido. Meta AI todavía no ha sido lanzada dentro del bloque.

Ver: Meta ofrece anuncios menos personalizados para los usuarios de la UE

Meta firmó una carta abierta instando a los reguladores europeos a abordar la «toma de decisiones regulatorias inconsistentes» y las demandas de cumplimiento impredecibles en septiembre pasado. Luego, en febrero, Meta declaró que estaba preparado para aumentar sus preocupaciones sobre lo que la compañía ve como regulaciones injustas de la UE directamente a Trump.

Hay otras restricciones cuando se trata del uso de Llama 4, como entidades comerciales con más de 700 millones de usuarios activos mensuales debe solicitar permiso de meta antes de usar sus modelos. La iniciativa de código abierto ha dicho que tal restricción saca la IA «fuera de la categoría de»código abierto«A pesar de que Meta reclama lo contrario.

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

65525

Accesorios de Mac útiles para verificar

Propiedades para reiniciar el archivo de lotes de actualización de Windows que se muestra en el escritorio de Windows

Cómo solucionar problemas y restablecer la actualización de Windows