Las organizaciones comerciales y de investigación pueden usar el motor Meta AI actualizado y de código abierto de forma gratuita.
Meta está haciendo que su modelo de lenguaje grande Llama 2 sea de código abierto, anunció la empresa matriz de Facebook el 18 de julio. La actualización del modelo, que se lanzó como la primera generación Llama (también estilizado como Llama 1) en febrero de 2023, se reveló por primera vez en el evento Microsoft Inspire. Microsoft será un socio preferente de Meta en Llama 2.
Salta a:
¿Qué es Llama 2?
Llama 2 es un modelo de lenguaje grande que se puede usar para crear modelos de IA generativos y conversacionales. En pocas palabras, Llama 2, como GPT-4, se puede usar para crear chatbots y asistentes de inteligencia artificial con fines comerciales o de investigación.
Se ejecuta en una colección de modelos de texto generativo pre-entrenados y ajustados que varían en escala de 7 mil millones a 70 mil millones de parámetros, y 2 billones de tokens de datos de fuentes disponibles públicamente entraron en su entrenamiento previo. En general, eso es un 40 % más de tokens que los que se usaron para entrenar a la Llama original.
VER: Kit de contratación: ingeniero rápido (Premium de TechRepublic)
¿Dónde está disponible Llama 2?
Llama 2 se puede descargar para investigación y uso comercial desde Meta aquí. Los recursos de código abierto disponibles incluyen pesos de modelo y código de inicio para el modelo preentrenado, así como versiones mejoradas de la IA conversacional.
«Abrir el acceso a los modelos de IA de hoy significa que una generación de desarrolladores e investigadores pueden probarlos, identificando y resolviendo problemas rápidamente, como comunidad», escribió Meta en un entrada de blog sobre Llama 2. “Al ver cómo otros utilizan estas herramientas, nuestros propios equipos pueden aprender de ellas, mejorar esas herramientas y corregir vulnerabilidades”.
Los desarrolladores que ya tengan cuentas con el catálogo de modelos de Azure AI de Microsoft podrán acceder a Llama 2 desde allí. Se puede encontrar en Amazon Web Services, Hugging Face y otros mercados de IA. Los clientes de AWS deben buscarlo en el mercado de aprendizaje automático SageMaker.
“El anuncio de Meta de que el modelo está disponible en AWS y Microsoft Azure es un gran paso para ellos, ya que muestra la ambición de ser un jugador empresarial en el espacio generativo de IA”, comentó el analista de Gartner Arun Chandrasekaran en un correo electrónico a TechRepublic.
Meta se asocia con Qualcomm para la IA en el dispositivo
Qualcomm instalará Llama 2 en dispositivos seleccionados en 2024. Los modelos exactos de dispositivos a los que se aplicará aún no se han revelado, pero Qualcomm ha dicho que serán dispositivos con procesadores Snapdragon. Qualcomm tiene como objetivo ejecutar el modelo de idioma en algunos dispositivos directamente, no siempre en la nube.
“Aplaudimos el enfoque de Meta para la IA abierta y responsable y estamos comprometidos a impulsar la innovación y reducir las barreras de entrada para los desarrolladores de cualquier tamaño al llevar la IA generativa al dispositivo”, dijo Durga Malladi, vicepresidente sénior y gerente general de tecnología, planificación y soluciones de borde de Qualcomm, en un comunicado. presione soltar. “Para escalar de manera efectiva la IA generativa a la corriente principal, la IA deberá ejecutarse tanto en la nube como en dispositivos periféricos, como teléfonos inteligentes, computadoras portátiles, vehículos y dispositivos IoT”.
¿Qué dice Llama 2 sobre la competencia en el espacio comercial generativo de IA?
Abrir Llama 2 y asociarse con Microsoft podría ser una señal de que Meta está tratando de seguir siendo competitivo con GPT-4. GPT-4 de OpenAI también es de uso gratuito y es el modelo detrás de ChatGPT, por el que Microsoft ha apostado a lo grande. Google también tiene un caballo en el ring con el modelo PaLM detrás de Bard.
«Esto va a cambiar el panorama del mercado de LLM», dijo el científico jefe de inteligencia artificial de Meta, Yann LeCun. en Twitter.
No está claro por el momento cómo la conexión con Meta podría cambiar los acuerdos de Microsoft con OpenAI, pero «la asociación con Meta podría abrir nuevas oportunidades para ellos», dijo Chandrasekaran. “Los modelos Llama 2 pueden impulsar potencialmente la demanda de IaaS y herramientas operativas de Azure, ya que los clientes buscan ajustar estos modelos y crear aplicaciones comerciales sobre ellos”, agregó.
Hacer que el modelo sea de código abierto también podría ser un cambio radical. “Al lanzar Llama 2 y licenciarlo para uso comercial, Meta podría estar brindando un gran impulso a la comunidad de código abierto”, dijo Chandrasekaran. “Hoy en día, podría decirse que los modelos de código cerrado tienen una ventaja de rendimiento sobre los modelos de código abierto, pero Llama tiene el potencial de reducir esa brecha a mediano y largo plazo”.