in

Los CIO se enfrentan a modelos de Genai globales deficientes

Los CIO se enfrentan a modelos de Genai globales deficientes

Otro factor que podría minimizar el problema del tamaño del conjunto de datos en los próximos años es un aumento anticipado en los datos no estructurados. De hecho, los datos altamente no estructurados, como los recopilados por los drones de video que miran a las empresas y sus clientes, podrían dejar los problemas de lenguaje por completo, ya que el análisis de video podría capturarse directamente y guardar en muchos idiomas diferentes.

Hasta que el volumen de datos de alta calidad para idiomas que no son de inglés se vuelven mucho más fuertes, algo que podría suceder lentamente con datos más no estructurados, privados y de idioma agnóstico en los próximos años, los CIO deben exigir mejores respuestas de los proveedores de modelos en el Datos de capacitación para todos los modelos no ingleses.

Digamos que un CIO global está comprando 118 modelos de un proveedor de LLM, en una amplia gama de idiomas. El CIO paga quizás $ 2 mil millones por el paquete. El proveedor no le dice al CIO cuán poco entrenamiento se realizó en todos esos modelos que no son de inglés, y ciertamente no de dónde provienen esos datos de entrenamiento. Si los proveedores fueran completamente transparentes en ambos puntos, los CIO retrocedirían los precios de todo lo que no sea el modelo inglés.

En respuesta, los fabricantes de modelos probablemente no cobrarían a los CIO menos por los modelos que no son del inglés, sino que aumentan sus esfuerzos para encontrar más datos de capacitación para mejorar la precisión de esos modelos.

Dada la gran cantidad de dinero que las empresas están gastando en Genai, la zanahoria es obvia. El palo? Tal vez los CIO necesiten salir de su zona de confort y comenzar a comprar sus modelos que no son de inglés a los proveedores regionales en cada idioma que necesiten.

Si eso comienza a suceder a gran escala, los principales fabricantes de modelos pueden ver repentinamente el valor de la transparencia de entrenamiento de datos.

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Vista previa de Samsung Galaxy A56: fecha de lanzamiento, especificaciones, precio y más

Samsung se reunirá con Sam Altman de OpenAi para ‘revivir’ la compañía