Hay una variedad de razones por las cuales los fabricantes de modelos no revelan sus detalles de entrenamiento de datos. (Ni siquiera lleguemos a la cuestión de si tienen derechos legales para hacer la capacitación que hicieron, aunque es tentador hacerlo, aunque solo sea para explorar la hipocresía de OpenAi quejándose sobre Deepseek no obtener permiso antes de entrenar en gran parte de sus datos).
Hablando de Deepseek, no leas demasiado en el costo más bajo de sus modelos subyacentes. Sí, sus constructores aprovecharon hábilmente código abierto para encontrar eficiencias y menores precios, pero ha habido poca revelación de cuánto ayudó el gobierno chino con los fondos de Deepseek, ya sea directa o indirectamente.
Dicho esto, si Deepseek es el Cudgel que ejerce una presión a la baja sobre el precio de Genai, estoy a favor, y los ejecutivos también deberían serlo. Pero hasta que veamos evidencia de recortes de precios significativos, deberían usar la falta de transparencia de datos en modelos no inglés para tratar de obtener precios del fabricante de modelos fuera del estratoférico.