Wong añadió que la herramienta Corpus de Avail “contradice” los comentarios recientes que hizo Mustafa Suleyman, el director ejecutivo de Microsoft AI, en una entrevista en el reciente Aspen Ideas Festival. “Mientras intentaba definir qué tipo de contenido está protegido por los editores, procedió a decir: ‘Con respecto al contenido que ya está en la web abierta, el contrato social de ese contenido desde los años 90 ha sido que es un uso legítimo. Cualquiera puede copiarlo, recrearlo o reproducirlo. Eso ha sido freeware, si se quiere; ese ha sido el entendimiento’”.
Si Internet hubiera contado con una herramienta como Corpus en los años 90, afirma Wong, “estoy seguro de que los creadores de contenidos habrían recibido el reconocimiento y la compensación adecuados por su contenido. Hoy en día, el jurado todavía está evaluando si los datos protegidos por derechos de autor para la formación de LLM deberían incluirse en el concepto de “uso justo”, pero el acceso a los datos en tiempo real debería reconocerse como algo valioso tanto para los usuarios como para los vendedores, y este contenido no debería considerarse software gratuito”.
En la actualidad, afirmó, la oficina de derechos de autor de Estados Unidos no ha impedido que “los proveedores de LLM utilicen datos protegidos por derechos de autor para entrenar sus modelos. Los proveedores suelen afirmar que el uso de los datos protegidos por derechos de autor cae dentro del concepto legal de “uso justo”, que permite a las personas o empresas utilizar partes limitadas de la obra para usos no comerciales, educativos o transformadores”.
GIPHY App Key not set. Please check settings