“Somos muy agnósticos en materia de LLM, en el sentido de que podemos observar las diferentes tareas y ver cuál es la adecuada para una tarea en particular. Para el análisis de imágenes o el análisis multimedia, utilizamos lo último y lo mejor, como el ChatGPT Omni. Es único en tener capacidades para redactar. [client-privilege] líneas de registro. Dependiendo de los datos, estamos cambiando entre GPT-4 o GPT-3.5 Turbo.
«En realidad, estamos analizando dónde obtenemos un rendimiento razonable y comparándolo con cosas como los costos».
¿Es el precio un tema que consideras al adoptar un modelo? Mahoney: “Los diferentes LLM tienen precios muy diferentes. Para algunos de nuestros conjuntos de datos, la forma en que GPT 3.5 Turbo realiza líneas de registro es bastante buena. Por lo tanto, no querríamos gastar dinero extra en GPT-4 allí.
“En el frente del modelo de lenguaje pequeño, yo diría que estamos haciendo ajustes en lugar de un modelo de lenguaje pequeño separado para cada aplicación…. Estamos tomando un modelo existente, pero donde tenemos una industria que podría verse muy diferente a la base sobre la que se construyó ese modelo. [and] Además, estamos haciendo algunos ajustes para introducir el modelo en un conjunto de datos antes de que comience a hacer predicciones sobre él”.
Entonces, esencialmente, ¿algunos LLM son mejores en algunas tareas que otras? Mahoney: “Algunos modelos de lenguaje son mejores en ciertas tareas para resumir o señalar lo que sea. Lo ideal es tener un flujo de trabajo con seis pasos y utilizar un LLM diferente en diferentes pasos. Nunca se sabe quién emergerá mañana y será mejor en X o Y.
“Hemos estado usando OpenAI [LLMs] antes de su lanzamiento público. Y hemos estado probando Meta y Claude y usando los que creemos que tienen más sentido para una tarea en particular”.
Científicos y analistas de datos, ingenieros rápidos: ¿qué roles tiene o ha agregado para abordar sus necesidades de LLM? Swansburg: “Para el trabajo que hace CJ y el trabajo que hacemos nosotros, cuanto mayor es el conjunto de datos, mayor es la necesidad de científicos de datos. Por lo tanto, trabaja con científicos de datos de su lado.
“Por mi parte, en términos de ingenieros rápidos, tenemos buenos desarrolladores de software que pueden hacer eso por usted. Tenemos personas que son desarrolladores puros y tenemos personas que se sientan en el medio y que llamamos «tecnólogos legales». Esos son los traductores que toman los requisitos de clientes y abogados, los retroalimentan y personalizan las plataformas que construimos.
“Aún no tenemos científicos de datos porque utilizamos conjuntos de datos discretos. Por lo tanto, se trata más de poder diseñar las indicaciones, y el equipo que tenemos ahora ha podido hacerlo en el lado del desarrollador. A medida que crezcamos, y en este momento estamos contratando otra media docena de desarrolladores, obtendremos más matices y buscaremos personas con experiencia en ingeniería rápida y en la creación de API con LLM y otras herramientas.
«Entonces, está cambiando constantemente».
¿Utiliza principalmente modelos propietarios en lugar de modelos de código abierto? Mahoney: “En este momento, simplemente estamos usando modelos propietarios, conectándolos y probándolos; OpenAI es el ejemplo más común. Estamos construyendo cosas a través de indicaciones como fechas de determinación de contratos para extraer los datos que necesitamos y creando paquetes de preguntas que se generarán en función de la determinación automática de lo que el sistema está ingiriendo. Todo eso se está probando ahora.
“Algunos de ellos son realmente caros. Algo como ChatGPT es muy accesible. Incluso los modelos empresariales pueden funcionar y son accesibles y asequibles. “
Si los departamentos jurídicos y los bufetes de abogados ya utilizaban IA y ML, ¿por qué se necesita ClearyX? Swansburg: “Estamos tratando de crear un modelo que sea mucho menos costoso que el software de gestión de contratos… y que tenga una calidad mucho mayor que la de muchos proveedores y brinde un servicio.
“Muchas empresas no tienen personas que posean y operen estos programas. Entonces, tienen estanterías. Compran una herramienta de gestión del ciclo de vida del contrato y les lleva tres años obtener el retorno de la inversión; entonces la gente no lo usa porque no está diseñado a medida. Por lo tanto, estamos tratando de crear soluciones personalizadas para clientes que funcionen como ellos y que sean asequibles.
“No somos propietarios de capital de riesgo. Somos propiedad de la asociación, por lo que podemos construir las cosas de la manera correcta. No solo atendemos a los clientes del bufete de abogados Cleary; También tenemos el mandato de conseguir clientes externos.
“Empezamos a pensar que no íbamos a ser un taller de desarrollo. Íbamos a utilizar soluciones existentes y unirlas mediante API, pero sucedieron un par de cosas. Las herramientas del mercado no hacían lo que queríamos que hicieran. No pudimos personalizarlos con los matices que hacían que los clientes estuvieran realmente encantados de usarlos.
“La otra es la ubicuidad de la IA, y la capacidad de personalizarla es mucho más fácil que hace tres años. Entonces, durante los últimos ocho meses aproximadamente, hemos podido cambiar a algo que nos permite personalizarlo más fácilmente y colaborar con los clientes para descubrir cómo quieren que funcione”.
GIPHY App Key not set. Please check settings