in

Los investigadores de Microsoft enseñan a la IA a leer hojas de cálculo

Un diagrama de cómo el marco SpreadsheetLLM “lee” una hoja de cálculo realizando múltiples procesos.

Puede resultar difícil lograr que un modelo de IA generativa comprenda una hoja de cálculo. Para intentar resolver este problema, los investigadores de Microsoft publicaron un artículo el 12 de julio en Arxiv que describe Hoja de cálculo LLMun marco de codificación que permite que modelos de lenguaje grandes “lean” hojas de cálculo.

SpreadsheetLLM podría “transformar la gestión y el análisis de datos de hojas de cálculo, allanando el camino para interacciones de usuario más inteligentes y eficientes”, escribieron los investigadores.

Una ventaja de SpreadsheetLLM para las empresas sería utilizar fórmulas en hojas de cálculo sin tener que aprender a usarlas haciendo preguntas al modelo de IA en lenguaje natural.

¿Por qué las hojas de cálculo son un desafío para los LLM?

Las hojas de cálculo suponen un desafío para los estudiantes de LLM por varias razones.

  • Las hojas de cálculo pueden ser muy grandes y exceder la cantidad de caracteres que un LLM puede procesar a la vez.
  • Las hojas de cálculo son “diseños y estructuras bidimensionales”, como lo expresa el informe, a diferencia de la “entrada lineal y secuencial” con la que funcionan bien los LLM.
  • Por lo general, los LLM no están capacitados para interpretar direcciones de celdas y formatos de hojas de cálculo específicos.

Los investigadores de Microsoft utilizaron una técnica de varios pasos para analizar hojas de cálculo

Hay dos partes principales de SpreadsheetLLM:

  • Compresor de hojasque es un marco para reducir las hojas de cálculo a formatos que los estudiantes de maestría pueden comprender.
  • Cadena de hojas de cálculoque es una metodología para enseñar a un LLM cómo identificar las partes correctas de una hoja de cálculo comprimida para “mirar” cuando se le presenta una pregunta y para generar una respuesta.
Un diagrama de cómo el marco SpreadsheetLLM “lee” una hoja de cálculo realizando múltiples procesos.
Diagrama de cómo el marco SpreadsheetLLM “lee” una hoja de cálculo mediante la realización de múltiples procesos. Imagen: Microsoft

SheetCompressor tiene tres módulos:

  • Anclajes estructurales que ayudan a los LLM a identificar las filas y columnas en la hoja de cálculo.
  • Un método para reducir la cantidad de tokens que le cuesta al LLM interpretar la hoja de cálculo.
  • Una técnica para mejorar la eficiencia agrupando células similares.

Con estos módulos, el equipo redujo los tokens necesarios para la codificación de hojas de cálculo en un 96 %. Esto, a su vez, permitió una ligera mejora (12,3 %) con respecto al trabajo de otro equipo de investigación líder para ayudar a los LLM a comprender las hojas de cálculo. Los investigadores probaron su método de identificación de hojas de cálculo con estos LLM:

  • GPT-4 y GPT-3.5 de OpenAI.
  • Llama 2 y Llama 3 de Meta.
  • Phi-3 de Microsoft.
  • Mistral AI’s Mistral-v2.

Para la cadena de capacidades de la hoja de cálculo, utilizaron GPT-4.

¿Qué significa SpreadsheetLLM para los esfuerzos de inteligencia artificial de Microsoft?

La ventaja obvia para Microsoft en este caso es que permite que su asistente de inteligencia artificial Copilot, que funciona en muchas aplicaciones de la suite Microsoft 365, haga más cosas en Excel. SpreadsheetLLM representa el esfuerzo continuo por hacer que la inteligencia artificial generativa sea práctica, y abrir Excel a personas que no han recibido capacitación sobre sus funciones más avanzadas podría ser un buen nicho para que la inteligencia artificial generativa se expanda.

VER: ¿Hasta qué punto su empresa se relaciona con Copiloto de Microsoft afectará qué versión (si hay alguna) es la adecuada para su trabajo.

Uso en el mundo real y próximos pasos para esta investigación de Microsoft

Por ahora, una mejora del 12,3 % con respecto a los hallazgos de un equipo de investigación líder anterior es más significativa académicamente que económicamente. La IA generativa es famosa por inventar cosas, y las alucinaciones que se propagan en cascada a través de una hoja de cálculo podrían hacer que enormes cantidades de datos sean inútiles. Como señalan los investigadores, lograr que un LLM comprenda el formato de una hoja de cálculo (es decir, cómo se ve normalmente una hoja de cálculo y cómo funciona) es diferente a lograr que el LLM genere datos comprensibles y precisos dentro de esas celdas.

Además, esta metodología requiere una gran potencia informática y varias pasadas por un LLM para generar una respuesta. Además, el asistente de Excel de su oficina podría ser capaz de generar una respuesta en unos minutos sin utilizar tanta energía.

En el futuro, el equipo de investigación quiere incluir una forma de codificar detalles como el color de fondo de las celdas y profundizar la comprensión de los LLM sobre cómo las palabras dentro de las celdas se relacionan entre sí.

TechRepublic se ha puesto en contacto con Microsoft para obtener más información.

Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Puedes conseguir la motocicleta bastante temprano en Once Human, pero para mantenerla, necesitas desbloquear el Garaje y sus Memetics relacionados.

Guía de vehículos de una vez humanos: cómo conseguir y reparar motocicletas y vehículos de cuatro ruedas

Según se informa, Rockstar casi lanzó The Warriors en GBA

Según se informa, Rockstar casi lanzó The Warriors en GBA