La máquina de publicidad es real con IA generativa y ChatGPT, que aparentemente están en todas partes en tecnología en estos días. Por lo tanto, no sorprende que estemos comenzando a escuchar comentarios sobre un Siri nuevo y mejorado. De hecho, 9to5Mac ya ha detectado un nuevo sistema de lenguaje natural.
Hablas mi idioma?
La afirmación es que Siri en tvOS 16.4 beta tiene un nuevo marco de «Generación de lenguaje natural de Siri». Como se describe, no suena impresionante, ya que parece centrado principalmente en contar (¿papá?) bromea, pero también puede permitirle usar lenguaje natural para establecer temporizadores. Su nombre en código es «Bobcat».
Estos susurros siguen a un reciente New York Times informe sobre la cumbre de IA de febrero de Apple. Ese informe afirmó que el evento vio un grado de enfoque en el tipo de contenido generativo y modelos de lenguaje extenso (LLM) utilizados por ChatGPT. También dijo que los ingenieros de Apple están «probando activamente» los conceptos de generación de lenguaje al lanzar nuevos conceptos de lenguaje cada semana a medida que Apple busca hacer avanzar la IA.
Entonces, ¿está creando un competidor de ChatGPT? En realidad no, según Bloomberg.
«Oye, Siri, ¿cómo se escribe ‘ponerse al día’?»
Si bien Siri parecía increíblemente sofisticado cuando apareció por primera vez, el desarrollo no ha seguido el ritmo, dando al descarado asistente de voz de Apple ecos de MobileMe y Ping. Al igual que Apple falla, Siri prometió que nunca estuvo a la altura y ahora va a la zaga de los asistentes de Google y Amazon, a pesar de ser un poco más privado.
La falta de sentido contextual de Siri significa que en realidad solo es bueno para lo que está entrenado, lo que limita sus habilidades; GPT parece dejarlo en el polvo. Con el actualización reciente de GPT-4, OpenAI está innovando rápidamente. Ya podemos ver que esto ha encendido un fuego debajo de las grandes empresas tecnológicas. Microsoft ha adoptado ChatGPT dentro de Bing, Google avanza rápidamente en el desarrollo de Palm y Amazon está empujando duro en AWS Chat (este último ahora integrado dentro de Microsoft Teams).
Apple, y Siri, parecen estar en peligro.
No es el único
Por supuesto, Siri no es el único inteligencia artificial (MI) Apple funciona. En algunos dominios, como la accesibilidad y el aumento de imágenes, ha logrado ejemplos increíblemente buenos de MI bien hecho. Pero, de alguna manera, Siri todavía comete errores.
No estoy completamente seguro de cómo Steve Jobs de Apple habría manejado eso: no puedo verlo feliz cuando su HomePod le dice que no puede encontrar sus pistas de Dylan. La diferencia entre las dos IA con capacidad de voz es que podría pedirle a GPT que cree una imagen de él arrojando ese altavoz inteligente a la pared.
En parte, esto se debe a cómo se construyó Siri.
Cómo hicieron a Siri
Siri es una especie de enorme base de datos de respuestas para diferentes dominios de conocimiento complementada con resultados de búsqueda obtenidos en Spotlight e interpretación de lenguaje natural para que puedas hablar con él. Cuando se realiza una solicitud, Siri verifica que comprende la pregunta y luego utiliza algoritmos de aprendizaje automático/profundo para identificar la respuesta adecuada. Para obtener esa respuesta, realiza una evaluación numérica (puntaje de confianza) de la probabilidad de que tenga la respuesta correcta.
Lo que esto significa es que cuando le haces una pregunta a Siri, primero echa un vistazo rápido para ver si se trata de una solicitud simple («encender las luces») que puede cumplir rápidamente a partir de lo que ya sabe, o si necesita consultar. la base de datos más grande. Luego hace lo que le pides que haga (a veces), obtiene los datos que necesita (a menudo) o le dice que no lo entiende o le pide que cambie una configuración oculta en algún lugar de su sistema (con demasiada frecuencia).
En teoría, Siri es tan bueno como su base de datos, lo que significa que cuantas más respuestas haya incluido, mejor y más efectivo se volverá.
Sin embargo, hay un problema. Como explicado por el ex ingeniero de Apple John Burkey, la forma en que se construye Siri significa que los ingenieros deben reconstruir toda la base de datos para actualizarla. Ese es un proceso que puede tomar hasta seis semanas.
Esta falta de aprendizaje real hace que Siri y otros asistentes de voz sean «tontos como una roca», según el director ejecutivo de Microsoft, Satya Nadella. Por supuesto, esperaría que dijera algo así, ya que Microsoft ha invertido miles de millones en ChatGPT, que está entretejiendo dentro de sus productos.
La IA generativa, por otro lado.
La IA generativa (el tipo de inteligencia que se usa en ChatGPT, Midjourney, Dall-E y Stable Diffusion) también usa lenguaje natural, sus propias bases de datos y resultados de búsqueda, pero también puede usar algoritmos para crear contenido aparentemente original, como audio, imágenes o texto.
Puede hacerle una pregunta y revisará todos los datos disponibles y tomará algunas decisiones para obtener un resultado.
Ahora, como se ha señalado con bastante frecuencia desde que la gente comenzó a explorar la tecnología, esos resultados no siempre son geniales u originales, pero por lo general parecen convincentes. La capacidad de pedirle que genere videos y fotos deepfake lleva esto aún más lejos.
En uso, una forma de ver la diferencia entre los dos modelos de IA es pensar en lo que pueden lograr.
Entonces, mientras que con Siri puede solicitar un mapa de Lisboa, Portugal, o incluso obtener indicaciones para llegar a algún lugar en ese mapa, la IA generativa le permite hacer preguntas más matizadas, como qué partes de la ciudad recomienda escribir. una historia con la acción basada en esa ciudad, o incluso crear una foto falsa espeluznantemente precisa de ti sentado en ese bar realmente encantador en Largo dos Trigueiros.
Está bastante claro qué IA es la más impresionante.
¿Qué pasa después?
No es necesario que sea así. Los desarrolladores han logrado crear aplicaciones para agregar ChatGPT a los productos de Apple. watchGPT, que recientemente se renombró Petey – Asistente de IA por razones de marca registrada, es un gran ejemplo.
Es poco probable que Apple quiera ceder una tecnología tan importante desde el punto de vista competitivo a terceros, por lo que es probable que continúe trabajando para encontrar su propia solución, pero esto podría llevar años, durante los cuales Siri aún puede no abrir la puerta de la cabina.
Sin embargo, dado que GPT-4 cuesta hasta 12 centavos por cada mil indicaciones, es muy poco probable que Apple lo incluya en sus sistemas operativos en un sentido directo. Con una base instalada de más de mil millones de usuarios, hacerlo sería enormemente costoso, y Microsoft ya está ahí.
Es en ese contexto que Apple podría simplemente morder la bala para facilitar que sus desarrolladores agreguen soporte para la tecnología de OpenAI en las aplicaciones que crean, transfiriendo efectivamente el costo a ellos y a sus clientes.
Eso podría ayudar a corto plazo, pero estoy convencido de que esto es un fuego en el estómago para los equipos de inteligencia artificial de Apple. Estarán doblemente decididos ahora a desarrollar más innovaciones en el procesamiento del lenguaje natural que es fundamental para ambas tecnologías.
Pero en esta etapa, en términos de implementación, parece que se han quedado atrás. Aunque las apariencias, como muestran las imágenes generadas por GPT, pueden ser engañosas.
Por favor sígueme en Mastodonteo únete a mí en el Bar y parrilla de AppleHolic y Manzana Discusiones grupos en MeWe.
Derechos de autor © 2023 IDG Communications, Inc.