ChatGPT es todo lo que el mundo de la tecnología puede hablar últimamente, y por una buena razón. La herramienta impulsada por IA es impresionante, pero también hay muchas preocupaciones: infracción de derechos de autor, plagio, uso en las aulas, incluso trabajos perdidos, por lo que no es de extrañar que las personas que escriben para ganarse la vida estén estresadas por la IA que aparentemente puede escribir bien. Pero también hay empresas tecnológicas optimistas que ven el futuro: la capacidad de las computadoras para conversar naturalmente y crear contenido que las empresas puedan usar a una escala y un costo que los humanos no pueden esperar igualar.
Pero ChatGPT, Google Bard y Microsoft charla de bing son solo una pequeña parte de la revolución de la IA generativa. El mundo del arte ha estado entusiasmado con las nuevas herramientas de arte generativo de IA durante el último año y se ha vuelto loco por los mismos problemas: sesgo, derechos de autor, pérdida de trabajos, etc. Deepfakes, donde las redes neuronales intercambian personas en videos con un realismo sorprendente, fueron el consejo. del iceberg
Estas herramientas no son solo un destello en la sartén. Están en su infancia y están mejorando. muy rápidamente. Las grandes empresas tecnológicas como Google y Microsoft ven esta nueva IA generativa como una parte importante de todos nuestros futuros. Apostar por un reclamo y construir una posición de liderazgo es tan importante para ellos como lo fue dominar la web en los años 90.
Pero hay un jugador que no está en el juego: Apple. La empresa de tecnología más valiosa del mundo parece estar perdiendo por completo una revolución completa en la informática. Apple no es ajena a la IA (desencadenó una revolución de asistentes con Siri), pero también ha desperdiciado su liderazgo al no invertir lo suficiente para defenderse de los competidores.
¿Se está repitiendo la historia con la IA generativa? ¿O Apple tiene algo increíble bajo la manga y está siendo increíblemente reservado, como siempre?
El chat de IA es antiguo, la creación de IA es nueva
Todas las compañías tecnológicas más grandes han estado alardeando sobre la IA durante años. AI que aísla y analiza su discurso para dictado y asistentes de voz, y puede distinguir entre voces para obtener resultados personalizados. IA que reúne sonidos grabados para «hablar» contigo. IA que aísla partes de las imágenes para editarlas fácilmente. IA que identifica objetos y personas para potenciar tus búsquedas. AI que te permite seleccionar el texto en cualquier imagen.
Apple hace todo esto. Es muy importante para la empresa que construyan un Neural Engine en todos sus chips, hardware especializado que acelera tareas de aprendizaje automático como estas. Apple incluso está trabajando en el mayor desafío de IA de todos, los autos sin conductor.
Pero IA generativa es otra cosa Es una clase más nueva de IA que crea algo completamente nuevo casi sin necesidad de ingresar texto. Sí, entrenar los modelos requiere mucho tiempo y una gran cantidad de datos, pero esos modelos que los usuarios ejecutarán son comparativamente pequeños y aparentemente pueden crear una cantidad infinita de cosas nuevas. La IA que puede encontrar todas las papas en su biblioteca de fotos es algo totalmente diferente de la que puede dibujar una papa desde cero en una amplia variedad de estilos artísticos.
Mark Hachman / IDG
ChatGPT, Bard y Bing
La tecnología de IA generativa que está en los titulares en este momento es ChatGPT de OpenAI. El chatbot avanzado y las herramientas basadas en él ya se están utilizando en el mundo de los negocios para generar artículos, correos electrónicos, plantillas y más, con cierta controversia. Los estudiantes lo están utilizando para escribir trabajos completos a partir de un pequeño aviso, y los resultados son lo suficientemente buenos como para que haya una carrera para desarrollar buenas herramientas para que los maestros identifiquen las tareas escritas con ChatGPT.
Debido a que se entrenó con una tonelada de datos web que, aunque están anticuados, siguen siendo relevantes para muchas cosas, casi puede ser como un motor de búsqueda con el que conversas. Esto asustó tanto a Google que anunció su propio producto de IA conversacional rival, Bard, que aún no está listo para que el mundo lo pruebe, pero que llegará pronto. Una demostración pública proporcionó información incorrecta sobre el telescopio espacial James Webb, por lo que Google claramente tiene trabajo por hacer.
Microsoft también anunció una nueva función de búsqueda conversacional que puede comenzar a usar ahora mismo en Bing y el navegador Edge. Está construido sobre ChatGPT con algunas mejoras y modificaciones.
Estos son más que simples juguetes o curiosidades. Estas son herramientas reales que las personas usan para hacer un trabajo real y para impulsar proyectos creativos. Todo es temprano y, a veces, parece que no está listo para el mundo en general, pero el ritmo de mejora e innovación es asombroso: los modelos de IA se duplican en complejidad y sofisticación cada seis meses.
Difusión estable, Midjourney, DALL-E
Y no es sólo la palabra escrita. Todos nos reímos mucho haciendo indicaciones tontas con DALL-E 2 el año pasado, pero con más entrenamiento y mejoras, estas herramientas de arte generativo de IA se han vuelto buenas para mucho más que solo hacer imágenes de gatos al estilo anime buceando con peceras encima. sus cabezas.
Midjourney y Stable Diffusion se han vuelto tan buenos que están creando arte que fácilmente podría adornar la portada de una revista, y puede producir docenas en unos pocos minutos.
Estas herramientas pueden hacer mucho más que crear imágenes completamente nuevas en una amplia gama de estilos. Pueden alterar las imágenes de entrada. La App Store ya está inundada de aplicaciones para crear avatares y perfiles que utilizan este software para tomar algunas fotos de su rostro y modificarlas de manera asombrosa al cambiar las características físicas sin que nadie se dé cuenta. Como ponerse gafas de sol que parecen completamente reales.
El año pasado fue un truco, pero la tecnología se está desarrollando tan rápido que ya es una herramienta. Adobe ya ha mejorado muchas de sus aplicaciones con herramientas de generación de imágenes impulsadas por IA, para la restauración de fotos con un solo clic y la eliminación de objetos muy mejorada. Pero la empresa planea agregue una IA generativa significativa a su conjunto de herramientas pronto, permitiéndole insertar literalmente imágenes en fotos e ilustraciones existentes que parecen encajar perfectamente.
Dalle2.app
Una ventana estrecha para actuar
¿Y dónde está Apple en todo esto? La empresa se ha posicionado como líder en tecnología, especialmente en el espacio creativo. Pero con la excepción de algunas publicaciones de blog de un sitio de investigación de ML y algunas optimizaciones de relativamente bajo esfuerzo para bibliotecas para el silicio de Apple, Apple parece estar fuera de esto. Quiero decir, creo que DiffusionBee de Divam Gupta es genial, pero es una pequeña aplicación independiente de terceros que no se ha actualizado en bastante tiempo y ya está detrás de lo último en generación de imágenes de IA.
Esta tecnología va a ser completamente transformadora. ¿No me crees? Consulte la investigación de OpenAI sobre la generación de música. Crea nueva música en una variedad de estilos, incluido algo de canto, completamente de la nada. VALL-E de Microsoft puede generar voces sorprendentemente realistas que suenan muy cerca de una persona real, utilizando solo un pequeño fragmento de la voz de esa persona como entrada. Incluso puede imitar varios estados emocionales.
Muchos de estos proyectos, y decenas más, aún se encuentran en etapa de investigación. No es difícil encontrar algunos defectos en cualquiera de ellos. Pero el viaje de la investigación al mundo real será rápido y las fallas se volverán cada vez más difíciles de encontrar.
Aparentemente, Apple tiene las herramientas para construir su propio chatbot generativo de IA con Neural Engine integrado en sus chips de iPhone y Mac que es capaz de hasta 15.8 billones operaciones por segundo, junto con Core ML y API de aprendizaje automático. Pero no hemos visto ningún movimiento desde dentro de Cupertino. Y es uno que se está moviendo rápidamente.
Si no miras este espacio, probablemente no te des cuenta de lo rápido que está evolucionando. La IA generativa tardó un año en pasar de ser un «juguete de proyecto de investigación en línea tonto» a «anuncios de duelo de Microsoft y Google». En dos años más, estas herramientas serán diez veces mejores y habrá muchas más. Tendrá dificultades para saber qué es real o completamente generado por IA de la nada. Si tiene grandes ideas pero habilidades artísticas limitadas, la IA generativa hará que sea mucho más fácil realizar sus sueños.
Manzana
Con Siri, Apple estuvo a la vanguardia en llevar un asistente de voz de IA a las masas. A medida que esa tecnología evolucionó, Apple se quedó atrás, y ahora Siri a menudo se ve como una decepción que no se puede comparar con el Asistente de Google o Alexa. Cuando se trata de IA generativa, Apple ni siquiera tiene la ventaja de ser el primero en moverse como lo hizo con Siri. Las empresas tecnológicas grandes y pequeñas ya están enviando herramientas poderosas. Sin acción, Apple simplemente terminará fabricando parte del hardware sobre el que se ejecutará nuestro futuro impulsado por la IA generativa.
Sin darse cuenta del poder de esta nueva tecnología en su propio software y servicios, Apple permitirá que todos los demás definan el estado del arte de lo que podría ser el cambio más importante en la informática en décadas. Quizás la compañía esté de acuerdo con eso, pero a medida que las ventas de hardware se estancan y crece el lado del negocio de software y servicios de Apple, realmente no puede permitirse el lujo de no ser un líder en la revolución de la IA generativa.
Por supuesto, Apple es una de las empresas más reservadas en tecnología, especialmente cuando se trata de software. Apple podría tener grandes equipos trabajando arduamente para llevar funciones de IA generativa a iMovie, Final Cut Pro, Logic Pro, Fotos, Correo, Mensajes y toda la suite iWork. Todo esto podría transformarse por completo con poderosas herramientas generativas de IA. Sabemos que Apple compró al menos una empresa de inteligencia artificial generativa, AI Music, hace aproximadamente un año. No sería descabellado ver al menos una herramienta de «generar una banda sonora instantánea original para su video» en los productos de Apple este año.
Es posible que no escuchemos nada sobre la IA generativa de Apple, y luego en WWDC, ¡BAM! ¡IA generativa de clase mundial en todos los productos de Apple!
Espero que ese sea el caso, porque si Apple llega tarde al juego con una tecnología tan transformadora, condenará a su software a estar años atrás de sus competidores en los años venideros.