Me sentaré (esperando el don del sonido y la visión)
Y cantaré (esperando el don del sonido y la visión)
—David Bowie
Apple está planeando patrocinar y presentar 14 artículos de investigación sobre IA en la Conferencia anual IEEE/CVF sobre Visión por computadora y reconocimiento de patrones (CVPR) en Denver la próxima semana, pocos días antes de que presente nuevas e importantes funciones de IA en su Conferencia Mundial de Desarrolladores (WWDC).
La nueva investigación explora temas como el uso de LLM en generación de imágenes, pruebas de calidad y creación de prototipos de interfaz de usuario. Durante meses, los rumores sobre la cadena de suministro han insinuado una evolución radical de los omnipresentes AirPods en forma de cámaras ambientales incorporadas. Teniendo esto en cuenta, cabe destacar que uno de los artículos de investigación, «Desde dónde están las cosas hasta para qué sirven: evaluación comparativa de la inteligencia funcional espacial para LLM multimodales», parece abordar específicamente estos casos de uso.
Accesibilidad para la gente.
En aplicación, esta tecnología promete un profundo potencial de accesibilidad. Sugiere que alguien con visión limitada podría hacer que sus AirPods lo guíen a través de una habitación desconocida. Esto es algo que debería encajar bien dentro de la estrategia de la empresa. Narrativa continua sobre la inteligencia y la accesibilidad de la visión artificial..
La accesibilidad es fundamental para una segunda presentación que se realizará durante el Taller de IA generativa para lenguaje de señas en la conferencia. Dirigido por Colin Lea de Apple, quien presentó una sesión sobre tecnología del habla para personas con discapacidad del habla En un evento similar, este enfoque en la inteligencia y la accesibilidad de la visión artificial es totalmente deliberado.
De hecho, aunque la industria y los críticos condenan a Apple por quedarse atrás con respecto a otros en el espacio de la IA, la publicación de estos 14 artículos en una sesión clave de la industria justo antes de la WWDC muestra que la compañía ha estado haciendo una gran cantidad de trabajo fundamental detrás de escena. Esperamos que este trabajo dé sus primeros frutos en la WWDC, y es importante entender las revelaciones como un movimiento de poder. Apple está utilizando el programa para celebrar sus fortalezas en el desarrollo de la inteligencia artificial y, dado su trabajo de una década en Apple Car, muchas de esas fortalezas se relacionan con la inteligencia de visión artificial.
Apple está tan avanzada en este campo que ya está implementando modelos avanzados que empoderan a los consumidores. Apenas la semana pasada, prometió introducir una nueva herramienta llamada Image Explorer en VoiceOver para ayudar a los clientes con discapacidad visual a finales de este año. Entre muchas otras características, esto llegará junto con un sistema que permitirá a los usuarios discapacitados controlar sillas de ruedas compatibles con comandos de palabra hablada.
Apple está superando los límites hasta el final. Su artículo “VSAS-Bench: Evaluación en tiempo real de modelos de asistentes de transmisión visual” demuestra que está refinando activamente modelos para procesar video en vivo instantáneamente en hardware de consumo.
¿Qué importa, el humano o la máquina?
La diferencia entre Apple y sus competidores es profunda y filosófica. Yo diría que mientras otros crean chatbots dependientes de la nube, Apple está incorporando herramientas de inteligencia artificial que resuelven problemas humanos reales en sus sistemas.
Esto se extiende a sus planes en la WWDC, donde presentará una serie de herramientas de inteligencia artificial creadas con la ayuda de Google Gemini y una serie de servicios de inteligencia artificial que ha desarrollado internamente. Este último incluirá una gran cantidad de herramientas de accesibilidad del tipo que se discutirá en el evento CVPR, cuya belleza es que se ejecutarán de forma privada y en el dispositivo. Se podría argumentar que mientras otros gigantes tecnológicos utilizan la IA para automatizar trabajos administrativos o crear una distopía de vigilancia, Apple está buscando aplicaciones de inteligencia artificial que resuelvan problemas humanos reales.
La empresa parece bastante realista acerca de la transformación en curso de la IA. Reconoce que su propio ecosistema debe convertirse en un actor par en el entorno emergente potenciado por la IA que la industria tecnológica parece decidida a construir.
Con eso en mente, Apple está dispuesta a participar en asociaciones estratégicas y mutuamente beneficiosas, como permitir que Siri utilice servicios de inteligencia artificial de terceros para manejar las solicitudes. Pero incluso mientras lo hace, también se está centrando en aquellas áreas en las que puede marcar una diferencia única, como las características de accesibilidad que Apple como plataforma siempre ha proporcionado.
Abrir
Como lo demostró Vision Pro, y como sugerirán en el futuro estos míticos AirPods con capacidad de video, las computadoras son cada vez más inteligentes. Por lo tanto, la forma en que los utilizamos también está cambiando a medida que nos alejamos de los rígidos límites de los teclados, ratones y pantallas táctiles. La búsqueda de Apple por la informática ambiental comenzó mucho antes de la repentina fiebre del oro por los chatbots de IA generativa.
Al final, a medida que estos últimos servicios se mercantilicen, la forma en que los humanos interactúen con ellos definirá la próxima generación de hardware. Esto es emocionante para Apple, dado que el diseño de producto es donde sobresale. Es posible que finalmente haya llegado la era del sonido y la visión.
¡Puedes seguirme en las redes sociales! Únase a mí en cielo azul, LinkedIn, Mastodontey Yo nosotros.
