in

Su primer asistente gemelo digital y el futuro del entretenimiento de video

Forrester nombra a NICE líder en CCaaS

La velocidad a la que parece avanzar la IA es increíble. Antes de finales del año pasado, la mayoría de nosotros pensábamos que la IA no sería útil individualmente hasta dentro de algunos años. Luego golpeó ChatGPT, respaldado por la tecnología GPT-3, seguido rápidamente por GPT-4, y de repente, estamos rodeados de inteligencia artificial que puede mejorar nuestra productividad.

Uno de los más interesantes es el modelo de IA de síntesis de vídeo de IA de cerebro profundoque puede crear un gemelo digital funcional de un humano que puede asumir cada vez más tareas que el humano al que refleja normalmente tendría que hacer.

Hablemos sobre la aparición del útil gemelo digital humano esta semana. Terminaremos con mi Producto de la semana, el Motorola ThinkPhone de Lenovo, un teléfono inteligente que aborda uno de los mayores errores de la industria informática en su respuesta al iPhone de Apple.

Modelos de IA de síntesis de video

Inicialmente centrado en el talento de los presentadores de noticias, DeepBrain AI es el primer gemelo digital humano que he observado que puede realizar tareas indistinguibles de cómo las habría hecho un humano.

El gemelo digital se crea al permitirle aprender de una gran cantidad de videos de noticias para crear una base de datos de conocimiento sobre el comportamiento, las peculiaridades, el habla y los movimientos del presentador humano.

El gemelo digital resultante puede recibir un guión y, a partir de ese guión, funcionará como lo habría hecho el presentador de noticias. El gemelo digital no reemplaza el talento humano y, en general, el talento se compensa cada vez que el servicio de noticias usa este avatar, principalmente para noticias de última hora o avances de formato corto para la próxima programación en vivo.


A veces, los servicios de noticias notarán que la audiencia está viendo un avatar generado por IA. Donde esta tecnología ya está en uso, ha sido aceptada por la audiencia de noticias y el talento.

La razón por la que el talento de noticias está de acuerdo con esto es que se les compensa cuando se usa el avatar, y usar el avatar significa que el talento no tiene que conducir a un estudio para grabar o grabar en vivo segmentos cortos, actualizaciones o anuncios que generalmente requieren que regresen a un estudio.

Por lo tanto, el avatar no afecta sus ingresos y complementa el trabajo de los humanos al reducir su carga y la agravación relacionada, todo lo cual debería mejorar la satisfacción laboral.

Casos de uso de avatares

Si bien la mayoría de los casos de uso inicial de esta tecnología son para programas de noticias en video donde el avatar y el periodista son indistinguibles (ejemplo en asia), otros usos incluyen:

  • Quioscos virtuales en bancos donde parece que estás hablando con un humano, pero en cambio estás chateando con una IA
  • Vídeos de formación unidireccionales a partir de un guión escrito
  • Un conserje virtual en un hotel que puede ayudar con cosas como reservas en restaurantes o entradas para espectáculos.
  • Videos interactivos donde, nuevamente, se siente como si estuviera hablando con una persona en vivo

Algunos de estos avatares nunca fueron personas reales; eran imágenes altamente realistas generadas por computadora.

Las ventajas de costos son significativas, ya que normalmente cuesta alrededor de $ 4,000 crear parte de este contenido de formato corto con una persona en vivo, pero solo cuesta alrededor de $ 100 hacer lo mismo con un avatar generado por computadora.

El avatar no requiere ensayo y funcionará a partir del guión escrito sin distracciones como enfermedades o cualquiera de los conflictos o problemas de comportamiento típicamente asociados con el talento en vivo.

Dado que el avatar funciona a partir de texto, puede ser controlado por otra IA como ChatGPT o Watson de IBM, que creó un nivel de contenido interactivo similar al humano que podría engañar a muchas personas haciéndoles creer que están hablando con una persona en vivo.

Otro uso que se ha explorado es la promoción de celebridades:

Las celebridades no escalan bien porque si las usa como defensores, la capacidad de las personas para chatear con ellas es casi inexistente. Sin embargo, un avatar de una celebridad podría interactuar con los fanáticos a gran escala, además de los clientes actuales o futuros del cliente.

Como se señaló, esta tecnología puede escanear personas reales y personajes creados artísticamente, lo que podría resolver algunos de los problemas que empresas como McDonald’s (Ronald McDonald), Kentucky Fried Chicken y Jack in the Box tenían con el uso de personas vivas, donde todos intercambiaban regularmente actores para que el actor no estuviera tan atado al personaje que no pudiera ser reemplazado.

Con un avatar creado digitalmente, la empresa es propietaria del actor virtual, y los problemas de origen humano se evaporan una vez que elimina a los humanos de la mezcla.

Gemelos digitales humanos y virtuales: lo que se avecina

El enfoque actual de DeepBrain es mejorar, no reemplazar, a las personas en su mayor parte. Sin embargo, su uso de avatares completamente sintetizados que no tienen conexión con ningún ser humano es más un reemplazo que un modelo de mejora. Si bien se centran inicialmente en contenido de formato corto, nada impide que la tecnología se traslade eventualmente a producciones de formato largo como programas de televisión y películas.

La naturaleza hiperrealista de los avatares mejorará con entrenamiento adicional y a medida que la tecnología avance, incluso en formato largo. Los actores virtuales se volverán indistinguibles de las personas reales a pesar de que son amalgamas de esas personas, al igual que productos como Dalle-E construyen arte a partir de amalgamas de imágenes.

Dadas las ventajas de costos masivos de usar contenido creado virtualmente sobre la acción en vivo, el potencial de una tecnología como esta para interrumpir la industria de los medios es significativo. De cara al futuro, no se trata solo de evitar el costo del talento. También se podría eliminar el costo total del estudio donde actuaría el talento.


Dado que GPT-4 ya está haciendo un trabajo interesante con guiones e historias, puede poner esto en la hoja de ruta para tener películas y programas de televisión fotorrealistas completos creados en su totalidad por IA de forma dinámica en función de las preferencias del usuario.

Al final, en lugar de ver el mismo programa de televisión y la misma película que todos los demás, esta tecnología, combinada con la IA generativa, podría crear videos personalizados a escala y potencialmente ponerlo a usted y a su familia como los actores principales (con su permiso, por supuesto). ).

De acuerdo, luego podría compartir esos videos en las redes sociales con aquellos interesados ​​en ver lo que otros crean, creando potencialmente cantidades masivas de contenido único que los servicios necesitarían analizar y presentar a un mundo de clientes potenciales.

Terminando

Ser capaz de crear su gemelo para hacer parte de su trabajo, que es donde DeepBrain AI se enfoca actualmente, es un cambio de juego. Pero cuando podamos tomar imágenes sintetizadas y hacer lo mismo, particularmente para contenido de formato largo, interrumpirá masivamente todas las formas de entretenimiento. La industria de la pornografía, por ejemplo, ya está en esto. El contenido de Reddit ha estado haciendo esto por un tiempo y a la mayoría de los usuarios no parece importarles.

Todo, desde personajes no jugadores (NPC) en el juego que se presentan como si fueran personas reales, hasta poder construir equipos deportivos virtuales completos con representaciones precisas de jugadores reales, imaginarios o incluso muertos, todo está potencialmente sobre la mesa, todo lo que sugiere un nivel de interrupción que solo estamos comenzando a ver.

En resumen, ya es difícil saber qué es real y qué no, y esa dificultad no hará más que crecer. Cuando se trata de entretenimiento, esto puede resultar algo bueno, pero cuando se trata de nuestra capacidad de ver la verdad, puede tener un impacto mucho más problemático. No estamos ni cerca de estar preparados para eso.

Producto tecnológico de la semana

Lenovo ThinkPhone de Motorola

Uno de los errores más grandes que cometió la industria informática fue cambiar completamente al iPhone. La ironía fue que la industria inicialmente no creía en un teléfono inteligente centrado en el consumidor. Luego, en lugar de luchar contra esa tendencia por sus méritos, intentó girar sobre el iPhone para convertir a Apple de un seguidor tardío en un líder del mercado aparentemente de la noche a la mañana.

Esta no era la primera vez que sucedía. Unas décadas antes, IBM intentó pasar a la computación cliente/servidor y casi abandonó el mainframe, llevándolo del claro líder del mercado a casi la quiebra en un corto número de años.

Hoy en día, existe un mercado desatendido con respecto a los teléfonos inteligentes enfocados en los negocios. Una vez hablé con el entonces director ejecutivo de Bank of America, quien no quería que su gente usara teléfonos de consumo. Quería algo seguro y enfocado en los negocios como lo fue alguna vez el BlackBerry, pero estaba frustrado porque nadie había construido tal dispositivo.

Bueno, Lenovo acaba de arreglar eso con su icónico Piense en el teléfono.

Lenovo ThinkPhone de Motorola

Lenovo ThinkPhone de Motorola (Crédito de la imagen: Lenovo)


Basado en la marca ThinkPad, fuertemente enfocada en los negocios que se originó con IBM, el ThinkPhone tiene dimensiones similares a las de un iPhone, pero está envuelto con varias características únicas enfocadas en los negocios.

Estas características incluyen:

  • Conexión instantánea: El teléfono y la PC descubren sin problemas cuando están cerca y se conectan a través de Wi-Fi.
  • Portapapeles unificado: Transfiera sin problemas texto copiado o fotos recientes, documentos escaneados y videos entre dispositivos pegándolos en cualquier aplicación en el dispositivo de destino.
  • Notificaciones unificadas: Las notificaciones telefónicas aparecen instantáneamente en el Centro de actividades de Windows. Al hacer clic en una notificación, se inicia automáticamente la aplicación de teléfono correspondiente en la pantalla de la PC.
  • Caída de archivos: Arrastre y suelte fácilmente archivos entre ThinkPhone y PC.
  • Transmisión de aplicaciones: Abra cualquier aplicación de Android directamente en una PC.
  • Cámara web avanzada: Aproveche las potentes cámaras ThinkPhone y las capacidades de IA, usándolo sin problemas como su cámara web para todas sus videollamadas. ¿Por qué comprar una cámara web separada cuando ya tiene una cámara mejor en su teléfono inteligente?
  • Punto de acceso instantáneo: Conéctese a Internet con un clic directamente desde la PC para aprovechar la conectividad 5G de ThinkPhone. Esto es enorme y potencialmente mitiga la necesidad y el costo de la capacidad WAN en su PC.

Al igual que el ThinkPad, el ThinkPhone está envuelto con seguridad y probado según el estándar militar 810H (MIL-STD-810H) debido a su uso de fibra de aramida (usada en chalecos antibalas), aluminio de calidad aeronáutica y Victus, la solución más robusta. de Gorilla Glass.

El ThinkPhone es resistente al agua hasta una profundidad de 1,5 metros durante un máximo de 30 minutos. Incluso tiene un botón rojo para iniciar una aplicación crítica. Por lo general, elijo la cámara, ya que es a lo que más a menudo necesito acceder rápidamente. Otros pueden usarlo para volver a implementar pulsar para hablar para la policía, la seguridad y otros usos donde la comunicación instantánea es crítica (esto es compatible con Microsoft Equipos Walkie Talkie aplicación).


Diseñado para adoptar la administración remota, ThinkPhone se puede configurar y administrar de forma centralizada para garantizar la seguridad del dispositivo y que no se use de manera inapropiada, un requisito típico para un dispositivo informático orientado a los negocios. ThinkPhone tiene un procesador único llamado Moto Secure que aísla los PIN, las contraseñas y las claves criptográficas, manteniéndolos en un entorno resistente a la manipulación para que los malhechores no puedan acceder a ellos.

ThinkPhone viene con un cargador universal único y muy pequeño de 68 W que cargará el teléfono en minutos y también es lo suficientemente fuerte como para alimentar la mayoría de las computadoras portátiles para empresas u otros dispositivos USB-C, aunque no las máquinas de juego ni las estaciones de trabajo.

Finalmente, el teléfono tiene una cámara de 50 MP de alta calidad que debería cubrir la mayoría de las necesidades fotográficas, ya sea para capturar un evento personal o para un investigador de seguros u otra persona que necesite crear un registro de alta calidad.

El ThinkPhone llena el vacío que existía en los teléfonos comerciales desde que BlackBerry y Palm salieron del mercado, y es mi Producto de la semana.

Fuente

Botón ‘Acción’ del iPhone 15 Pro para reemplazar la función de los botones de volumen al realizar un apagado/reinicio forzado