Después de los LLM y los agentes, la próxima frontera de la IA: los modelos de lenguaje de vídeo

«En la IA física, este modelo tendría que capturar la geometría visual 3D y las leyes físicas (gravedad, fricción, colisiones, etc.) involucradas en la interacción con todo tipo de objetos en entornos arbitrarios», dijo Kenny Siebert, ingeniero de investigación de IA en Bots estándar.

Luego, los modelos mundiales ayudan a los robots a comprender y evaluar las consecuencias de las acciones que puedan tomar. Algunos modelos mundiales generan simulaciones breves en forma de vídeo de posibles resultados en cada paso, lo que ayuda a los robots a elegir la mejor acción.

“Creo que la diferencia con los modelos mundiales es [that] «No basta con predecir las palabras en una señal o los píxeles que podrían suceder a continuación, sino que tiene que comprender realmente lo que podría suceder», dijo Galda. Por ejemplo, un robot podría leer señales como «alto» o «zona peligrosa» en el piso de una fábrica o en la carretera y comprender que debe tener mucho cuidado al avanzar.

Fuente

No me importaba el nuevo Star Fox hasta que descubrí quién lo haría

Por qué dejo Copilot por Géminis

Revisión práctica de Viltrox AF 90 mm F2.2 EVO + flujo de trabajo de limpieza de imágenes y videos de Aiarty

El recuento de jugadores de Destiny 2 se eleva por encima del más alto jamás registrado en Marathon mientras los guardianes inician sesión para la actualización final

La decisión del Reino Unido de filtrar fotos y mensajes genera preocupaciones de cifrado para los CISO

Presentamos asignaciones de tiempo – Últimas noticias – Desarrollador de Apple

Después de los LLM y los agentes, la próxima frontera de la IA: los modelos de lenguaje de vídeo

Por qué dejo Copilot por Géminis

La decisión del Reino Unido de filtrar fotos y mensajes genera preocupaciones de cifrado para los CISO

Los planes de IA de Apple son prometedores, pero la prueba del éxito aún está por llegar: analistas

Nextcloud agrega Euro-Office a la suite Hub para el lugar de trabajo y amplía el asistente de IA

Descubra Go 6 (Gen II): el eReader de 6″ apto para viajes con un diseño renovado. – Coolsmartphone

La nueva orden de inteligencia artificial de Trump: las alucinaciones no son solo para estudiantes de maestría en maestría

7Artisans anunció tres nuevos lentes compactos 25-35-50 mm f/1.8 E

Se anuncia Meike AF 85mm F1.8 SE II para Canon EF, con adaptadores MEIREC EF‑a‑RF que se lanzarán el 27 de diciembre

No me importaba el nuevo Star Fox hasta que descubrí quién lo haría

Por qué dejo Copilot por Géminis

Revisión práctica de Viltrox AF 90 mm F2.2 EVO + flujo de trabajo de limpieza de imágenes y videos de Aiarty

El recuento de jugadores de Destiny 2 se eleva por encima del más alto jamás registrado en Marathon mientras los guardianes inician sesión para la actualización final

La decisión del Reino Unido de filtrar fotos y mensajes genera preocupaciones de cifrado para los CISO

Presentamos asignaciones de tiempo – Últimas noticias – Desarrollador de Apple