in

Después de los LLM y los agentes, la próxima frontera de la IA: los modelos de lenguaje de vídeo

Después de los LLM y los agentes, la próxima frontera de la IA: los modelos de lenguaje de vídeo

«En la IA física, este modelo tendría que capturar la geometría visual 3D y las leyes físicas (gravedad, fricción, colisiones, etc.) involucradas en la interacción con todo tipo de objetos en entornos arbitrarios», dijo Kenny Siebert, ingeniero de investigación de IA en Bots estándar.

Luego, los modelos mundiales ayudan a los robots a comprender y evaluar las consecuencias de las acciones que puedan tomar. Algunos modelos mundiales generan simulaciones breves en forma de vídeo de posibles resultados en cada paso, lo que ayuda a los robots a elegir la mejor acción.

“Creo que la diferencia con los modelos mundiales es [that] «No basta con predecir las palabras en una señal o los píxeles que podrían suceder a continuación, sino que tiene que comprender realmente lo que podría suceder», dijo Galda. Por ejemplo, un robot podría leer señales como «alto» o «zona peligrosa» en el piso de una fábrica o en la carretera y comprender que debe tener mucho cuidado al avanzar.

Fuente

7Artisans anunció tres nuevos lentes compactos 25-35-50 mm f/1.8 E

Se anuncia Meike AF 85mm F1.8 SE II para Canon EF, con adaptadores MEIREC EF‑a‑RF que se lanzarán el 27 de diciembre