«En la IA física, este modelo tendría que capturar la geometría visual 3D y las leyes físicas (gravedad, fricción, colisiones, etc.) involucradas en la interacción con todo tipo de objetos en entornos arbitrarios», dijo Kenny Siebert, ingeniero de investigación de IA en Bots estándar.
Luego, los modelos mundiales ayudan a los robots a comprender y evaluar las consecuencias de las acciones que puedan tomar. Algunos modelos mundiales generan simulaciones breves en forma de vídeo de posibles resultados en cada paso, lo que ayuda a los robots a elegir la mejor acción.
“Creo que la diferencia con los modelos mundiales es [that] «No basta con predecir las palabras en una señal o los píxeles que podrían suceder a continuación, sino que tiene que comprender realmente lo que podría suceder», dijo Galda. Por ejemplo, un robot podría leer señales como «alto» o «zona peligrosa» en el piso de una fábrica o en la carretera y comprender que debe tener mucho cuidado al avanzar.


