Un robot con inteligencia artificial que lava y dobla tu ropa ya es una realidad

Descubre cómo un robot con IA transformará el lavado y doblado de tu ropa.
Descubre cómo un robot con IA transformará el lavado y doblado de tu ropa.

Los avances en inteligencia artificial han transformado áreas como el procesamiento del lenguaje y la creación de imágenes y videos fotorrealistas. Sin embargo, un desafío persistente para la IA ha sido su capacidad para interactuar de manera eficiente con el mundo físico. Si bien los sistemas pueden ganar partidas de ajedrez o predecir estructuras complejas de proteínas, tareas aparentemente sencillas como doblar una camisa o limpiar una habitación representan un reto que los investigadores buscan superar. Esto se explica a través de la paradoja de Moravec, que señala que las actividades que los humanos realizan de forma automática y sin esfuerzo requieren una ingeniería sumamente compleja para las máquinas.

Desarrollo del sistema π0

En respuesta a estos desafíos, la empresa Physical Intelligence ha desarrollado un sistema llamado π0 (pi-cero), diseñado para dotar a los robots de “inteligencia física” capaz de realizar tareas en el mundo real con mayor fluidez y adaptabilidad. Este modelo presenta un propósito general en robótica, similar a los modelos de gran escala (LLMs) que se centran en el significado del texto. A diferencia de los LLMs, que solo comprenden y generan lenguaje, el sistema π0 integra imágenes, texto y acciones para emitir comandos precisos.

Entrenamiento basado en experiencias físicas

El enfoque del sistema apoya un entrenamiento basado en experiencias físicas de los robots, permitiéndoles aprender y adaptarse a distintos tipos de tareas. El sistema se entrena utilizando una combinación de datos abiertos de manipulación robótica y conjuntos propios de preentrenamiento en visión-lenguaje obtenidos de Internet. Esto permite que el robot aprenda a ejecutar una variedad de tareas físicas, desde recoger ropa y basura hasta ensamblar cajas. Además, el sistema es capaz de realizar acciones continuas a alta frecuencia, hasta 50 veces por segundo, facilitando el control hábil y preciso que se necesita para tareas complejas.

Aplicaciones del sistema π0

Una de las aplicaciones más destacadas del sistema π0 es en el doblado de ropa. Esta tarea, que puede parecer simple, se complica en la práctica debido a la imprevisibilidad de la disposición de las prendas. Mientras que un humano puede ajustar intuitivamente sus movimientos para encontrar arrugas o pliegues inesperados, un robot debe tomar decisiones en tiempo real. El sistema ha sido entrenado con un amplio conjunto de manipulaciones de distintos grados de dificultad, logrando superar este obstáculo. El robot es capaz de manejar una pila de ropa, transportarla a una mesa y doblarla de manera ordenada. Además, puede repetir secuencias preprogramadas y modificar su estrategia si la tarea se complica, por ejemplo, cuando alguien interviene y no está en la posición esperada.

Separación de residuos y manejo de objetos

Otra aplicación significativa del sistema π0 se encuentra en la manipulación de mesas, donde el robot debe separar platos, cubiertos y residuos entre recipientes y cubetas de servicio. Esta tarea requiere manejar múltiples objetos de diferentes tamaños y formas, lo que supone un desafío para los sistemas tradicionales. Gracias a las complejas estrategias emergentes, el robot puede apilar platos antes de colocarlos en la cubeta y sacudir los residuos de un plato para desecharlos.

Tecnología detrás del sistema π0

La tecnología que respalda el sistema π0 comienza con modelos preentrenados como GPT-4V y Gemini, que ya poseen una base de conocimiento semántico y comprensión visual. A estos modelos se les ha agregado una salida única y continua mediante una técnica llamada flow matching, que es un tipo de difusión motor de frecuencia. La arquitectura del sistema combina elementos específicos que permiten responder rápidamente a situaciones cambiantes. Este proceso también incluye una fase de post-entrenamiento afinado, que es particularmente importante para garantizar que el doblado de ropa se realice con la mayor calidad y precisión posible. El ajuste fino se lleva a cabo en los LLMs para adaptarlos a tareas específicas después de un entrenamiento general.