Transferencia de movimiento con Inteligencia Artificial
La transferencia de movimiento basada en inteligencia artificial es uno de los últimos experimentos, donde las máquinas reproducen los movimientos humanos a partir de un video. Y es que en los ultimos años la tecnología se ha transformado; no tanto por lo que podemos hacer con ella sino en lo que hacemos.
Con este nuevo avance los expertos aseguran que se transformarán nuestras relaciones laborales y muchos trabajos en los próximos años.
La generación de imágenes es una de las áreas que más se está explorando; por ejemplo, si describimos textualmente una imagen a este tipo de sistemas la inteligencia artificial generará rápidamente distintas variaciones de lo que le indicamos.
Por su parte, la generación de videos trabaja igual que la anterior pero en vez de generar imagenes, genera videos a partir de texto. Incluso, ya han desarrollado sistemas de inteligencia artificial de traducción de voz y otros que «reviven la voz» de personas fallecidas a partir de una serie de datos.
Transferencia de movimiento
Actualmente existen dos técnicas denominadas, transferencia de estilo y estimación de poses, en la primera se toma una fotografía, se coloca una pintura junto a ella y se aplica el estilo de la pintura a la foto; en la segunda, tenemos una fotografía o un video de un individuo, y la salida es un esqueleto que muestra la postura actual de esta persona.
Entonces, qué pasaría si se combina el poder de la estimación de poses con la expresividad de la transferencia de estilo. Imagina que tomamos el video de un bailarín profesional, grabamos un video propio, y luego transferimos la actuación del bailarín a nuestro propio cuerpo en el video.
Los científicos llaman a esto transferencia de movimiento. Con estas técnicas se tiene en cuenta la coherencia temporal. Es decir, el algoritmo sabe lo que ha hecho hace un momento y hará algo similar, lo que hace que los movimientos del baile sean fluidos y creíbles.
¿Cómo funciona esta inteligencia artificial?
Esta inteligencia artificial utiliza una red antagónica generativa, donde tenemos una red neuronal para generar el esqueleto para una imagen y una red generadora para crear nuevas imágenes cuando se le da un sujeto de prueba y una nueva postura del esqueleto.
Estas dos redes neuronales trabajan entre sí y se enseñan mutuamente a distinguir y crear imágenes cada vez más auténticas con el tiempo.
En conclusión, la transferencia de movimiento basada en inteligencia artificial se conoce como «haz lo que yo hago». A partir de un video de una persona bailando, se pudo transferir esa actuación a un video de otra persona diferente después de algunos minutos de que el sujeto objetivo realizara movimientos estándar.
Para transferir el movimiento, se extrajeron poses del sujeto de origen y se aplicó el mapeo aprendido de pose apariencia para generar al sujeto final.