Universidad del Sur de California
La Inteligencia Artificial (IA) puede definirse como el medio por el cual las computadoras, los robots y otros dispositivos realizan tareas que normalmente requieren de la inteligencia humana. Por ejemplo, la resolución de cierto tipo de problemas, la capacidad de discriminar entre distintos objetos o el responder a órdenes verbales. La IA agrupa un conjunto de técnicas que, mediante circuitos electrónicos y programas avanzados de computadora, busca imitar procedimientos similares a los procesos inductivos y deductivos del cerebro humano. Se basa en la investigación de las redes neuronales humanas y, a partir de ahí, busca copiar electrónicamente el funcionamiento del cerebro.
Pero estas redes aún luchan cuando se trata de algo que los humanos hacen de forma natural: imaginar.
En otras palabras, como humanos, es fácil imaginar un objeto con diferentes atributos. Pero, a pesar de los avances en las redes neuronales profundas que igualan o superan el desempeño humano en ciertas tareas, las computadoras aún luchan con la habilidad humana de la “imaginación”.
Para intentar desbloquear la capacidad de imaginación de la IA, los investigadores han ideado un nuevo método para permitir que los sistemas de inteligencia artificial averigüen cómo debería verse un objeto, incluso si nunca antes habían visto uno exactamente igual.
“Nos inspiraron las capacidades de generalización visual humana para intentar simular la imaginación humana en máquinas”, dice el científico informático Yunhao Ge de la Universidad del Sur de California (USC).
El documento, titulado Zero-Shot Synthesis with Group-Supervised Learning, fue publicado en la Conferencia Internacional de Representaciones del Aprendizaje de 2021 el 7 de mayo.
“Los seres humanos pueden separar su conocimiento aprendido por atributos — por ejemplo, forma, pose, posición, color — y luego recombinarlos para imaginar un nuevo objeto. Nuestro artículo intenta simular este proceso utilizando redes neuronales”, dijo Ge.
Por ejemplo, supongamos que desea crear un sistema de inteligencia artificial que genere imágenes de automóviles. Idealmente, proporcionaría al algoritmo algunas imágenes de un automóvil, y podría generar muchos tipos de automóviles, desde Porsche hasta Pontiacs y camionetas, en cualquier color, desde múltiples ángulos.
Este es uno de los objetivos largamente buscados de la IA: crear modelos que puedan extrapolar. Esto significa que, dados algunos ejemplos, el modelo debería poder extraer las reglas subyacentes y aplicarlas a una amplia gama de ejemplos novedosos que no ha visto antes. Pero las máquinas se entrenan más comúnmente en características de muestra, píxeles por ejemplo, sin tener en cuenta los atributos del objeto.
Figura 1. EN un nuevo enfoque para enseñar a las IA a “imaginar lo invisible”, las imágenes de entrenamiento (abajo) se combinan para sintetizar la imagen solicitada (arriba). Imagen: USC
En este nuevo estudio, los investigadores intentan superar esta limitación utilizando un concepto llamado desenredo. El desenredo se puede utilizar para generar deepfakes, por ejemplo, desenredando los movimientos del rostro humano y la identidad. Al hacer esto, dijo Ge, “la gente puede sintetizar nuevas imágenes y videos que sustituyen la identidad de la persona original por otra, pero mantienen el movimiento original”.
De manera similar, el nuevo enfoque toma un grupo de imágenes de muestra, en lugar de una muestra a la vez, como lo han hecho los algoritmos tradicionales, y extrae la similitud entre ellas para lograr algo llamado “aprendizaje de representación de desenredado controlable”.
Luego, recombina este conocimiento para lograr una “síntesis de imagen novedosa controlable”, o lo que podríamos llamar imaginación. “Por ejemplo, tome la película Transformer como ejemplo”, dijo Ge, “Puede tomar la forma de un automóvil Megatron, el color y la pose de un automóvil Bumblebee amarillo y el fondo de Times Square de Nueva York. El resultado será un automóvil Megatron color abejorro conduciendo en Times Square, incluso si esta muestra no fue presenciada durante la sesión de capacitación”.
Esto es similar a cómo extrapolamos los humanos: cuando un humano ve un color de un objeto, podemos aplicarlo fácilmente a cualquier otro objeto sustituyendo el color original por el nuevo. Usando su técnica, el grupo generó un nuevo conjunto de datos que contiene 1.56 millones de imágenes que podrían ayudar a futuras investigaciones en el campo.
Si bien el desenredo no es una idea nueva, los investigadores dicen que su marco puede ser compatible con casi cualquier tipo de datos o conocimientos.
En el campo de la medicina, podría ayudar a los médicos y biólogos a descubrir fármacos más útiles desenredando la función de la medicina de otras propiedades y luego recombinándolas para sintetizar nuevas medicinas. Imbuir máquinas con imaginación también podría ayudar a crear una IA más segura, por ejemplo, al permitir que los vehículos autónomos imaginen y eviten escenarios peligrosos nunca antes vistos durante el entrenamiento.
Fuente: USC