Un pequeño ícono apareció en lo que antes era sólo un espacio para escribir e interactuar a través del teclado con el chatbot de OpenAI, llamado Chat GPT. Hace unos días anunciaron que ahora podría interpretar imágenes, gráficas y toda suerte de dibujos.
De inmediato subí una fotografía con una escena familiar; otra con la floración de un cerezo en abril y una más de una laguna al pie de un glaciar. El GPT describió con precisión el tema, ambiente, atmósfera y la solemnidad de un evento religioso.
Desde el primer momento encontré sentido a todo lo que explicaba la inteligencia generativa a partir de una imagen. La sorpresa fue mayor de lo que esperaba. De inmediato compartí el descubrimiento.
En OpenAI deben estar alimentando con una cantidad inimaginable de fotografías, lugares, mapas e infografías a sus máquinas para el aprendizaje de sus redes neuronales. Pronto podrían identificar todas las obras de arte pictóricas de los museos más importantes del mundo. Además ofrecer una descripción crítica del objeto.
De la laguna al pie del glaciar escribió:
“Esta es una imagen impresionante de un paisaje helado que muestra icebergs flotantes con el telón de fondo de majestuosas montañas y un cielo despejado. El agua prístina y los icebergs flotantes ofrecen una vista cautivadora de la belleza natural de las regiones glaciares.
“La escena parece recordar a lugares como Jökulsárlón, una gran laguna glaciar en el sureste de Islandia. Jökulsárlón y lagunas similares se forman debido al deshielo de los glaciares y albergan icebergs flotantes que se han desprendido del glaciar principal.
“El azul cristalino del agua, combinado con los diferentes tonos de los icebergs, desde el blanco puro hasta el azul profundo, crea un ambiente sereno y fascinante. El contraste del hielo contra las montañas oscuras y las suaves ondulaciones en el agua añaden profundidad y carácter a la escena”.
El chat acertó el país y la zona del glaciar: el sureste de Islandia. Pero no hay seguridad de que provenga de Jökulsárlón. En momentos pareciera que la máquina tiene un entrenamiento refinado y elegante en el lenguaje de descripción, tanto que debemos recordar que no es una persona, ni tiene sensibilidad artística.
La IA cada día se acercará más a la imitación de nuestra percepción de la realidad, con la ventaja de que nuestra inteligencia está limitada pero comenzará a multiplicar su potencia con la AI.
Es como ir en bicicleta, subirse a un auto y luego a un jet. Esperemos tener conciencia suficiente y un buen ritmo de comprensión para seguir de cerca lo que pasa en la explosión de la IA.
Al crecer la percepción de la herramienta pueden suceder cosas maravillosas: la velocidad de la enseñanza y el aprendizaje a través de la IA transformará todo. Programar no será la tarea repetitiva y tediosa que lleva jornadas extenuantes para generar un algoritmo. La propia herramienta creará soluciones a partir de órdenes verbales.
El trabajo cambiará de naturaleza. Diseñaremos casas, máquinas, ciudades y hasta intervenciones quirúrgicas mediante la interacción audiovisual con la IA. Los robots danzarán por todas partes ayudando en las tareas mecánicas y la investigación científica será modelada a través de simuladores.
Habrá que preguntarle a la herramienta si también podrá imaginar el futuro.