PsicoPop
Inicio » ¿La IA puede crear arte?

¿La IA puede crear arte?

Las carencias actuales de la inteligencia artificial en el ámbito del arte

por Mau UrrutiaMau Urrutia
53 lecturas

En 1953 Roald Dahl publicó “The Great Automatic Grammatizator“, una historia sobre un ingeniero que quería ser escritor bajo el anonimato. Al día siguiente de completar la construcción de la máquina de cálculo más rápida del mundo, se dio cuenta de que la gramática inglesa se rige por normas casi matemáticas. Así, construyó una máquina de escribir ficción capaz de generar una historia corta de cinco mil palabras en treinta segundos… Para una novela tardaría solo quince minutos y solo haría falta que la persona manipulara unas asas y pedales, como si condujera un coche o tocara un órgano, a fin de regular el nivel de humor y el tono del escrito . Las novelas resultaron ser tan populares, que en un año la mitad de las obras de ficción publicadas en inglés, serían producto de esta invención.

Hoy, ¿hay algo en el arte que nos haga pensar que no se puede crear pulsando un botón, como en la imaginación de Dahl? Ahora mismo, la ficción generada por grandes modelos de lenguaje como ChatGPT es patética, pero seguramente estos programas mejorarán en breve. ¿Cómo pueden llegar a ser de buenos? ¿Mejor que los humanos? ¿Y en el ámbito de la pintura o del cine?

¿Qué es para ti el arte? No es fácil de definir, ¿verdad? Simplificándolo y haciendo una generación podríamos decir que el arte es el resultado de muchas elecciones , y esto podría explicarse fácilmente si utilizamos como ejemplo la escritura de ficción: cuando escribimos ficción, estamos, consciente o inconscientemente, eligiendo casi todas las palabras que escribimos. Si todavía lo simplificamos más, podemos imaginar que una historia corta de diez mil palabras sigue algo del orden de diez mil opciones, y cuando damos una indicación a una inteligencia artificial generativa, estamos haciendo muy pocas elecciones: si proporcionamos una indicación de cien palabras, hemos tomado unas cien opciones.

Esto significa que si una I.A. genera una historia de diez mil palabras basada en lo que le has indicado, debe llenar todas las opciones que no has hecho ni has indicado, y para ello hay diferentes maneras: una de ellas, es promediar las elecciones que han hecho otros escritores, tal y como representa el texto hallado en Internet, y esta media equivale a las opciones menos interesantes y más mediocres posibles, de ahí que el texto que genera la I.A. es, a menudo, soso y sin gracia.

Otra forma es indicar al programa que imite un estilo, emulando las elecciones que ha hecho un escritor en concreto, pero esto genera una historia muy derivada…

💡 En ninguno de los dos casos se está creando arte interesante.

Fijémonos ahora en el caso del arte visual: es cierto que es más difícil cuantificar las elecciones que puede hacer un pintor, por ejemplo, pero fíjate en que las pinturas reales llevan la marca de un gran número de decisiones. Cuando le pedimos a un programa que convierte texto a imagen como dall-e, podemos dar una indicación como “Un caballero con armadura que lucha contra un dragón que escupe fuego” y dejar que el programa haga el resto.

🧠 La versión actual de dall-e acepta indicaciones de hasta cuatro mil caracteres, es decir, cientos de palabras, pero no son suficientes para describir todos los detalles de una escena.

La mayoría de las opciones de la imagen resultante deben tomarse en préstamo de pinturas similares encontradas online, y la imagen se puede representar de forma exquisita, sí, pero la persona que introduce las indicaciones no puede reclamar su autoría.

Hay quien imagina que los generadores de imágenes acabarán afectando a la cultura visual al igual que lo hizo en la fotografía, pero aceptar que la fotografía es similar a la I.A. generativa no puede hacerse de forma tan rápida: cuando se desarrolló la fotografía nadie debió imaginarse que sería un medio artístico porque no era evidente que hubiera opciones para tomar: bastaba con configurar la cámara y empezar la exposición. Con el tiempo, la gente se dio cuenta de que había muchas cosas que se podían hacer con las cámaras, y el arte está precisamente en eso: en las muchas opciones que hace un fotógrafo.

💡 Vale, no es sencillo ser conscientes de cuáles son las opciones, pero cuando comparamos las fotos de un aficionado con las de un profesional, podemos ver que hay alguna diferencia.

🧠 Y de ahí la pregunta: ¿hay una oportunidad similar para realizar un gran número de opciones mediante un generador de texto a imagen?

Seguramente no. Un artista, tanto si trabaja digitalmente como con pintura, toma implícitamente muchas más decisiones durante el proceso de realización de una pintura de las que encajaría en un mensaje de texto de varios cientos de palabras.

El director de cine Bennett Miller ha utilizado dall-e para generar unas imágenes muy impactantes que se han expuesto en la galería Gagosian. Para crearlas, creó instrucciones de texto detalladas y después pidió a dall-e que revisara y manipulara las imágenes generadas una y otra vez, generando más de cien mil imágenes para llegar a las veinte imágenes de la exposición . Pero ha dicho que no ha podido obtener resultados comparables en lanzamientos posteriores de dall-e, posiblemente porque Miller utilizaba dall-e para algo que no pretende hacer, es decir, es como si pirateara Microsoft Paint para que se comportase como Adobe Photoshop, pero en cuanto se publicó una nueva versión de Paint, sus hacks dejaron de funcionar.

Probablemente, OpenAI no está intentando crear un producto para servir a usuarios como Miller, porque un producto que requiere que un usuario trabaje durante meses para crear una imagen no es atractivo para un público amplio, es decir, la empresa quiere ofrecer un producto que genere imágenes con un mínimo esfuerzo.

☝🏻 Igual sucede con un escritor que utiliza la I.A. por escribir una buena novela, y es que el problema de la I.A. generativa es que estos programas generan mucho más de lo que pones, y eso es lo que impide, precisamente, que sean herramientas efectivas para los artistas.

Empresas promotoras de la I.A. como Adobe afirman que desencadenarán la creatividad, es decir, están diciendo que el arte puede ser toda inspiración y no transpiración, pero estos dos conceptos no pueden separarse fácilmente, porque el arte requiere tomar decisiones en todas las escalas, y las innumerables elecciones a pequeña escala realizadas durante la implementación son tan importantes para el producto final como las pocas elecciones a gran escala realizadas durante la concepción. Es un error equiparar “a gran escala” con “importante” cuando se trata de las elecciones que se realizan a la hora de crear arte; ¡La interrelación entre la gran y la pequeña escala es donde radica el arte!

Creer que la inspiración supera a todo lo demás, es signo de que alguien no está familiarizado con el medio, y eso es cierto, aunque el objetivo de uno sea crear entretenimiento en lugar de arte. A menudo se subestima el esfuerzo necesario para entretener: una novela de thriller puede no estar a la altura del ideal de libro de Kafka – un “hacha para el mar helado que tenemos dentro“, pero todavía puede ser tan finamente elaborada como un reloj suizo. Y un thriller eficaz es más que su premisa o su trama, por lo que podemos dudar de que podamos sustituir cada frase de un thriller por una que sea semánticamente equivalente y que la novela resultante sea tan entretenida. Esto significa que sus frases, y las opciones a pequeña escala que representan, ayudan a determinar la eficacia del thriller.

¿Pero automatizar los escritos que no tienen la expectativa de incluir miles de opciones? Cualquier escrito que merezca tu atención como lector es fruto del esfuerzo de quien lo ha escrito. El esfuerzo durante el proceso de escritura no garantiza que valga la pena leer el producto final, pero sin él no se puede hacer un trabajo que valga la pena. El tipo de atención que prestas al leer un correo electrónico personal es diferente al que prestas cuando leas un informe comercial, pero en ambos casos solo se garantiza cuando el escritor piensa un poco.

Durante los Juegos Olímpicos de París, Google emitió un anuncio de Gemini, el competidor del GPT-4 de OpenAI. En este anuncio se muestra a un padre utilizando Gemini para redactar una carta como fan, que su hija enviará a un atleta olímpico que le inspira. Google retiró el anuncio tras la reacción generalizada de los espectadores: nadie espera que la carta de fan de un niño a un deportista sea extraordinaria : si la joven hubiera escrito la carta ella misma, probablemente habría sido indistinguible de otras muchas: la importancia de la carta de un niño, tanto para el niño que la escribe como para el deportista que la recibe, acaba de ser sincera más que ser elocuente.

¿Cuántas veces hemos enviado tarjetas de felicitación compradas a la tienda, sabiendo que el destinatario tendrá claro que no hemos escrito nosotros las palabras de la dedicatoria? El programador Simon Willison ha descrito la formación para grandes modelos de lenguaje como un “blanqueo de dinero para datos con derechos de autor“, una forma útil de pensar en el atractivo de la I.A. generativa.

Unos programas que permiten participar en algo como el plagio, pero sin tener la culpa asociada porque ni siquiera tenemos claro que estamos copiando.

chatGPT estic content

Es muy fácil conseguir que ChatGPT emita una serie de palabras tales como “Estoy contento de verte“. Hay muchas cosas que no entendemos sobre cómo funcionan los grandes modelos de idioma, pero algo de lo que podemos estar seguros es de que ChatGPT no está contento de verte. Un perro puede comunicar que está feliz de verte, y un niño prelingüístico también, aunque ambos no tienen la capacidad de utilizar palabras. ChatGPT no siente nada y no desea nada, y esta falta de intención es la razón por la que ChatGPT no utiliza realmente el lenguaje: lo que hace que las palabras “me alegra de verte” sean un enunciado lingüístico no es que la secuencia de fichas de texto que la componen esté bien formada, lo que le convierte en un enunciado lingüístico es la intención de comunicar algo.

Tenemos la tentación de proyectar estas experiencias en un gran modelo de lenguaje cuando emite frases coherentes, pero hacerlo es caer en el mimetismo: es el mismo fenómeno que cuando las mariposas desarrollan grandes manchas oscuras en las alas que pueden engañar a los pájaros haciéndoles pensar que son depredadores con ojos grandes. Hay un contexto en el que las manchas oscuras son suficientes. Es menos probable que los pájaros coman una mariposa que las tengan, y a la mariposa no le importa realmente por qué no se la come, siempre que llegue a vivir. Pero existe una gran diferencia entre una mariposa y un depredador que supone una amenaza para un pájaro.

La lingüista Emily M. Bender señala que los profesores no piden a los estudiantes que escriban ensayos porque el mundo necesita más ensayos de estudiantes: el objetivo de escribir ensayos es fortalecer las habilidades de pensamiento crítico de estos . De la misma forma que el levantamiento de pesas es útil, independientemente del deporte que practique el deportista, la escritura de ensayos desarrolla las habilidades necesarias para cualquier trabajo que obtendrá un estudiante universitario.

Utilizar ChatGPT para completar las tareas es como llevar una carretilla elevadora a la sala de pesas: nunca mejorarás tu forma cognitiva de esta manera.

El informático François Chollet ha propuesto la siguiente distinción: la habilidad es el buen rendimiento que se hace en una tarea, mientras que la inteligencia es la eficiencia con la que adquiere nuevas habilidades, y esto refleja bastante bien nuestras intuiciones sobre los seres humanos, porque la mayoría de la gente puede aprender una nueva habilidad si hay suficiente práctica, pero cuanto más rápido la adquiere la persona, más inteligente pensamos que es . Lo interesante de esta definición es que, a diferencia de los tests del cociente intelectual, también es aplicable a entidades no humanas: cuando un perro aprende un nuevo truco rápidamente, lo consideramos un signo de inteligencia.

En 2019, unos investigadores realizaron un experimento en el que enseñaron a conducir a las ratas . Pusieron las ratas en pequeños recipientes de plástico con tres barras de alambre de cobre. Cuando los ratones ponían sus patas en una de estas barras, el contenedor avanzaba, giraba a la izquierda o giraba a la derecha. Las ratas pudieron ver un plato de comida al otro lado de la sala e intentaron que sus vehículos fueran hacia él. Los investigadores entrenaron continuamente a las ratas durante cinco minutos y después de 24 sesiones de práctica, las ratas ya sabían conducir. Veinticuatro sesiones fueron suficientes para dominar una tarea que, probablemente, ninguna rata se había encontrado antes en la historia evolutiva de la especie. ¿Es una buena demostración de inteligencia, verdad?

AlphaZero es un programa desarrollado por DeepMind de Google, y juega al ajedrez mejor que cualquier jugador humano, pero durante su entrenamiento jugó cuarenta y cuatro millones de partidas, mucho más de lo que cualquier humano puede jugar en toda la vida. Para que pueda dominar un juego nuevo, tendrá que someterse a una cantidad igualmente enorme de entrenamiento. Según la definición de Chollet, programas como AlphaZero son altamente calificados, pero no son especialmente inteligentes porque no son eficientes para adquirir nuevas habilidades . Actualmente, es imposible escribir un programa informático capaz de aprender incluso una tarea sencilla en tan solo veinticuatro pruebas, si el programador no le proporciona información previamente sobre la misma.

Los coches autónomos entrenados en millones de kilómetros de conducción todavía hoy pueden chocar contra un camión que tiene el remolque volcado, y esto es porque estas cosas no se encuentran habitualmente en sus datos de entrenamiento, mientras que los humanos que toman su primera clase de conducción sabrán detenerse. Más que nuestra capacidad de resolver ecuaciones algebraicas, nuestra capacidad de enfrentarnos a situaciones desconocidas es una parte fundamental de por qué consideramos que los humanos somos inteligentes. Los ordenadores no podrán sustituir a los humanos hasta que no adquieran este tipo de competencia.

La I.A. es una tecnología fundamentalmente deshumanizadora porque nos trata como menos de lo que somos: creadores y aprehensores del significado. Reduce la cantidad de intenciones en el mundo.

Algunas personas han defendido los grandes modelos lingüísticos diciendo que la mayoría de lo que dicen o escriben los seres humanos no es especialmente original. Y esto es cierto, pero también es irrelevante. Cuando alguien te dice “lo siento“, no importa que otras personas hayan pedido perdón en el pasado, no importa que “lo siento” sea una cadena de texto que estadísticamente no es remarcable. Si alguien está siendo sincero, su disculpa es valiosa y significativa, aunque previamente se han pronunciado disculpas. De la misma forma, cuando dices a alguien que estás contento de verlo, está diciendo algo significativo, aunque no tenga “novedad”.

Y en lo que respecta al arte: tanto si estás creando una novela, un cuadro o una película, está comprometido en un acto de comunicación entre tú y tu público. Lo que creas no debe ser completamente diferente de todas las obras de arte anteriores de la historia de la humanidad para ser valioso: el que seas tú quien lo diga, el hecho de que derive de tu experiencia vital única y llegue en un momento concreto de la vida de quien está viendo tu obra, es lo que la hace nueva.

Todos somos productos de lo que nos ha venido antes, pero es viviendo nuestra vida en interacción con los demás que damos sentido al mundo. Esto es algo que un algoritmo de autocompletar nunca puede hacer y no dejes que nadie te diga lo contrario.

📎 Urrutia, M. [Maurici]. (2024, 03 septiembre). ¿La IA puede crear arte?. PsicoPop. https://www.psicopop.top/es/la-ia-puede-crear-arte/


📖 Referencias:

Subscribe
Notify of
0 Comentaris
Newest
Oldest Most Voted
Inline Feedbacks
View all comments

Publicaciones relacionadas

¿Seguro que quieres desbloquear esta publicación?
Desbloqueos pendientes : 0
¿Seguro que quieres cancelar la suscripción?

Este sitio web utiliza galletas para mejorar tu experiencia. Si continuas, asumimos que estás de acuerdo. Aceptar

Política de privacidad