DALL-E 2 AI de OpenAI es una mala noticia para algunos artistas

DALL-E 2 de OpenAI sorprendió a quienes pensaban que la inteligencia artificial nunca (o al menos no pronto) comenzaría a penetrar en el ámbito de la creatividad. ¿Pero DALL-E 2 está aquí para mantener ocupados a los artistas?

¿Cómo funciona DALL-E 2?

El DALL-E 2 es tan impresionante que casi se siente como magia, pero los detalles generales de cómo crea imágenes tan sorprendentes y realistas no son tan difíciles de entender.

DALL-E 2 consta de dos componentes principales. El primero es GPT-3 , que posiblemente sea el algoritmo de aprendizaje automático de lenguaje natural más avanzado hasta la fecha. DALL-E 2 también utiliza otro modelo de OpenAI conocido como CLIP (Entrenamiento previo de imagen de lenguaje contrastivo).

GPT-3 y CLIP permiten que una computadora entienda y genere un lenguaje natural complejo. Al entrenar una red neuronal DALL-E con miles de millones de imágenes y sus descripciones en lenguaje natural de (principalmente) Internet, aprende relaciones entre conceptos.

En cierto modo, DALL-E es lo opuesto a la práctica común de aprendizaje automático en la que proporciona una imagen y la IA intenta describir lo que ve.

Piense en la infame aplicación » Not a Hot Dog » del programa de televisión de Silicon Valley . La diferencia aquí es que en lugar de preguntarle a la IA si la imagen es un perrito caliente o no, describe un perrito caliente y crea una imagen de perrito caliente completamente original basada en todo lo que ha aprendido sobre ellos.

La segunda parte importante de DALL-E es cómo genera imágenes. Utiliza una técnica conocida como «difusión». En particular, la comprensión de la descripción del lenguaje humano de una imagen que se ha creado se convierte en una imagen utilizando un modelo OpenAI llamado GLIDE . GLIDE toma una imagen que consiste en ruido generado aleatoriamente y luego elimina gradualmente ese ruido hasta que coincide con la imagen tal como se describe en lenguaje natural. Es algo así como un escultor que comienza con un trozo de mármol y lo corta hasta que solo queda la estatua.

Para obtener una descripción mucho más técnica y detallada de DALL-E 2 bajo el capó, recomendamos de todo corazón la explicación de DALL-E 2 en el blog de aprendizaje profundo de AssemblyAI.

Por qué DALL-E 2 es tan revolucionario

DALL-E 2 está lejos de ser el primer software de aprendizaje automático capaz de generar imágenes. Ha habido muchos sistemas anteriores, y DALL-E 2 se basa en las lecciones aprendidas de esos otros proyectos. Entonces, ¿por qué esta vez se siente como un punto de inflexión decisivo?

Una razón importante es que las imágenes que crean DALL-E y DALL-E 2 son estéticamente agradables. Otros sistemas de imágenes de IA a menudo producen imágenes que las personas describen como perturbadoras o como algo salido de un sueño. Es un poco como Uncanny Valley, pero para las bellas artes. El DALL-E 2 crea imágenes que claramente tienen un ojo artístico o algún sentido estético detrás de ellas.

Por lo tanto, las imágenes que crea DALL-E 2 son comparables a las imágenes creadas por artistas o fotógrafos talentosos que han desarrollado su sentido estético durante toda su vida. No es difícil imaginar a alguien así mirando las imágenes que DALL-E 2 puede producir en segundos y sintiendo que están a punto de volverse irrelevantes.

El sistema no solo puede crear bellas imágenes de alta resolución en segundos a partir de señales de lenguaje natural, sino que también puede personalizar y editar esas imágenes, o proporcionar múltiples variaciones de una imagen existente, incluso una proporcionada por el usuario. ¿Significa esto que los artistas deberían empacar sus caballetes y tabletas de dibujo y » aprender a codificar » en su lugar?

DALL-E 2 significa que los artistas cambiarán, no desaparecerán

OpenAI ha sido muy cuidadoso al simplemente presentar su tecnología al mundo. Esto es razonable, ya que claramente hay mucho espacio para el abuso. Sin embargo, ahora que han demostrado que se puede hacer, no habrá tiempo antes de que los investigadores de IA comerciales o independientes repliquen lo que hace DALL-E y lo pongan a disposición de todos. Los grandes jugadores en el aprendizaje automático también tienen a sus artistas de inteligencia artificial de alto rendimiento esperando su momento, como  Google Imagen .

Dado que la caja de Pandora no se puede cerrar, tendremos que aceptar que el mundo de las bellas artes cambiará irrevocablemente, pero esto no significa que los artistas se hayan ido.

Una forma de verlo es que este tipo de tecnología hace posible crear arte en las manos de cualquier persona. El énfasis ahora está cambiando de la capacidad técnica para crear imágenes a la capacidad de describir y repetir con precisión su visión hasta que lo que ve en la pantalla coincida con lo que tenía en mente. En otras palabras, ahora más personas podrán expresarse visualmente, al igual que ahora más personas podrán realizar cálculos precisos gracias a la existencia de las calculadoras.

Es posible que ciertos tipos de artistas ya no tengan modelos comerciales viables. Si está ganando comisiones por una tarifa , le resultará difícil competir con un programa que puede crear cientos de imágenes por hora según la descripción de un cliente y realizar cambios en esas imágenes casi al instante. En su lugar, puede utilizar estas herramientas para realizar su propia visión y luego vender esas imágenes únicas en función de sus sentimientos.

El cliente siempre tiene la razón

También es importante recordar que, en última instancia, estas imágenes se crean para el consumo humano. Los humanos tenemos nuestro propio conjunto de valores que va más allá de la conveniencia y la excelencia técnica. En un mundo donde el arte generado es abundante y, por lo tanto, relativamente barato y desechable, siempre habrá una audiencia dispuesta a apreciar (y comprar) el arte creado por el hombre, simplemente porque puede ser relativamente raro.

En otras palabras, un software como DALL-E 2 podría significar el fin de los artistas que se ganan la vida haciendo arte en una línea de montaje, pero es poco probable que empañe las perspectivas de los artistas que tienen algo que decir y que tienen una identidad visual única, con a través del cual puedes hablar.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.