Cómo proteger sus imágenes de los generadores de arte AI

Cómo proteger sus imágenes de los generadores de arte AI

Si bien es divertido imitar las obras de artistas desaparecidos hace mucho tiempo como Van Gogh o Frida Kahlo con un generador de IA, no ocurre lo mismo con los artistas vivos. Permitir que cualquier persona cree una imagen «al estilo» de un artista puede hacer que su mercado se inunde de imitaciones; agregando confusión sobre la autenticidad y una posible pérdida de ingresos.

En respuesta, la gente está buscando una forma de proteger sus imágenes de los generadores de arte de IA. Es posible que las respuestas no sean perfectas o infalibles, pero hay formas en las que puede defender sus imágenes para que no sean utilizadas por generadores de arte de IA.

Cómo los generadores de IA obtienen sus imágenes

Los generadores de arte de IA pasan por un período de «entrenamiento» para aprender a producir una imagen cuando se les envía un mensaje de texto. Como parte del proceso de aprendizaje, necesita estudiar cientos de millones de pares de imagen y texto para generar finalmente una imagen precisa de objetos, colores y escenas del mundo real, junto con técnicas y estilos artísticos.

Da la casualidad de que los modelos de IA tienen que aprender de la creatividad de los humanos. Por ejemplo, Midjourney y Stability Diffusion son dos generadores de arte de IA capacitados en el conjunto de datos LAION-5B de código abierto, que contiene miles de millones de imágenes de Internet.

Usando rastreadores web para «raspar» los sitios web en busca de datos, estos conjuntos de datos crean listas de URL de imágenes, además de su título, en algo que podría parecerse a una enorme hoja de cálculo de Excel. Si ha publicado su arte en línea antes, podría estar en un conjunto de datos de imágenes y, por lo tanto, se usa para entrenar a la IA, ya sea que haya dado su consentimiento o no.

1. Optar por no recibir conjuntos de datos de entrenamiento de IA

Spawning es un grupo de artistas cuyo popular sitio web, Have I Been Trained? , se puede usar para ver si sus imágenes están en el conjunto de datos LAION-5B. Asumiéndolos ellos mismos, luego agregaron la función para optar por no participar en el conjunto de datos. Según un acuerdo, Spawning pasará las listas de exclusión voluntaria de los usuarios a LAION, quien ha dicho que cumplirá con la solicitud y eliminará esas imágenes de su colección.

La herramienta de exclusión voluntaria de Spawning aún requiere algo de desarrollo ya que, en el momento de escribir este artículo, no puede agregar varias imágenes a la vez. Tampoco existen acuerdos de exclusión voluntaria con ningún otro conjunto de datos que pueda usarse para entrenar modelos de IA.

Dado que muchas empresas de IA no revelan los detalles más finos sobre cómo se construyen sus modelos de IA, a veces no está claro qué conjunto de datos están utilizando. DALL-E es un generador de arte de IA popular que no comparte esta información.

Captura de pantalla de la preferencia de la bandera noai en DeviantArt

Alternativamente, si usa DeviantArt para compartir su obra de arte, sus imágenes ahora están protegidas de manera predeterminada para que no se usen para conjuntos de datos de entrenamiento de IA. Funciona al etiquetar su imagen con «noai», lo que significa que si se descubre que un modelo de IA usó su imagen para entrenamiento, estará violando los Términos de servicio de DeviantArt.

Por supuesto, estas medidas de exclusión voluntaria no se aplican, por lo que pueden ser ignoradas por terceros si así lo desean. Si bien esta no es la solución más eficiente, está abriendo el camino para más reglas y regulaciones para proteger el trabajo de los artistas.

En un mundo ideal, a las personas se les daría la opción de participar, en lugar de tener que optar por no participar. Esperamos ver que esto suceda en el futuro. Para obtener más detalles sobre cómo eliminar sus imágenes de los conjuntos de datos, consulte nuestra guía sobre cómo excluir sus imágenes del entrenamiento de IA.

Se ha llamado la atención de los tribunales sobre si la práctica de extraer imágenes de Internet es legal. Y ayudar a los artistas a presentar pruebas de su parte es el derecho de autor de la imagen que poseen.

Resultados de la artista Sarah Andersen utilizando el sitio web Have I Beeen Trained

A principios de 2023, la conocida dibujante de cómics, Sarah Andersen , formó parte de un grupo de artistas que presentó una demanda contra las empresas de IA Stability AI y Midjourney, así como el sitio web para compartir arte DeviantArt, por raspar el trabajo. de su arte sin consentimiento, incluido el arte de incontables millones de otros artistas.

Otro ejemplo es el sitio web de imágenes de archivo, Getty Images, que presentó una demanda contra Stability AI por extraer sus imágenes sin licencia. La forma en que descubrió que se estaban utilizando sus imágenes con derechos de autor fue cuando las imágenes generadas por IA comenzaron a mostrarse con la marca de agua de Getty Images, un obsequio bastante obvio.

Si bien la legalidad se determinará en su debido momento, los derechos de autor son una de las pocas cosas que se pueden usar para luchar por los derechos de la obra de los artistas, como se ve en los casos que mencionamos. Puede que no esté actualizado con la tecnología de IA, pero puede contribuir a su defensa en el futuro.

Es una práctica que vale la pena aprender de todos modos para que pueda proteger su trabajo contra el robo, ya sea que la IA esté involucrada o no. Sigue nuestra guía sobre cómo proteger tus fotos con derechos de autor para ver en profundidad cómo funciona todo.

3. Bloquee los rastreadores de sitios web con Robots.txt

Los conjuntos de datos de imágenes solo pueden indexar una gran cantidad de imágenes porque usan algo llamado rastreadores web. Como su nombre podría sugerir, rastrean sitios web en busca de información particular.

Algunos rastreadores son útiles y ayudan a los motores de búsqueda como Google a encontrar e indexar la información más relevante para mostrarla en su página de resultados de búsqueda. Otros se utilizan para raspar sitios web en busca de imágenes para incluirlas en conjuntos de datos de entrenamiento de IA.

Foto de una computadora portátil que muestra el código de la computadora

Ahí es donde entra en juego Robots.txt. Robots.txt es un archivo de texto que se puede colocar en el código de fondo de un sitio web para decirle a los rastreadores web qué pueden y qué no pueden escanear. Puede usarlo para evitar que un rastreador mire ciertas páginas o archivos, lo cual es útil si no desea que AI use sus imágenes.

Si quieres saber más, lee nuestra guía sobre qué es un rastreador web y cómo funciona. Para aquellos que tienen un sitio web, pídale a su desarrollador web que incruste un archivo Robots.txt en el código de su sitio web para evitar que los conjuntos de datos de entrenamiento de IA eliminen sus imágenes.

Qué esperar en el futuro

Es frustrante tener que competir con los modelos de IA, pero hay más soluciones en camino.

Por un lado, los procedimientos judiciales están en proceso de determinar qué es legal y cómo funcionan los derechos de autor con la generación de imágenes por IA. El resultado de estos debates públicos establecerá estándares legales, y posiblemente regulaciones rápidas, que las empresas de IA deben seguir.

Por otro lado, los desarrolladores están pensando en cómo resolver el problema utilizando nueva tecnología. En un estudio prometedor, la investigación muestra que puede usar la IA para combatirse a sí misma al hacer que una imagen sea «ilegible» para los conjuntos de datos de entrenamiento de la IA.

Como explica la Dra. Sarah Monazam Erfani de la Universidad de Melbourne : “Hemos ideado una técnica basada en el aprendizaje automático que identifica y cambia los píxeles suficientes en una imagen para confundir a la IA y convertirla en una imagen ‘ilegible’. El cambio es muy pequeño e imperceptible para los ojos humanos, pero introduce suficiente «ruido» en una imagen para que sea inútil para el entrenamiento de la IA».

Si usted es alguien afectado por los generadores de imágenes de IA, vale la pena hacer oír su voz para que estas empresas se vean presionadas a cambiar sus prácticas. Fue solo debido a los fuertes comentarios de la comunidad de DeviantArt que se creó una nueva preferencia de exclusión, así que asegúrese de enviar sus comentarios a las plataformas de intercambio de arte y las empresas de IA.

Defendiendo sus imágenes de la IA

Puede proteger sus imágenes de los generadores de arte de IA al excluirse de los conjuntos de datos de entrenamiento de IA, registrar sus imágenes con derechos de autor y usar el estándar Robots.txt. Si bien no garantizará que sus imágenes permanezcan fuera de los sistemas de IA, el uso de los tres métodos le brindará la mejor defensa hasta que se desarrollen más soluciones.

Están en camino nuevas herramientas, incluidas formas de ajustar imperceptiblemente su imagen para que la IA no pueda aprender de ella, haciéndola inútil para entrenar a los generadores de arte de la IA. Mientras tanto, no te rindas. Todavía hay formas de proteger sus imágenes de los generadores de arte de IA.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *