¿Qué es la IA de audio estable y cómo utilizarla?

2024/02/20

La inteligencia artificial se ha vuelto omnipresente y se utiliza para una amplia gama de propósitos, incluida la generación de imágenes, contenido basado en texto e incluso producción de sonido y música. Y Stable Audio AI es uno de los mejores modelos de IA para producción de audio disponibles actualmente.

En esta guía, veremos qué es esta plataforma de inteligencia artificial y cómo puedes usarla para crear audio original sin necesidad de ningún instrumento musical.

¿Qué es la IA de audio estable?

Stable Audio AI es un modelo de IA desarrollado por Stability AI, mejor conocido por su Stable Diffusion AI que puede generar imágenes basadas en indicaciones proporcionadas por el usuario.

Stable Audio utiliza técnicas avanzadas de inteligencia artificial (específicamente modelos de difusión) para crear audio a partir de descripciones de texto. Escribes qué tipo de música o sonidos quieres y los genera en cuestión de segundos.

Stable Audio AI ha sido creado por Harmonai, el laboratorio de investigación de audio de Stability AI, y permite a los usuarios generar audio original mediante indicaciones.

Lo que hace que este modelo de IA de generación de audio sea tan impresionante es que ha sido entrenado con 19.500 horas de datos de audio de la biblioteca de música digital líder, AudioSparx. Se utilizaron más de 800.000 archivos de audio para entrenarlo, lo que ha permitido que la IA sea capaz de generar 95 segundos de audio con calidad estéreo de 44,1 kHz utilizando una GPU Nvidia A100 en menos de un segundo.

Lo logra utilizando una tecnología de difusión latente similar a la IA de difusión estable de la compañía para la generación de imágenes. Y a diferencia de otros modelos de IA de generación de audio, Stability Audio AI se puede utilizar para crear sonidos de diferentes longitudes.

Puede utilizar Stable Audio AI para generar sonidos de instrumentos individuales, sonidos ambientales o incluso un conjunto completo. Ahora comprendamos cómo generar audio usándolo.

Comience con la IA de audio estable

Puede probar Stable Audio AI para generar audio utilizando Inteligencia Artificial de forma gratuita, pero esto requerirá crear una cuenta en el sitio web de Stable Audio. La cuenta gratuita también tiene ciertas limitaciones.

Inicie su navegador y vaya al sitio web de Stable Audio . Una vez allí, haga clic en el botón azul con forma de cápsula en la esquina superior derecha que dice «Pruébelo gratis».

Al hacer clic en el botón, accederá a una nueva página donde podrá crear una cuenta necesaria para utilizar Stable Audio AI. Puede configurar una nueva cuenta ingresando su dirección de correo electrónico y una contraseña o iniciar sesión a través de su cuenta de Google.

Si elige iniciar sesión con su cuenta de Google, deberá proporcionar autorización a Google para compartir los detalles de su cuenta con el sitio web. Después de ingresar el nombre de usuario y la contraseña de su cuenta de Google, haga clic en el botón «Continuar» para proporcionar la autorización requerida.

Una vez que haya iniciado sesión, será recibido por la página de inicio de la plataforma Stable Audio AI. Este contendrá los términos y condiciones que tendrás que aceptar para continuar. También puede optar por suscribirse al boletín informativo de Stable Audio desde aquí. Haz clic en el botón que está al lado de donde dice ‘He leído y acepto los términos y condiciones’ y, si quieres, en el de abajo para suscribirte a su newsletter. Luego, haga clic en el botón ‘Siguiente’ en la parte inferior.

Al aceptar los términos y condiciones, accederá al panel de Stable Audio, que puede usar para generar audio original mediante indicaciones.

Usando IA de audio estable

La sección superior izquierda de la página será donde podrá ingresar indicaciones para la generación de audio.

Puede ingresar un mensaje como Hard rock, concert promotion, metal, 180 bpmen el cuadro. Luego, haga clic en el botón ‘Generar’ en la parte inferior para comenzar a crear audio.

Otra forma de generar audio es utilizar indicaciones ya preparadas de la ‘Biblioteca de indicaciones’ ubicada debajo de la sección de indicaciones, donde puede acceder a diferentes estilos de indicaciones de audio. Para hacerlo, haga clic en el botón con forma de cápsula etiquetado como «Ninguno». Esto abrirá la biblioteca, que contiene varios estilos entre los que puede elegir para agregar a su audio.

Para seleccionar cualquiera de los estilos de mensajes de audio de la biblioteca, simplemente haga clic en él. La sección de mensajes sobre la biblioteca le mostrará los mensajes que contiene el estilo. El estilo seleccionado adquirirá un icono de reproducción y la etiqueta en el botón de biblioteca también cambiará para reflejar el estilo seleccionado.

Debajo de la ‘Biblioteca de mensajes’, puede ver el modelo de IA utilizado para el proceso de generación de audio. Al hacer clic en el nombre del modelo, en este caso, ‘Stable-audio-audiosparx-v1-0’, se mostrarán todos los modelos disponibles. Sólo hay un modelo adicional disponible en este momento, que se encuentra en Beta. Deberá actualizar al plan Pro para utilizar el modelo Beta AI.

La siguiente es la sección ‘Duración’, donde puedes controlar la duración del audio generado. Al hacer clic en la flecha que apunta hacia abajo disminuirá la duración, mientras que al hacer clic en la que apunta hacia arriba la aumentará. La versión gratuita de Stable Audio te permite generar audio de 45 segundos de duración. Si actualiza a la versión Pro, puede generar audio de un minuto y 30 segundos de duración.

El último elemento en el lado izquierdo es la opción ‘Agregar extras’ que puedes usar para personalizar tu audio. Haga clic en el botón ‘+’ para ver las opciones disponibles, que actualmente incluyen ‘Pasos’, ‘Número de resultados’, ‘Semilla’ y ‘Intensidad de la indicación’.

Cada una de estas opciones adicionales tiene configuraciones que se pueden personalizar. Por ejemplo, si hace clic en la opción ‘Pasos’, puede aumentar la cantidad de pasos que sigue la IA para generar audio. De forma predeterminada, se agregan 50 pasos y puede aumentarlos a 100 ingresando el número de pasos en el cuadro provisto.

Puede volver al valor predeterminado haciendo clic en el botón «Restablecer» en la parte inferior. Si desea eliminar los extras por completo, haga clic en el botón ‘X’ junto al cuadro donde se debe ingresar el número de pasos.

Una vez que haya terminado, haga clic en el botón ‘Generar’ y Stable Audio comenzará a generar su audio. Alternativamente, puedes eliminar los pasos y utilizar otro de los extras, como la opción ‘Seed’, que controla la aleatoriedad de la generación de audio. De forma predeterminada, la opción está configurada en «Aleatorio», lo que significa que el modelo de IA utilizará diferentes arreglos de audio para generar audio. Puede ingresar un valor diferente haciendo clic en la etiqueta «Aleatorio» y escribiendo un valor como «222222» para que la IA use la misma disposición cada vez.

Otros extras incluyen ‘Número de resultados’ y ‘Fuerza rápida’. La primera es una función Pro que le permite controlar la cantidad de pistas que la IA devolverá cuando se le solicite (5 como máximo) y no se puede utilizar en la versión gratuita. Sin embargo, puedes probar la opción ‘Intensidad de la solicitud’ haciendo clic en ella. Esto abrirá un control deslizante que controla qué tan cerca estará el audio generado del mensaje proporcionado. De forma predeterminada, está configurado en 80%, pero puede arrastrar el control deslizante hacia la izquierda o hacia la derecha para disminuir o aumentar la intensidad según sea necesario.

Una vez que haya ajustado la intensidad del mensaje, haga clic en el botón «Generar» para indicarle a la IA que comience a crear el audio. El lado superior derecho de la página Stability Audio AI también contiene algunos elementos. El primero de ellos es un símbolo de nota musical que indica la cantidad de créditos que tienen los usuarios gratuitos. Solo puedes generar audio mientras tengas créditos y obtienes 20 créditos cada mes. Luego, hay un botón que le permite actualizar a la versión Pro, una opción para verificar los detalles de su cuenta y un menú de hamburguesas que contiene opciones adicionales.

Al hacer clic en el botón ‘Actualizar a Pro’ se mostrarán los planes de precios disponibles. Además del plan gratuito, puedes elegir entre los planes Pro, Studio y Max que cuestan $11,99/mes, $29,99/mes y $89,99/mes respectivamente. El plan ‘Free’ permite generar 20 pistas por mes, mientras que el plan ‘Pro’ permite 500 pistas. Esto sube a 1350 con el plan ‘Studio’ y 4500 con el plan ‘Max’. Además, mientras que la duración de la pista en el plan ‘Gratuito’ es de 45 segundos, es de 90 segundos en todos los demás planes. El plan «Gratuito» viene con una licencia personal, mientras que con las otras opciones obtienes una licencia de Creador.

La opción junto al botón de actualización muestra los detalles de su cuenta en la plataforma Stable Audio AI. Al hacer clic en él, podrá conocer su plan actual y todo lo que ofrece.

Refinando tus indicaciones

Al perfeccionar sus indicaciones, puede ajustar la salida que proporciona Stability Audio. Cuando se trabaja con IA generativa, cuanto mejores sean las indicaciones, mejor será el resultado. A continuación se muestran algunas formas en las que puede mejorar sus indicaciones.

Si la salida suena demasiado electrónica o digital, considere usar palabras como «Banda» o «En vivo» en el mensaje.
Es posible que pueda mejorar la calidad de la salida generada al incluir palabras como «44,1 kHz», «alta calidad» y «estéreo» en el mensaje.
Utilice la palabra ‘Solo’ después del nombre del instrumento principal en la pista para mejorar la salida. Por ejemplo, si el instrumento principal es un violín, puede utilizar «Solo Violin» en el mensaje.

Con Stability Audio AI, puede generar fácilmente pistas de audio impresionantes con solo utilizar indicaciones. Si eres principiante, el plan gratuito es una excelente manera de probar el modelo, mientras que los músicos profesionales pueden actualizar a los planes pagos y comprobar las funciones más avanzadas que ofrece la plataforma.

¿Qué es la IA de audio estable?

Comience con la IA de audio estable

Usando IA de audio estable

Refinando tus indicaciones

Deja una respuesta Cancelar la respuesta