Cómo convertir texto en voz usando IA con ElevenLabs

Cómo convertir texto en voz usando IA con ElevenLabs

Qué saber

  • Primero debe registrarse en ElevenLabs y crear su propia cuenta.
  • Establezca la configuración de voz en ‘Síntesis de voz’, ingrese su texto y haga clic en ‘Generar’ para convertir a voz.
  • puede crear nuevas voces en ‘VoiceLab’ y puede descargar el discurso generado en ‘Historial’.

El auge de la IA generativa ha dado lugar a muchas herramientas excelentes. Desde chatbots hasta arte generativo, no faltan herramientas de la nueva era para ayudar a los usuarios a alcanzar nuevas alturas con su trabajo.

Uno de los muchos regalos del renacimiento de la IA son las herramientas de voz de IA que convierten cualquier texto en voz con un sonido natural y sin la sensación robótica que solemos asociar con tales herramientas.

Aunque hay algunos de estos convertidores de texto a voz de IA, ElevenLabs es definitivamente uno de los líderes en la industria actual. Veamos cómo puede usar ElevenLabs para convertir texto a voz, crear sus propias voces y descargar su contenido de voz generado.

¿Qué es ElevenLabs?

Fundado en 2022, ElevenLabs es un software de síntesis de voz que aprovecha la inteligencia artificial y el aprendizaje profundo para generar un habla humana muy realista y con un sonido natural a partir de texto.

Aunque su plan gratuito tiene nueve muestras de voz diferentes que puede probar y 10,000 caracteres de texto que puede convertir a voz por mes, los planes pagos de ElevenLabs le permiten hacer mucho más. Con los planes Starter y Creator, los usuarios pueden trabajar con 30.000 y 100.000 caracteres al mes, respectivamente, e incluso clonar su propia voz o una voz que tenga permiso para usar.

Cómo usar ElevenLabs para convertir texto a voz usando IA

Para esta guía, usaremos el plan gratuito con suficientes funciones y cuota de personajes para que pueda comenzar. Siga los pasos que se indican a continuación para hacerlo:

1. Regístrate en ElevenLabs

Lo primero es lo primero, si aún no está en el sitio web de ElevenLabs, use el enlace a continuación para llegar allí.

OnceLabs | Enlace de página web

Una vez allí, primero se le pedirá que se registre. Así que haga clic en Registrarse en la esquina superior derecha.

Marque la casilla que dice Acepto los términos del servicio . Luego ingrese su correo electrónico/contraseña o use su cuenta de Google o Facebook.

Una vez que se haya registrado, se lo dirigirá directamente a la página Planes de precios.

Puede continuar usando su plan gratuito o suscribirse a los planes pagos. Pero si es la primera vez que usas el generador de texto a voz de ElevenLabs, te recomendamos probarlo primero con el plan Gratis.

2. Elija Configuración de voz

Para comenzar a usar la herramienta de texto a voz, haga clic en Síntesis de voz .

Aquí puede cambiar la configuración de voz antes de generar voz a partir de texto. El primer campo le permitirá seleccionar entre las opciones de voz prefabricadas. Haga clic en el menú desplegable para revelar las opciones.

Haga clic en el botón de reproducción al lado de uno para escuchar la muestra de voz y seleccione la que suena justo en sus oídos.

El segundo campo es Configuración de voz.

Esto le permite ajustar la estabilidad y claridad del discurso generado.

Un valor de Estabilidad más bajo hará que el discurso sea más expresivo con una alta variabilidad entre las regeneraciones, pero también puede provocar inestabilidades. Un valor más alto mantendrá la consistencia del discurso entre varias generaciones, pero también puede volverse monótono. Idealmente, deseará reducir este valor para textos más largos y viceversa.

Los valores de claridad se ajustan a artefactos aleatorios en el habla generada. Para minimizar los artefactos, seleccione un valor más bajo. Para mejorar la claridad, seleccione un valor más alto. Sin embargo, por primera vez, deje que estos dos permanezcan en el valor predeterminado.

Por último, tenemos la opción de seleccionar el modelo de idioma.

Si tu texto está en inglés, selecciona el primer modelo Eleven Monolingual v1. Alternativamente, elija el modelo Eleven Multilingual v1 para trabajar con texto en inglés, alemán, polaco, español, italiano, portugués e hindi.

3. Ingrese texto y genere voz

Ahora que ha seleccionado la configuración de voz y modelo, lo único que queda es transferir el texto al campo Texto.

Luego haga clic en Generar .

Su texto ahora se leerá en voz alta. Revise el texto a medida que se habla para determinar si necesita algún cambio.

Diseña una nueva voz

Las voces prefabricadas son más que suficientes para comenzar. Pero si no lo hacen por ti, puedes diseñar una nueva voz tú mismo. Para hacerlo, en primer lugar, haga clic en VoiceLab en la parte superior.

Luego haga clic en Agregar voz generativa o clonada .

Para usuarios gratuitos, solo estará disponible la opción Diseño de voz .

En la ventana de creación de voz, seleccione Género, Edad, Acento y Fuerza del acento, y luego haga clic en Generar para escucharlo.

Si te gusta, haz clic en Usar voz .

Asigne un nombre a la voz y seleccione Crear voz .

Descargue sus muestras de texto a voz generadas

ElevenLabs, además de permitirte generar voz a partir de texto, también te permite descargar la voz generada como archivos MP3. Para hacerlo, haga clic en Historial en la parte superior.

Aquí encontrará la lista completa de su contenido de voz generado. Seleccione el que desea descargar.

A continuación, haz clic en Descargar seleccionados .

Y así, se descargará la muestra de texto a voz generada.

Haz más con ElevenLabs

El plan gratuito de ElevenLabs te permite convertir texto a voz de unos 10.000 caracteres al mes y diseñar tres nuevas voces. Pero con sus planes pagos, puedes hacer mucho más.

Por $5 al mes, el paquete de inicio le permite crear 10 voces personalizadas, clonar su voz y convertir hasta 30 000 caracteres de texto al mes.

Por $ 22 por mes, el paquete Creator le permitirá crear 30 voces personalizadas, clonar su propia voz, convertir hasta 100,000 caracteres por mes y descargar archivos de audio de alta calidad.

Para características adicionales y cuotas de carácter más liberales, puede beneficiarse del editor independiente ($99 por mes) o el plan de negocio en crecimiento ($330 por mes).

Preguntas más frecuentes

Echemos un vistazo a algunas preguntas frecuentes sobre ElevenLabs.

¿Los caracteres no utilizados se transfieren al mes siguiente?

No, los caracteres no utilizados no se transfieren al mes siguiente y los caracteres se restablecen al comienzo de un nuevo mes.

¿Cuántos caracteres de texto puedo convertir a voz a la vez?

En una sola solicitud, los usuarios gratuitos pueden convertir 2500 caracteres de texto. Los usuarios suscritos a planes pagos pueden convertir hasta 5000 caracteres por solicitud.

¿Puedo convertir texto en otros idiomas además del inglés?

Sí, puede convertir texto en inglés, alemán, polaco, español, italiano, francés, portugués e hindi. Sin embargo, a excepción del inglés, esto solo es posible con planes pagos.

El convertidor de texto a voz con IA de ElevenLabs es fácilmente una de las mejores herramientas del mercado actual para ayudarlo a escuchar documentos de texto y escuchar cómo suenan. Para autores y editores, este es un sueño hecho realidad. Pero incluso para los aficionados o los creadores de contenido que buscan una narración similar a la humana, ElevenLabs es una herramienta ideal para trabajar. Esperamos que esta guía le haya ayudado a generar texto a voz para sus documentos. ¡Hasta la proxima vez!

RELACIONADO

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *