Voces humanas y IA: cómo proteger el oficio sin frenar la innovación

La voz humana no es cara. Lo caro es un audiovisual sin alma.

Hay profesiones que sostienen una industria entera sin salir en los créditos emocionales. La voz es una de ellas.

La voz profesional está en el doblaje que te hizo creer que ese actor “hablaba como tú”. Está en la promo que te levantó el ánimo sin pedir permiso. Está en el documental que te explicó el mundo mientras tú ponías la cena. Y está, sobre todo, en lo más difícil: hacer que una frase suene viva aunque se repita veinte veces.

Este artículo es un abrazo a esas personas. Y también una invitación a mirar de frente un cambio real: la IA ya está en el sector, y la pregunta no es si existe, sino cómo la usamos sin cargarnos lo mejor del oficio.


Esto va en defensa de las personas (no en contra de la IA)

La IA puede ser herramienta útil: para maquetas, pruebas internas, accesibilidad, versiones preliminares, automatizaciones donde no hay interpretación. Nadie sensato discute eso.

Lo que está en juego es otra cosa: que, por prisa o por margen, empecemos a tratar la voz como “relleno” y no como lo que es: una interpretación.

Porque una voz humana no solo “suena”: acompaña.


España y la voz: un país donde el doblaje importa (y mucho)

En España hay una preferencia cultural muy marcada por el contenido doblado: según un resumen de Box Office (citando la encuesta de hábitos culturales del Ministerio), un 94,3% ve doblado al castellano, frente a un 5% en versión original, y un 0,8% en lenguas cooficiales.
https://box-office.es/news/solo-un-5-de-espanoles-ve-peliculas-en-version-original/

Esto no es un detalle. Es el suelo sobre el que trabajan miles de profesionales y empresas. Si un país consume así, la voz no es un accesorio: es parte del producto.


El valor que nadie factura: lo humano que la IA todavía no sabe sostener

Una voz profesional trae cosas que no caben en una tabla:

  • La intención (lo que se entiende aunque no se diga).
  • La pausa exacta.
  • La emoción en el borde de la palabra.
  • El error que humaniza (cuando toca).
  • La respiración que hace creíble una frase.

La IA puede imitar timbres. Puede sonar “bonita”. Puede ser consistente. Pero la consistencia no es lo mismo que la vida.

Y aquí viene lo delicado: cuando una marca usa una voz sintética como identidad, no siempre sabe lo que se juega (confianza, reconocimiento, coherencia, reputación).


La amenaza real no es la IA: es el atajo sin consentimiento.

No hace falta imaginar escenarios. Hay casos públicos y mediáticos en España sobre clonación o comercialización de voces con IA y preocupación sectorial.

Noticias Cuatro recogió el caso del actor de doblaje Juan Antonio Bernal y la referencia a una voz “vendida por un euro” en ElevenLabs.
https://www.cuatro.com/noticias/sociedad/20250130/inteligencia-artificial-amenaza-locutores-actores-doblaje-clona-voz_18_014635903.html

El País también ha informado sobre la movilización del sector y el riesgo de emulación/sustitución en determinados trabajos, además de iniciativas contractuales para proteger voces.
https://elpais.com/tecnologia/2025-03-02/yo-vivo-de-mi-voz-si-me-la-emulan-estoy-acabado-los-actores-de-doblaje-se-movilizan-contra-la-ia.html

Y Reuters ha explicado cómo actores de voz en Europa empujan por reglas de consentimiento y compensación ante el avance del doblaje con IA.
https://www.reuters.com/business/media-telecom/voice-actors-push-back-ai-threatens-dubbing-industry-2025-07-30/

La pregunta incómoda es esta: ¿la IA entra como herramienta… o como excusa para no llamar a una persona y ahorrarnos una rectificación?
Porque el “estudio de turno” puede pensar: “no le llamo para retake, lo arreglo con IA, me ahorro ese coste”. Y ese “coste” es, precisamente, trabajo profesional.


Costes, tarifas y el elefante en la sala: lo que se recorta primero

Aquí conviene hablar con fuentes.

En Madrid existe un convenio del sector de doblaje y sonorización con tablas y tarifas publicadas por ADOMA. En el anexo salarial 2025 aparecen conceptos concretos como “correcciones/retakes” y diferentes tarifas por tipo de intervención.
Página de referencia: https://adoma.es/convenio-y-tarifas/
PDF anexo salarial 2025: https://adoma.es/wp-content/uploads/2025/03/Anexo-salarial-2025-III-CONVENIO-COLECTIVO-DE-PROFESIONALES-DE-DOBLAJE-Y-SONORIZACION-DE-LA-COMUN.pdf

Y en locución comercial/corporativa, aunque el mercado varía por derechos, duración y difusión, existen guías orientativas de rangos en España (útiles para entender órdenes de magnitud, aunque no sustituyen a un contrato).
https://www.cronoshare.com/cuanto-cuesta/locucion

El problema estructural no es solo “cuánto se paga” en un papel. Es cómo se vive el trabajo: intermitencia, negociación por pieza, urgencias, revisiones, cambios de guion, entregas rápidas… y, a la vez, una presión constante por bajar precios.

Y ahí es donde la IA puede usarse bien (como apoyo) o mal (como tijera).


¿Qué está haciendo el sector para proteger la voz humana?

Aquí sí hay señales positivas: la defensa está tomando forma en contratos y en debate público.

PASAVE (Plataforma de Asociaciones y Sindicatos de Artistas de Voz de España) ha publicado una cláusula contractual para impedir el uso de grabaciones de voz con fines de entrenamiento o simulación para IA fuera del fin del contrato.
https://pasave.org/clausula

Y medios han recogido cómo esta cláusula se está usando como mecanismo de protección sectorial.
https://elpais.com/tecnologia/2025-03-02/yo-vivo-de-mi-voz-si-me-la-emulan-estoy-acabado-los-actores-de-doblaje-se-movilizan-contra-la-ia.html

Además, en 2026 el Gobierno comunicó una reforma del derecho al honor adaptada al entorno digital que incluye por primera vez la prohibición de deepfakes sin consentimiento, y menciona explícitamente el uso de voz/imagen simuladas.
https://www.mpr.gob.es/prencom/notas/Paginas/2026/derecho-honor.aspx
https://espanadigital.gob.es/ca/actualidad/aprobado-anteproyecto-de-la-ley-organica-de-proteccion-civil-del-derecho-al-honor-la

Todo esto va en la dirección correcta: consentimiento, transparencia y límites.


Lenguas propias: si ya es frágil, hay que cuidarlo más (no “automatizarlo barato”)

Aquí no hablamos solo de industria. Hablamos de lenguas vivas.

Catalán, euskera y gallego (entre otras realidades lingüísticas) no son un “extra”: son cultura, comunidad y memoria. Y sí, también son frágiles en algo muy concreto: necesitan uso. No basta con quererlas; hay que hablarlas, producir en ellas, escucharlas, normalizarlas. Y a veces la propia sociedad —por prisa, por mercado o por simple costumbre— no lo pone fácil.

En ese contexto, si el consumo en estas lenguas es minoritario (0,8% según el resumen citado), cualquier decisión “por ahorro” puede tener un efecto desproporcionado en catalán, euskera o gallego.
https://box-office.es/news/solo-un-5-de-espanoles-ve-peliculas-en-version-original/

La IA aquí puede ser una aliada (accesibilidad, disponibilidad, prototipos, incluso impulso de presencia). Pero sin reglas, también puede convertirse en una sustitución rápida: voces “neutras”, acentos diluidos, matices fuera… y un tejido profesional local cada vez más invisible. Y cuando una lengua pierde voces profesionales, no solo pierde trabajo: pierde futuro.

La pregunta que deberíamos hacernos (antes de que sea tarde)

¿Estamos cuidando a las voces humanas como parte del valor del audiovisual… o estamos barriendo bajo la alfombra mientras no nos toque?

Porque hay un riesgo moral muy simple: “si me puedo quedar un margen por no pagar una voz humana, mejor”. Y eso, a la larga, no solo daña a los profesionales: daña al producto.


Cómo usar IA sin destruir oficio: un checklist mínimo (para estudios y marcas)

  1. Consentimiento por escrito si se va a usar IA con material de voz real.
  2. Prohibición explícita de entrenamiento/simulación fuera del proyecto (cláusula tipo PASAVE). https://pasave.org/clausula
  3. Etiquetado/transparencia cuando haya voz sintética (hacia cliente y, cuando aplique, hacia público).
  4. Pago justo por el trabajo humano: interpretación, derechos, revisiones, retakes (referencias: ADOMA).
  5. IA para maqueta / preproducción, humano para la pieza final cuando el objetivo sea emocionar, persuadir o representar una marca.
  6. Protección de identidades: una voz no es un recurso técnico; es parte de una persona.

Un abrazo (y una promesa)

A quienes vivís de la voz: gracias. Por el talento, por el oficio invisible y por sostener historias ajenas con vuestra garganta.

Y al sector: ojalá entendamos algo básico antes de que lo decidamos “por coste”: la voz humana no es cara. Lo caro es un audiovisual sin alma.

Este texto es una reflexión general sobre tendencias del sector, apoyada en fuentes públicas enlazadas. No se refiere ni pretende describir prácticas de empresas, proyectos o profesionales concretos.

Gracias por compartir