Home News Ícones de Hollywood do passado estão de volta aos acordos de clonagem de voz de IA
News

Ícones de Hollywood do passado estão de volta aos acordos de clonagem de voz de IA

Share
Share

Estrelas da era de ouro de Hollywood estão renascendo graças a acordos para clonar vozes de celebridades usando inteligência artificial, um sinal de que algumas das preocupações do “Velho Oeste” sobre o uso não autorizado de inteligência artificial estão sendo abordadas através de novos modelos de negócios.

ElevenLabs, uma startup de tecnologia de áudio apoiada por empresas de capital de risco, incluindo Andreessen Horowitz e Sequoia, fechou vários acordos com herdeiros de atores lendários para sua ferramenta IconicVoices, que permite aos usuários ouvir vozes geradas por IA por meio de um aplicativo de audiolivro. As estrelas incluem Burt Reynolds, Judy Garland, James Dean e Sir Laurence Olivier.

A ElevenLabs, lançada em 2023, cria áudio para livros e reportagens, personagens de videogames, pré-produção de filmes, mídias sociais e publicidade. A empresa já trabalha com editoras como o New York Times e o Washington Post, e no início deste ano a empresa foi selecionada pela Disney para aderir ao seu programa acelerador.

“Você precisa de cerca de 30 minutos de áudio de alta qualidade para criar um clone de voz profissional”, disse Sam Sklar, membro da equipe de desenvolvimento da ElevenLabs, e as vozes são geradas a partir de um catálogo de celebridades. Uma vez criado, ele pode ser invocado para leitura de texto (artigos, PDFs, ePubs, boletins informativos ou outro conteúdo de texto). No entanto, a voz e o conteúdo não podem ser exportados, pois toda a audição ocorre no aplicativo de leitura.

Por exemplo, um usuário pode ouvir artigos narrados por James Dean no aplicativo, mas os usuários não poderão acessar vozes para qualquer conteúdo que ainda não esteja no aplicativo.

Acordos como estes poderiam ajudar a estabelecer os limites para um futuro em que o conteúdo de voz gerado por IA seja menos controverso e mais controlado e curado. O Google Play e o Apple Books já usam vozes geradas por IA até certo ponto, embora existam grandes barreiras para recriar o ritmo, a entonação e a emoção da voz humana.

A indústria da inteligência artificial tem enfrentado preocupações com o uso de vozes de celebridades. A OpenAI deu meia-volta em maio, depois que a atriz Scarlett Johansson acusou a empresa de copiar sua voz depois que ela rejeitou ofertas de licenciamento.

“Compreendemos os riscos associados à mídia sintética e levamos muito a sério o uso seguro de nossas ferramentas”, disse Sklar. As salvaguardas incluem moderação ativa de conteúdo, responsabilização apoiada por proibições e disposições especiais para proteger a influência das vozes da IA ​​nas eleições de 2024.

Continua a existir uma preocupação significativa entre a atual geração de atores sobre o uso da IA ​​para criar conteúdo de narração. Os dubladores de videogames são motivo de preocupação, e a greve do ano passado no cinema e na televisão foi em grande parte motivada pela ansiedade em relação ao uso da IA. A utilização de vozes icónicas vendidas por herança é um nicho de mercado que potencialmente evita estas armadilhas, representando uma nova fonte de receitas da IA, em vez de uma fonte de receitas perdida devido à IA.

O uso de vozes de celebridades que soam como vozes de outras pessoas é um problema que já existia antes mesmo do advento da IA, como o caso de Frito Lay em 1988 usando a voz de Tom Waits em sua publicidade, e outro caso de Waits em 2007 , depois que o próprio Waits recusou por muito tempo acordos publicitários. A IA representa um caminho mais fácil para a criação de vozes semelhantes, e os recentes processos judiciais contra a startup de IA Lovo por usar dubladores supostamente inadequados e não remunerados para gerar vozes de IA são um lembrete de que o mundo da geração de voz de IA provavelmente permanecerá, até certo ponto, complexo e controverso. (Lovo negou as alegações do processo e também apontou para o modelo de divisão de receitas que oferece aos atores para vozes clonadas.)

Steve Cohen, sócio da Pollock & Cohen que representa dubladores em um processo não relacionado alegando clonagem de vozes sem permissão, disse que é difícil avaliar o nível de proteção no terreno sem olhar para a linguagem específica dos contratos da IconicVoices.

ElevenLabs aponta como sua ferramenta IconicVoices obtém permissões e controla o uso de vozes.

“Dar permissão para usar sua voz é um dos fundamentos”, disse Cohen. “Acho que os fatores-chave são permissão, compensação e controle.”

Leis novas e mais claras também poderiam funcionar como um impedimento para as pessoas tentadas pela apropriação indébita de votos, “não os bandidos graves, mas os casos extremos”, disse Cohen. Mas citando Bette Davis em All About Eve, ele acrescentou: “Apertem os cintos; Vai ser uma jornada acidentada.”

O quão realistas são as vozes clonadas também é uma questão em evolução. Muitos especialistas dizem que, como a IA não “sabe” o que está dizendo, a qualidade do desempenho é limitada. Sklar disse que o mais recente nível de qualidade de fala do ElevenLabs é indistinguível da fala humana real. “As ferramentas de conversão de texto em fala da ElevenLabs podem compreender o contexto das palavras”, disse ele.

A IA é tão boa quanto os modelos nos quais é treinada, e os conjuntos de dados de voz dos atores tornam-se parte desse processo.

“Os modelos neurais obtêm suas capacidades simulando/memorizando as nuances e padrões presentes em seus dados de treinamento”, disse Nauman Dawalatabad, pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial do MIT, que conduz uma extensa pesquisa em geração de voz alimentada por IA. “A qualidade e a variedade dos dados de treinamento têm um impacto significativo no desempenho do modelo.”

Os feeds de voz das estrelas de cinema poderiam ajudar na imitação e no treinamento de IA, fornecendo o tipo de “conjuntos de dados de voz de alta qualidade para treinamento e ajuste fino de grandes modelos” que Dawalatabad diz ser essencial para o processo. Mas ele expressou dúvidas sobre “soar humano” como um teste adequado para o campo de voz da IA, pois poderia reforçar a relação antagônica entre vozes humanas e sintéticas.

Os dubladores continuam divididos quanto à tecnologia, com alguns recusando-se a considerar quaisquer acordos, mas outros dizendo que o potencial de clonagem das suas vozes para produzir alguns tipos de audiolivros de forma mais rápida e barata não pode ser ignorado. “A tecnologia de IA pode ajudar nos fluxos de trabalho. A IA não é uma ferramenta nova para dubladores, produtores e editores, muitos dos quais a utilizam para melhorar o controle de qualidade na pós-produção, disse Michelle Cobb, diretora executiva da Audio Publishers Association, em entrevista à CNBC no ano passado.

De acordo com Dawalatabad, os modelos generativos mais recentes mostraram avanços significativos em relação às iterações anteriores, tornando cada vez mais difícil distinguir entre vozes falsas e reais apenas de ouvido. O licenciamento de vozes de IA pode aliviar o fardo dos dubladores, acrescentou, sem deslocá-los à medida que “intervêm no processo, concentrando-se em sugerir correções ou melhorias em aspectos não falados, como entonação, cordialidade e sotaque, que ainda são desafios”.

Source link

Share

Leave a comment

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Articles

Israel e Líbano estão à beira da guerra – RT World News

A recente explosão de equipamentos de comunicação, que feriu milhares de pessoas,...

Banco do Japão mantém taxa básica de juros inalterada, agindo com cautela

A bandeira japonesa hasteada acima do edifício-sede do Banco do Japão (abaixo)...

O Líbano está em “estado de guerra” – chefe do Hezbollah – RT World News

A operação de sabotagem desta semana foi um ataque “sem precedentes” de...

Dois desaparecidos, 1.000 evacuados devido às inundações causadas pela tempestade Boris no norte da Itália

Duas pessoas desapareceram e cerca de 1.000 pessoas foram evacuadas das suas...

Copyright 2024 livetvable.com. All rights reserved powered by livetvable.com