A empresa de tecnologia OpenAI de Sam Altman tem sido responsável, nos últimos anos, pela implementação da Inteligência Artificial no dia-a-dia de milhões de pessoas em todo o mundo. E tem novidades.
Ao famoso modelo de linguagem ChatGPT, junta-se agora o Voice Engine, um novo tipo de tecnologia que permite clonar a voz de qualquer pessoa, com recurso a Inteligência Artificial. Através de um aúdio de 15 segundos e algum texto escrito é possível simular a interação verbal de um ser humano “com um som natural que se assemelha muito ao locutor original”, avança a OpenAI. Mas os elevados riscos associados à clonagem de voz levaram a empresa, que tem sede em São Francisco, a adiar o seu lançamento. O objetivo é evitar um possível aumento de desinformação, num ano em que vários países do mundo vão a eleições, como os Estados Unidos, Rússia, Índia ou México, decorrendo ainda as eleições Europeias.
O Voice Engine foi desenvolvido no final de 2022, revelou a OpenAI, e um ano depois foi testado de “forma privada com um pequeno grupo de parceiros de confiança.” No entanto, a empresa tecnológica optou por adiar o seu lançamento e preferiu adotar uma abordagem “informada e cautelosa” para garantir que a ferramenta não é utilizada de forma indevida, pode ler-se no comunicado oficial.
“Esperamos iniciar um diálogo sobre a utilização responsável de vozes sintéticas e sobre como a sociedade pode adaptar-se a estas novas capacidades”, afirma a empresa de Sam Altman. Após concluídas as conversações e apresentados os resultados, será tomada uma decisão “mais informada sobre se e como implementar esta tecnologia em escala”.
Os mais recentes testes realizados ao Voice Engine pelas várias empresas parceiras do projeto resultaram na descoberta de um conjunto de benefícios associados à utilização da nova tecnologia. Segundo a OpenAI, esta ferramenta pode ser utilizada como um auxiliar de leitura para crianças ou pessoas que não saibam/consigam ler. Também na tradução de vídeos, podcasts ou outros conteúdos, preservando as caracteristicas do locutor original. Pode também ser utilizado para facilitar a comunicação entre pessoas com deficiência ou necessidades de aprendizagem, além de permitir que pacientes que tenham perdido a fala por motivos de saúde “recuperem a sua voz”.
“Os parceiros que testam o Voice Engine concordaram com os nossos termos de uso, que proíbem a representação de outro indivíduo ou organização sem consentimento ou direito legal”, garante a OpenAI. Da mesma forma, os utilizadores devem ser informados de que as vozes são geradas por Inteligência Artificial e, por motivos de segurança, todos os audios gerados pelo Voice Engine terão uma marca d’água para facilitar a identificação e monitorização sobre o uso final do áudio.
EMPRESA DE SAM ALTMAN NÃO É A PRIMEIRA A CLONAR VOZES
A ElevenLabs – considerada líder nesta área – é uma empresa especializada na clonagem e síntese de voz em diferentes idiomas através de Inteligência Artificial. A start-up que foi fundada em 2022 tem como principal missão “tornar o conteúdo universalmente acessível em qualquer idioma e voz”. Em janeiro a start-up aumentou o seu capital em cerca de 80 milhões de dólares e conta entre os principais clientes com empresas ligadas à área da publicidade e audiovisual.
Recentemente, a ElevenLabs anunciou uma parceria com a star-up Rabbit, responsável pelo lançamento do “R1”, um assistente de inteligência artificial portátil. Este pequeno gadget foi apresentado pela primeira vez na edição deste ano da Consumer Electronic Show (CES) de Las Vegas e segundo a própria empresa já vendeu 100 mil unidades desde o seu lançamento.
Artigo de Mariana Jerónimo, editado por Mafalda Ganhão