7 pontos por GN⁺ 2024-05-21 | 9 comentários | Compartilhar no WhatsApp
  • Declaração fornecida à NPR por Marcel Pariseau, assessor de imprensa de Johansson. Tradução automática para o coreano

    "Em setembro do ano passado, recebi uma proposta de Sam Altman para assumir o papel de voz do atual sistema ChatGPT 4.0. Ele disse que eu poderia ajudar a reduzir a distância entre empresas de tecnologia e criadores, e fazer com que os consumidores se sentissem mais à vontade com a mudança sísmica na percepção sobre humanos e IA. Também disse que minha voz poderia trazer conforto às pessoas.

    Depois de muita reflexão, recusei a proposta por motivos pessoais. Nove meses depois, meus amigos, minha família e o público apontaram o quanto um novo sistema chamado "Sky" soava parecido com a minha voz.

    Ao ouvir a demo lançada, fiquei chocada, furiosa e incrédula ao perceber que o sr. Altman buscou uma voz tão parecida com a minha que até meus amigos mais próximos e veículos de imprensa tiveram dificuldade para distinguir. O sr. Altman chegou até a insinuar que a semelhança era intencional, ao tuitar a única palavra "her", em referência ao filme "Her", no qual interpretei a voz de Samantha, um sistema de conversa que formava uma relação íntima com um humano.

    Dois dias antes de a demo do ChatGPT 4.0 ser lançada, o sr. Altman entrou em contato com meu agente pedindo que eu reconsiderasse mais uma vez. Antes mesmo de conseguirmos nos falar, o sistema já havia sido divulgado.

    Por causa das ações deles, fui obrigada a buscar orientação jurídica, e meu advogado enviou duas cartas ao sr. Altman e à OpenAI pedindo que explicassem o que fizeram e o processo exato usado para criar a voz "Sky". No fim, a OpenAI concordou, ainda que a contragosto, em retirar a voz "Sky".

    Neste momento em que todos nós lidamos com deepfakes e com a proteção da própria imagem, do próprio trabalho e da própria identidade, acredito que essas questões exigem clareza absoluta. Espero uma solução na forma de transparência e da aprovação de leis adequadas para proteger os direitos individuais."

9 comentários

 
botplaysdice 2024-05-22

Como será que a OpenAI vai se posicionar sobre isso?

Será que vão dizer: 'Essa voz não é a sua. A sua voz é esta.' e então tocar uma voz da Scarlett Johansson realmente copiada com perfeição?

O jeito como lidaram com isso foi um pouco decepcionante. Talvez seja um efeito colateral do excesso de confiança...

 
lcanon 2024-05-21

Espero que isso dê um golpe certeiro nesse ditado típico do setor de que 'é mais fácil pedir perdão do que permissão'. Se a atitude é essa com uma estrela de Hollywood, dá até para imaginar que mandariam um assassino de aluguel contra a reclamação de uma pessoa comum.

 
shalome7 2024-05-21

Pessoalmente, a voz Sky já tinha sido lançada há 6 meses e qualquer um podia usá-la no app para iOS, e nunca tinha virado assunto por ser parecida com a Scarlett Johansson ou com Her... (no reddit, HN etc., quem tinha usado também dizia que não era a ponto de confundir com a mesma voz..) Eu também, se configurar a Sky agora, consigo perceber claramente que é uma voz com uma pegada de Scarlett Johansson em Her, mas não sinto que seja a mesma voz.

Mesmo nesse caso, fico em dúvida se é razoável a Scarlett Johansson reivindicar direitos sobre a voz.

Demo publicada anteriormente: https://www.youtube.com/watch?v=RcgV2u9Kxh0

Sabendo agora que é da Scarlett Johansson, ao ouvir de novo ela realmente parece com a Scarlett Johansson... rs

 
eungook 2024-05-22

Espero que você tenha mudado de ideia agora.

 
bbulbum 2024-05-21

Poxa... mesmo assim, uma empresa que supostamente lidera o setor de IA...

 
xguru 2024-05-21

A OpenAI publicou separadamente um texto sobre como as vozes do ChatGPT foram escolhidas.

O processo de escolha das vozes do ChatGPT

  • O modo de voz do ChatGPT é um dos recursos mais apreciados pelos usuários
  • As 5 vozes distintas (Breeze, Cove, Ember, Juniper, Sky) foram cuidadosamente escolhidas por meio de um amplo processo que durou 5 meses
  • Participaram dubladores profissionais, agências, diretores de elenco e consultores da indústria

Apoio à comunidade criativa e colaboração com o setor de atuação por voz

  • A OpenAI apoia a comunidade criativa e trabalha em estreita colaboração com o setor de atuação por voz para o casting de dubladores
  • Cada dublador recebe remuneração acima do nível mais alto do mercado, e isso continuará enquanto a voz for usada no produto
  • Há a convicção de que vozes de IA não devem imitar deliberadamente a voz única de celebridades
  • A voz de Sky não é uma imitação de Scarlett Johansson, mas a voz natural de outra atriz profissional
  • Os nomes não são divulgados para proteger a privacidade dos dubladores

Colaboração com diretores de elenco e produtores premiados para definir os critérios das vozes

  • No início de 2023, houve colaboração com diretores de elenco e produtores independentes, renomados e premiados para selecionar os dubladores
  • Os critérios para as vozes do ChatGPT foram criados considerando cuidadosamente a personalidade única de cada voz e seu apelo para um público global
  • Os critérios incluíam origens diversas ou fluência em vários idiomas, voz atemporal, voz que transmite confiança, e uma voz calorosa, envolvente e confiante

Dubladores e atores de tela com mais de 400 inscrições

  • Em maio de 2023, a agência de casting e os diretores de elenco divulgaram um anúncio para recrutamento de talentos
  • Em apenas uma semana, receberam mais de 400 inscrições
  • Os atores fizeram testes gravando falas a partir de roteiros de respostas do ChatGPT

Seleção final de 5 vozes e discussão com os atores sobre a visão para a interação com vozes de IA

  • Ao longo de maio de 2023, a equipe de casting analisou e selecionou de forma independente 14 atores
  • Antes de enviar as vozes finalistas para a OpenAI, houve um trabalho adicional de refinamento
  • Com cada ator, foram discutidos a visão para a interação com vozes de IA e as capacidades, limitações, riscos e salvaguardas da tecnologia
  • Era importante que os atores entendessem o escopo e a intenção do modo de voz antes de se comprometerem com o projeto
  • Depois que a equipe interna da OpenAI revisou as vozes sob a perspectiva de produto e pesquisa, as vozes finais foram escolhidas após cuidadosa consideração

Convite aos atores para São Francisco para gravações e lançamento das vozes do ChatGPT

  • Em junho e julho, os atores foram convidados a São Francisco para sessões de gravação e reuniões presenciais com as equipes de produto e pesquisa da OpenAI
  • Em 25 de setembro de 2023, as vozes foram lançadas no ChatGPT
  • Todo o processo envolveu ampla colaboração com os atores e a equipe de casting ao longo de 5 meses
  • A OpenAI continua colaborando com os atores para a pesquisa de áudio do GPT-4o e novos recursos de voz

Novo modo de voz do GPT-4o para usuários pagos e planos para adicionar mais vozes

  • Nas próximas semanas, será oferecida aos usuários do ChatGPT Plus uma versão alfa do novo modo de voz do GPT-4o
  • Com o GPT-4o, será possível interagir com o ChatGPT por voz de forma muito mais natural
  • O GPT-4o lida com interrupções de forma fluida, gerencia conversas em grupo com eficácia, filtra ruídos de fundo e se adapta ao tom
  • No futuro, há planos de adicionar mais vozes ao ChatGPT para atender melhor aos diversos interesses e preferências dos usuários
 
GN⁺ 2024-05-21
Comentário no Hacker News

Resumo da coletânea de comentários do Hacker News

  • Conflito entre OpenAI e Scarlett Johansson

    • A OpenAI procurou Scarlett Johansson, mas ela recusou. Dois dias antes do lançamento do GPT-4o, entrou em contato novamente com o agente dela, mas não obteve resposta. No fim, a OpenAI demonstrou um produto que imitava sua voz. Depois que a equipe jurídica de Scarlett fez questionamentos, a OpenAI removeu essa voz do produto.
  • Ação imprudente da OpenAI

    • Há a opinião de que foi inadequado a OpenAI tentar contratar Johansson várias vezes sem sucesso e depois imitar sua voz.
  • Críticas ao demo do ChatGPT-4o

    • Há a opinião de que a tentativa de Altman de copiar "ela" foi desagradável. A decisão de Johansson de não participar é vista como acertada. Ficou claro que o mecanismo de TTS ainda está sendo usado.
  • Declaração de Mira Murati

    • Há a opinião de que foi marcante a fala de Murati de que o modo de voz do GPT-4o foi inspirado menos pelo filme 'Her' e mais pelos aspectos naturais da conversa humana. O fato de Murati ter travado diante da pergunta parece ter sido uma forma de evitar problemas legais.
  • Tuíte de Sam

    • Há a opinião de que o tuíte de Sam forneceu à equipe jurídica de Scarlett Johansson todas as provas de que precisavam.
  • Questões legais

    • A voz Sky estaria imitando não Scarlett Johansson em si, mas a personagem dela no filme 'Her'. Há discussões jurídicas relacionadas ao problema de vozes de dubladores e atores de voz serem apropriadas por modelos de IA. A situação legal pode variar conforme os contratos de Johansson.
  • A escolha de Johansson

    • Há a opinião de que é interessante Johansson ter aberto mão de royalties consideráveis e de oportunidades de colaboração. É possível entender seu incômodo com o uso não autorizado de sua voz. Isso é semelhante a desenvolvedores terem seu código usado por IA sem autorização.
  • Resposta legal

    • Há a opinião de que a OpenAI recuou porque Johansson tem condições financeiras de contratar advogados. Existe preocupação de que Altman e a OpenAI possam violar com facilidade os direitos de outras pessoas.
  • O caso de Weird Al Yankovic

    • Há a opinião de que deveriam seguir o exemplo de Weird Al Yankovic, que conseguiu o que queria respeitando o conceito de consentimento.
  • Pedidos por ação judicial

    • Há a opinião de que Johansson deveria processar a empresa para servir de exemplo. Ela tem recursos para lutar, e a empresa mereceria isso.
 
[Este comentário foi ocultado.]