- A OpenAI está introduzindo novos recursos de voz e imagem no ChatGPT
- Os novos recursos oferecem uma interface mais intuitiva, permitindo que os usuários conversem por voz ou mostrem imagens ao ChatGPT
- Os usuários poderão usar esses recursos de várias formas, como tirar fotos de pontos turísticos para conversar em tempo real ou fotografar a geladeira e a despensa para decidir o menu do jantar
- O lançamento está previsto para os usuários Plus e Enterprise nas próximas duas semanas; o recurso de voz estará disponível no iOS e Android, e o de imagem em todas as plataformas
- O novo recurso de voz é impulsionado por um modelo de text-to-speech capaz de gerar áudio semelhante ao humano a partir de texto e de alguns segundos de uma voz de exemplo
- O recurso de voz foi desenvolvido em colaboração com atores profissionais de voz e usa o Whisper, sistema de reconhecimento de voz open source da OpenAI, para converter palavras faladas em texto
- O recurso de compreensão de imagens é impulsionado pelo GPT-3.5 e pelo GPT-4, que aplicam capacidade de raciocínio linguístico a uma ampla variedade de imagens
- A OpenAI está lançando esses recursos gradualmente para garantir um uso seguro e benéfico, além de preparar os usuários para sistemas futuros ainda mais poderosos
- A nova tecnologia de voz traz riscos potenciais para agentes mal-intencionados que queiram se passar por figuras públicas ou aplicar golpes
- Modelos baseados em visão também apresentam novos desafios, como alucinações sobre pessoas ou a dependência da interpretação de imagens do modelo em áreas de alto risco
- A OpenAI tomou medidas para limitar a capacidade do ChatGPT de analisar pessoas e fazer afirmações diretas sobre elas, a fim de respeitar a privacidade individual
- A OpenAI divulga com transparência as limitações do modelo, com destaque para limitações em pesquisa e em idiomas com escrita não romana
- Usuários Plus e Enterprise poderão experimentar os recursos de voz e imagem nas próximas duas semanas, e outros grupos de usuários, incluindo desenvolvedores, terão acesso em seguida
1 comentários
Comentários no Hacker News