- Os assistentes de voz com IA transformam de forma inovadora a interação com a tecnologia, mas as conversas com assistentes de voz existentes podem parecer mecânicas e desconfortáveis
- Há dificuldade em compreender e se adaptar aos aspectos sutis e emocionais da conversa humana
- E se um assistente de voz totalmente aberto fosse implementado desta forma?
- Responde às solicitações do usuário em tempo real, com voz natural, empatia e inteligência emocional
- Entende o contexto de longo prazo de conversas anteriores e também lida com conversas entre várias pessoas, interrupções, confirmações e pausas para pensar
- Funciona totalmente de forma local em hardware de consumo
Desenvolvimento do BUD-E (Buddy for Understanding and Digital Empathy)
- A LAION desenvolveu o BUD-E em colaboração com o ELLIS Institute Tübingen, a Collabora e o Tübingen AI Center
- O trabalho começou com o desenvolvimento de um assistente de voz básico com baixa latência e, em janeiro de 2024, alcançou uma latência de 300~500ms
- Espera-se que, com modelos maiores, seja possível alcançar tempos de resposta abaixo de 300ms
Roteiro de desenvolvimento do BUD-E
- Mesmo a conversa com o modelo básico é muito mais natural do que tudo o que foi visto até agora
- Mas ainda há muitos problemas a resolver e funcionalidades a desenvolver
- Reduzir a latência e minimizar os requisitos do sistema
- Aumentar a naturalidade da conversa e das respostas
- Acompanhar conversas ao longo de dias, meses e anos
- Melhorar a funcionalidade e as capacidades do assistente de voz
- Aprimorar a compreensão multimodal e do contexto emocional
- Construir infraestrutura para interface do usuário, integração contínua e empacotamento simples
- Expandir para múltiplos idiomas e múltiplos falantes
Colaboração para construir o futuro da IA conversacional
- O desenvolvimento do BUD-E é um processo contínuo que exige o esforço coletivo de diversas comunidades
- Desenvolvedores open source, pesquisadores e entusiastas são convidados a melhorar módulos individuais do BUD-E e contribuir para seu crescimento
- A expectativa é construir juntos um assistente de voz com IA capaz de conversas naturais, intuitivas e empáticas
Ainda não há comentários.