4 pontos por xguru 2024-02-13 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Os assistentes de voz com IA transformam de forma inovadora a interação com a tecnologia, mas as conversas com assistentes de voz existentes podem parecer mecânicas e desconfortáveis
  • Há dificuldade em compreender e se adaptar aos aspectos sutis e emocionais da conversa humana
  • E se um assistente de voz totalmente aberto fosse implementado desta forma?
    • Responde às solicitações do usuário em tempo real, com voz natural, empatia e inteligência emocional
    • Entende o contexto de longo prazo de conversas anteriores e também lida com conversas entre várias pessoas, interrupções, confirmações e pausas para pensar
    • Funciona totalmente de forma local em hardware de consumo

Desenvolvimento do BUD-E (Buddy for Understanding and Digital Empathy)

  • A LAION desenvolveu o BUD-E em colaboração com o ELLIS Institute Tübingen, a Collabora e o Tübingen AI Center
  • O trabalho começou com o desenvolvimento de um assistente de voz básico com baixa latência e, em janeiro de 2024, alcançou uma latência de 300~500ms
  • Espera-se que, com modelos maiores, seja possível alcançar tempos de resposta abaixo de 300ms

Roteiro de desenvolvimento do BUD-E

  • Mesmo a conversa com o modelo básico é muito mais natural do que tudo o que foi visto até agora
  • Mas ainda há muitos problemas a resolver e funcionalidades a desenvolver
    • Reduzir a latência e minimizar os requisitos do sistema
    • Aumentar a naturalidade da conversa e das respostas
    • Acompanhar conversas ao longo de dias, meses e anos
    • Melhorar a funcionalidade e as capacidades do assistente de voz
    • Aprimorar a compreensão multimodal e do contexto emocional
    • Construir infraestrutura para interface do usuário, integração contínua e empacotamento simples
    • Expandir para múltiplos idiomas e múltiplos falantes

Colaboração para construir o futuro da IA conversacional

  • O desenvolvimento do BUD-E é um processo contínuo que exige o esforço coletivo de diversas comunidades
  • Desenvolvedores open source, pesquisadores e entusiastas são convidados a melhorar módulos individuais do BUD-E e contribuir para seu crescimento
  • A expectativa é construir juntos um assistente de voz com IA capaz de conversas naturais, intuitivas e empáticas

Ainda não há comentários.

Ainda não há comentários.