Fones de ouvido com IA: ouvir apenas a voz de uma pessoa no meio da multidão
Principais pontos
-
Contexto da pesquisa
- Fones de ouvido com cancelamento de ruído são excelentes para bloquear sons específicos.
- Mas ainda têm limitações quando o usuário quer ouvir apenas um som específico.
-
Desenvolvimento de um novo sistema
- Uma equipe da Universidade de Washington desenvolveu um sistema de IA chamado "Target Speech Hearing".
- Ao colocar os fones de ouvido e olhar para uma pessoa específica por 3 a 5 segundos, o usuário consegue ouvir apenas a voz dessa pessoa.
- O sistema continua reproduzindo essa voz específica mesmo que o usuário se mova ou olhe para outra direção.
-
Como usar
- O usuário coloca fones de ouvido comuns equipados com microfones, olha para uma pessoa específica e aperta um botão.
- Os fones aprendem o padrão de voz dessa pessoa e bloqueiam os demais sons.
- O sistema continua rastreando essa voz específica mesmo que o usuário se mova.
-
Resultados da pesquisa
- Em uma avaliação de clareza de fala feita por 21 participantes, o sistema foi considerado duas vezes mais claro do que o áudio convencional.
- No momento, só é possível registrar a voz de uma pessoa por vez, e o registro fica difícil se houver um som alto vindo da mesma direção.
-
Planos futuros
- Há planos para expandir o sistema para earbuds e aparelhos auditivos.
Opinião do GN⁺
-
Utilidade da tecnologia
- Em ambientes barulhentos, poder ouvir claramente a voz de uma pessoa específica pode ser útil em reuniões, palestras e situações semelhantes.
-
Limitações da tecnologia
- No estágio atual, o fato de só ser possível registrar a voz de uma pessoa por vez torna a solução um pouco limitada.
- A dificuldade de registro quando há um som alto vindo da mesma direção também precisa ser melhorada.
-
Potencial de expansão da tecnologia
- Se for expandida para earbuds e aparelhos auditivos, a tecnologia poderá ajudar um número maior de usuários.
-
Tecnologias concorrentes
- Será necessário compará-la com outras tecnologias de cancelamento de ruído que oferecem funções semelhantes.
-
Praticidade
- Antes da comercialização real, será preciso considerar a diferença entre o desempenho em ambiente de pesquisa e o desempenho no uso cotidiano.
1 comentários
Comentários do Hacker News
Se isso diminuísse para o tamanho de pequenos protetores auriculares, eu, como alguém sem deficiência auditiva, gostaria de usar. Parece que poderia resolver aquela frustração de não conseguir ouvir bem uma conversa em restaurantes ou bares movimentados.
O preço alto e os problemas de qualidade dos aparelhos auditivos. Mesmo dispositivos com apenas a função básica de amplificação de som são muito caros. Além disso, eles interferem no ouvido e fazem a pessoa perder a capacidade de filtrar outros sons.
A pesquisa de AR do Facebook oferece uma plataforma experimental barata. Há rastreamento ocular, arranjo de microfones e câmera frontal, então seria fácil adaptar isso para uma variação com microfone ajustável.
Para pessoas com deficiência auditiva, uma função assim seria um presente dos deuses. Espero que isso seja integrado aos aparelhos auditivos o quanto antes.
Essa função pode ajudar no tratamento de zumbido. Consigo ouvir bem quando uma pessoa fala, mas quando várias pessoas falam ou há música, não consigo ouvir nada.
Forneceram links para o código open source e para o artigo de pesquisa. Fiquei curioso para saber se isso pode funcionar de forma independente.
Possibilidade de sucesso comercial. Imagine um recurso que permita silenciar a voz de uma pessoa barulhenta.
Quando trabalhava na Sonos, pesquisavam uma função parecida. Tentavam desenvolver, por meio de um chipset ANC, uma função que deixasse ouvir apenas a voz de uma pessoa específica.
Link do código. (https://github.com/vb000/LookOnceToHear)
Por causa do TDAH, é difícil conversar em ambientes cheios. Uma função que deixasse ouvir apenas a voz do interlocutor parece que seria muito útil.
Fones de ouvido com ANC podem ser úteis em casa. Seria bom ter uma função que deixasse a voz do parceiro passar automaticamente.