12 pontos por xguru 2022-10-04 | Ainda não há comentários. | Compartilhar no WhatsApp
  • É possível gerar sons como "um cachorro latindo no parque", "som de assobio com vento soprando" e "um homem discursando diante de muitas pessoas aplaudindo"
  • A geração de áudio envolve vários desafios
    • É difícil separar os objetos que produzem som, isso fica ainda mais complexo devido às diversas condições de gravação do ambiente real, e a falta de anotações sobre essas situações dificulta o treinamento do modelo
  • Para amenizar esses problemas, é proposta uma técnica de aumento de dados (augmentation technique) que mistura diversas amostras de áudio e faz o modelo aprender internamente técnicas para separar várias fontes

Ainda não há comentários.

Ainda não há comentários.