- Um sistema de busca de músicas é composto por duas etapas: registro e busca
- Registro: converter faixas de áudio existentes em impressões digitais de áudio (Audio Fingerprint) e armazená-las no banco de dados
- Busca: converter o áudio de entrada em uma impressão digital de áudio e compará-la com o banco de dados para buscar faixas semelhantes
- Conhecimentos básicos
- Arquivo WAV: formato PCM sem compressão, que preserva o original sem alteração dos dados
- Amostragem (Sampling): converte sinais analógicos em digitais; quanto maior a taxa de amostragem, maior a precisão
- Espectrograma (Spectrogram): gráfico que visualiza mudanças de frequência e amplitude
- Transformada de Fourier: converte o sinal para o domínio da frequência para analisar o som
- Pico (Peak): dado que representa componentes principais de frequência, permitindo remover ruído e comprimir
- Impressão digital de áudio (Audio Fingerprint): gerada por hashing dos dados de pico, usada para armazenamento e busca no banco de dados
- Processo de implementação
- Ler o arquivo WAV e gerar os dados de amostragem
- Aplicar a Transformada de Fourier aos dados de amostragem para gerar um espectrograma
- Extrair os picos do espectrograma
- Aplicar hashing aos dados de pico para gerar a impressão digital de áudio
- Armazenar a impressão digital de áudio no banco de dados ou pesquisá-la para verificar faixas semelhantes
1 comentários
Umi