2 pontos por GN⁺ 2024-05-15 | 1 comentários | Compartilhar no WhatsApp

Sir, there's a cat in your mirror dimension

  • Já falei antes sobre o domínio da frequência.

    • É uma técnica que converte um sinal do dia a dia nas amplitudes das formas de onda que o compõem.
    • A base mais comum é a onda senoidal de frequência crescente.
    • Muitas outras formas de onda também podem criar vários domínios de frequência.
  • Duas propriedades importantes da transformação para o domínio da frequência:

    • Reversibilidade: é possível restaurar os dados originais a partir da imagem de frequência.
    • Simetria entre entrada e saída: a transformação pode ser feita nos dois sentidos usando a mesma operação matemática.
  • Na prática, essa distinção é importante.

    • É especialmente importante em compressão.
    • Se você transformar uma imagem para o domínio da frequência e reduzir a precisão dos componentes de alta frequência, a quantidade de dados diminui.
    • A imagem resultante ainda parece visualmente igual.

Usando o MS Paint como uma ferramenta de compressão de ponta

  • A imagem no domínio da frequência parece ruído espalhado.

    • A maior parte disso não é visualmente importante.
    • A transformação é uma alavanca que vai e volta entre duas dimensões funcionalmente equivalentes.
    • Isso leva à dúvida se seria possível usar essa dimensão espelhada como lar e mover alguns dados para lá.
  • Para testar isso, foi usada uma foto de gato e calculada sua forma no domínio da frequência com a transformada discreta do cosseno (DCT).

    • Gato no tempo, gato na frequência.
  • Foi usada a foto da mulher do exemplo anterior, sobrepondo o padrão de "ruído de gato" da dimensão espelhada e reduzindo a opacidade.

    • Mulher no tempo e gato na frequência.
  • O trabalho de composição inevitavelmente gera perdas.

    • Em teoria, se calcularmos a representação no domínio da frequência da imagem composta com DCT, a foto da mulher se decomporá em ruído uniforme.
    • O "ruído de gato" injetado se aglutinará em uma imagem de gato reconhecível.
  • Na prática, é exatamente isso que acontece.

    • Gato na frequência e mulher no tempo.
  • Se quiser verificar você mesmo, basta baixar a imagem composta e executar o seguinte no MATLAB:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • Curiosamente, o gato também sobrevive ao redimensionamento do documento hospedeiro.

    • O upscaling transforma a imagem em mosaico.
    • O downscaling recorta a imagem.
  • Fiquei curioso sobre o quanto a compressão com perdas danificaria o gato.

    • O impacto foi menor do que o esperado.
    • Com uma configuração alta de qualidade JPEG, a imagem parece bastante boa.
    • Quando a configuração de qualidade cai, o quadrante inferior direito sofre quantização pesada.
    • O caos da compressão JPEG visto no domínio da frequência.
  • Essa visualização mostra quanta informação o algoritmo JPEG destrói.

    • A maior parte disso passa despercebida para nós.
  • Há muitos casos anteriores de uso de espectrogramas de áudio como mensagens ocultas.

    • Também há discussões sobre esteganografia de texto usando coeficientes DCT do JPEG.
    • Não que essa técnica seja especialmente útil, mas ela destaca como o domínio da frequência e o domínio do tempo se conectam de maneira divertida.

Opinião do GN⁺

  1. Entendendo a transformação para o domínio da frequência: a transformação para o domínio da frequência desempenha um papel importante em compressão de dados e processamento de sinais. Entendê-la ajuda a processar dados de imagem e áudio com eficiência.
  2. Uso do MATLAB: o MATLAB é uma ferramenta poderosa para análise e visualização de dados. Este artigo mostra um exemplo prático de uso.
  3. Limites da compressão JPEG: dá para entender visualmente os limites da compressão JPEG. Isso ajuda na busca por formas de reduzir o tamanho dos arquivos mantendo a qualidade da imagem.
  4. Esteganografia: a esteganografia usando o domínio da frequência é um tema interessante relacionado à segurança de dados. Ela permite aprender formas de transmitir mensagens ocultas.
  5. Aplicações divertidas da tecnologia: este artigo mostra como aplicar tecnologia de forma criativa e divertida. Isso desperta mais interesse por tecnologia e inspira novas ideias.

1 comentários

 
GN⁺ 2024-05-15
Opinião do Hacker News

Resumo dos comentários do Hacker News

  • Tema da foto e energia espectral:

    • Na maioria das fotos, o tema reconhecível concentra a energia espectral na origem (canto superior esquerdo).
    • O tema da foto geralmente fica no centro do quadro, minimizando a interferência entre os dados nos domínios espacial e de frequência.
  • Fundamentos da marca d’água digital:

    • Essa técnica serve de base para marca d’água digital robusta em sinais como imagens ou áudio.
    • A principal aplicação é detectar material protegido por direitos autorais mesmo depois de o sinal passar por muito processamento.
  • Dualidade tempo-frequência da transformada de Fourier:

    • O princípio matemático da transformada de Fourier funciona da mesma forma independentemente da direção da transformação.
    • Se você inserir o gráfico de frequência do gato no gráfico espacial da mulher, a transformada de Fourier da mulher fará o gato aparecer.
  • Pedido de confirmação do processo:

    • Tira-se uma foto, converte-se o gato para o domínio da frequência e depois o compõe na imagem visual da mulher.
    • Ao aplicar DCT novamente na imagem composta, o gato aparece.
  • Aplicação em esteganografia:

    • Uma aplicação interessante de esteganografia para esconder imagens ilegais.
    • Ao converter para o domínio da frequência e compor em outra imagem, só quem souber como reverter isso conseguirá ver a imagem.
  • Truque de espectrograma de áudio do Aphex Twin:

    • É parecido com um truque divertido em que o Aphex Twin fez um rosto estranho aparecer no espectrograma de áudio de uma faixa.
  • Importância da posição no DCT:

    • Se o gato estivesse mais concentrado no canto superior esquerdo, essa demonstração provavelmente não funcionaria bem.
    • O DCT tem muitos componentes de alta frequência, então colocar o gato no canto superior esquerdo aumentaria a chance de ele ficar encoberto.
  • Entendimento da compressão de imagem:

    • Percebe-se que o domínio da frequência pode ser usado para compressão de imagem.
    • Fica a dúvida se a maioria dos algoritmos de compressão de imagem funciona removendo as partes silenciosas do domínio da frequência.
  • Método específico de DCT:

    • Parece que o DCT foi aplicado de outra forma, e não com os blocos 8x8 usados no JPEG.
    • As funções de base do DCT 2D aparentemente não foram usadas neste caso.
  • Codificação de imagens em música:

    • É semelhante ao que Aphex Twin e Venetian Snares fizeram ao codificar imagens no som.
    • Com certas ferramentas, é possível ver que as frequências formam a imagem do gato.