1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • AV2 é a especificação de codificação de vídeo de próxima geração da AOMedia, com base no AV1 e foco em maior eficiência de compressão e entrega de alta qualidade com bitrate mais baixo
  • A especificação final v1.0.0 cobre sintaxe do bitstream, semântica e procedimentos de decodificação, servindo como referência técnica para avaliar a conformidade de implementações AV2
  • Foi otimizada para streaming, transmissão e videoconferência em tempo real, e também oferece suporte a AR/VR, entrega em tela dividida e melhorias no processamento de conteúdo de tela
  • O release atual é composto pela AV2 Bitstream & Decoding Process Specification v1.0.0, publicada em 28 de maio de 2026, e pelo software de referência AVM
  • Implementadores podem usar a especificação online, o PDF, as tabelas de consulta em cabeçalho C, o Syntax Browser e a tag AVM v1.0.0, enquanto o rascunho v13 permanece disponível para referência

Visão geral do AV2

  • AV2 é a especificação de codificação de vídeo de próxima geração da Alliance for Open Media (AOMedia), projetada com base no AV1 para oferecer maior eficiência de compressão
  • O objetivo é entregar vídeo de alta qualidade com bitrates muito mais baixos, com otimização para as demandas de streaming, transmissão e videoconferência em tempo real
  • A especificação v1.0.0 é a referência técnica final para implementações AV2, cobrindo a sintaxe do bitstream, a semântica e os procedimentos de decodificação necessários para conformidade completa
  • O AV2 oferece suporte a aplicações de AR/VR, entrega em tela dividida de vários programas, melhorias no processamento de conteúdo de tela e operação em uma faixa mais ampla de qualidade visual
  • O AOMedia Video Model (AVM) é fornecido como software de referência oficial para implementadores
  • Feedbacks e problemas podem ser enviados para wg-codec-chair@aomedia.org ou registrados no AVM issue tracker

Release e materiais de implementação

  • AV2 specification and reference code v1.0.0

    • O release atual é a AV2 Bitstream & Decoding Process Specification v1.0.0, publicada em 28 de maio de 2026, junto com o respectivo software de referência AVM
    • Read Online: documentação online da especificação v1.0.0
    • Download PDF: PDF completo da especificação v1.0.0
    • Additional Tables: arquivo de cabeçalho C com tabelas de consulta extraídas da seção 9
    • Syntax Browser: navegador para explorar junto a estrutura da sintaxe e a semântica
    • Software: software de referência AVM na tag v1.0.0
  • AV2 working draft v13

    • O rascunho de trabalho v13 foi publicado em 5 de janeiro de 2026 e foi substituído pela v1.0.0
    • O rótulo “v13” se refere ao marco do rascunho de trabalho e não significa uma versão mais nova que a v1.0.0
    • Ele foi preservado para fins de referência
    • Read Online: documentação online da v13
    • Additional Tables: tabelas adicionais da v13
    • Syntax Browser: navegador de sintaxe da v13
    • Software: software de referência research-v13.0.0
    • Release Notes: notas de release da v13
  • Materiais para uso da especificação

    • A especificação completa inclui desde escopo e definições até apêndices, abrangendo formato, sintaxe, semântica e procedimentos de decodificação
    • A versão em PDF fornece a especificação completa v1.0.0 para consulta offline
    • Additional Tables é um material com as tabelas de consulta da seção 9 extraídas em um arquivo de cabeçalho C, útil como referência de implementação
    • O Syntax Browser fornece as Syntax Structures da seção 5 e a Semantics da seção 6 em uma interface de janelas divididas
    • No Syntax Browser, é possível ver lado a lado definições de sintaxe e semântica, clicar em elementos gramaticais, pesquisar nas duas seções e copiar estruturas sintáticas
    • O Reference Software é o AVM correspondente à especificação v1.0.0, e a tag v1.0.0 é a versão correspondente

1 comentários

 
GN⁺ 4 시간 전
Comentários do Hacker News
  • O AV2 é apenas uma etapa de uma jornada muito longa e, no estado atual, parece praticamente difícil de usar
    Mesmo em hardware bom, o encoder costuma ficar em cerca de 1 fps, então isso provavelmente continuará assim até por volta de 2028, quando sair o primeiro chip com aceleração por hardware para AV2, e os streams em AV2 talvez só se tornem comuns por volta de 2030
    Em termos de ganho de eficiência, os 20~30% sobre o AV1 são consideráveis, mas ainda é discutível se o AV2 vale tudo isso. Por outro lado, o suporte a múltiplos streams é uma grande vantagem para VR e esportes ao vivo, e também é interessante poder enviar o canal alfa em um stream separado e compor no arquivo para oferecer suporte adequado a vídeo com transparência

    • Olhando para a trajetória do AV1, codificação por hardware não é necessariamente indispensável. É bom ter, mas o encoder atual é um encoder de referência
      Agora que a especificação foi finalizada, a velocidade pode melhorar bastante em encoders voltados para produtos reais, embora a codificação em tempo real provavelmente continue difícil até isso chegar ao hardware
    • Se “o maior recurso adicionado é o suporte a múltiplos streams”, eu imaginava que isso fosse mais assunto de formato de contêiner do que de codec de vídeo
    • No ritmo atual, acho difícil ver um encoder AV2 por hardware em PCs tão cedo. Quase toda a capacidade de fabricação dos chips mais novos e avançados está sendo sugada pela Apple e por empresas de IA
      A menos que os fabricantes de chips levem os projetos de AV2 para processos mais antigos e baratos, isso deve continuar fora do alcance do usuário comum; fabricantes chineses de chips para TV até podem colocar decodificadores AV2 só para marcar presença na lista de recursos, mas um encoder de verdade ainda parece improvável por um bom tempo
    • Vendo o desenvolvimento de GPUs desviar para NPUs, isso parece meta para 2035 no mínimo. Os fabricantes vão querer maximizar a área de silício dedicada a operações matriciais
      Numa era em que trilhões estão sendo investidos em datacenters, o custo de tráfego vira preocupação secundária, e quem realmente pode se beneficiar disso talvez seja só YouTube ou Netflix. Nessa escala, talvez seja mais barato investir em caches no nível de ISP
    • Se o objetivo é “oferecer vídeo de alta qualidade com bitrate muito menor”, mas os dispositivos lentos que realmente precisariam disso ainda nem existem, qual é o sentido disso afinal?
  • Fico curioso para saber como o AV2 vai melhorar o formato de imagem AVIF. O AVIF domina formatos concorrentes em imagens estáticas de baixo bitrate, especialmente quando há chroma subsampling
    Mas isso não vale para imagens sem perdas. Comparado a JPEG XL sem perdas e WEBP sem perdas, o AVIF sem perdas chega a parecer risível

    • AVIF é meu formato de imagem favorito hoje. Quase não existem formatos que reúnam sem perdas, HDR, transparência e suporte de navegador ao mesmo tempo
      Ele é excelente mesmo em imagens comprimidas de forma muito agressiva, e é impressionante o quanto o tamanho do arquivo pode cair. Ao contrário de HEIC ou Ultra HDR JPEG, ele oferece suporte nativo a HDR no próprio formato de arquivo, sem gambiarra como gain map em sidecar. Isso não importa para todo mundo, mas eu gosto de HDR, e o AVIF parece ser o único formato que leva isso realmente a sério
    • Nem sempre é assim https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • Se o libavif passar a ter suporte a AV2, talvez seja possível ganhar eficiência adicional só atualizando para uma versão como v2.0.0
    • Sinceramente, o que precisamos agora não é de AVIF2. Já existem formatos de imagem de nicho demais
  • No momento, várias empresas estão montando ativamente claim charts para o AV1, e parece quase certo que processos virão. O mesmo processo já começou para o AV2, mas a maioria ainda está esperando os casos do AV1 amadurecerem
    As pessoas continuam chamando os codecs da família AV de “royalty-free”, mas na prática isso parece cada vez mais uma aposta jurídica e financeira

    • Esse tipo de conversa já acontece há décadas
      Nunca entendi por que algumas pessoas gostam da ideia de empresas possuírem matemática como se estivessem torcendo por um time local
      Por um tempo, achei que fosse porque muita gente investiu grande esforço em encoders H.264, então os servos digitais ficavam irritados e com inveja de quem defendia uma liberdade bagunçada. Mas parece que algumas pessoas simplesmente gostam da própria ideia de empresas cobrarem um imposto sobre a distribuição de vídeo
      Felizmente, essas empresas gananciosas vêm repetidamente atirando no próprio pé, e sua influência está diminuindo
    • Há quanto tempo o AV1 existe? Já se passaram uns 8 anos e ainda não apareceu um detentor de patente confiável
      Sempre há abutres rondando padrões de compressão, então não precisa levar isso tão a sério. Mesmo que surjam processos, existe um fundo de defesa jurídica para barrar reivindicações sem fundamento
    • Se os codecs da família AV parecem uma aposta jurídica e financeira, qual seria a alternativa?
      O H.265 tem dois pools de licença HEVC aos quais é preciso aderir, e há pelo menos duas empresas fora desses pools
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      Escolher um codec que não seja AVx não parece tornar a situação menos complexa nem reduzir o risco de litígio
    • Isso seria verdade até comparando com algo como o HEVC? Para fazer tudo corretamente com HEVC, é preciso pagar a 3 pools de patentes com termos diferentes entre si, e além disso ainda existem detentores de patentes fora de qualquer pool que podem cobrar royalties a qualquer momento, nos próprios termos
    • Padrões de telecomunicações não deveriam ser patenteáveis. O potencial de abuso por efeito de lock-in é grande demais
  • Quanto tempo levará até alguém implementar esse padrão e ser processado porque Adobe ou Dolby decidiu que queria dar uma pancada em alguém? Meu conhecimento pode estar desatualizado, mas se isso for tão “aberto” quanto o AV1, sou bastante cético quanto ao que cada empresa individualmente vai realmente permitir. E também tem a ganância

    • Levou 7 anos para a primeira alegação de patente sobre o AV1 chegar aos tribunais, e provavelmente vai demorar bastante até esse caso ser resolvido
      Curiosamente, não veio daquele pool de patentes que continuou aparecendo nas notícias nos últimos anos. Ou seja, pode demorar bastante até surgir uma tentativa
    • Trolls de patente são um câncer. Quanto tempo vai demorar para conseguirem apoio total daqueles que abalam a independência do Judiciário dos EUA em benefício próprio? Espero que essa corrupção seja interrompida antes disso
  • Meio em tom de brincadeira, mas eu estava esperando um Apple TV com suporte a AV1, e agora passei a esperar também pelo suporte a AV2 no Apple TV

  • Não sou especialista em codificação de vídeo, mas fico pensando se, no futuro, em vez de esquemas de compressão de função fixa, talvez passemos a depender mais de redes de IA para reconstruir vídeo e deixá-lo muito mais leve do que vídeo comprimido
    Codecs neurais como github.com/Orange-OpenSource/Cool-Chic são um exemplo disso

    • Provavelmente vai depender de os smartphones passarem a trazer NPU de forma generalizada, e de surgir uma API padrão para acessar essas NPUs
      Mas não sei se codecs baseados em IA conseguiriam competir com hardware de função fixa em consumo de bateria
  • O AV1 já foi um grande salto rumo a um formato de vídeo eficiente e aberto, e o AV2 também era esperado havia muito tempo
    Vai levar tempo até ele ser implementado em chips e hardware e passar a usar codificação e decodificação por hardware de forma eficiente e rápida, mas considerando a alta no preço do armazenamento e a crise dos chips, uma melhora de cerca de 25% em eficiência parece muito promissora

  • Dav2d não soa tão bem assim. Espero que, antes disso, apareça alguma contribuição de alguém bom em trocadilhos para nome de repositório
    avi2ude? av2go?

    • rav2d parece um nome razoável — https://github.com/stukenov/rav2d. É um port em Rust, com a mesma vibe de rav1d→dav1d
    • Foi difícil encontrar um nome bom com av2
      Em francês, vira d2vid, ou seja, Deuvid
  • Espero que apareça um codificador bem rápido. O codificador de referência do AV1 também não era grande coisa, e aqui acontece o mesmo
    Mas no momento em que surgir algo como o SVT-AV2, acho que vou ficar bem satisfeito