7 pontos por ninebow 2023-07-27 | 1 comentários | Compartilhar no WhatsApp

Introdução

Neste ano, seis artigos receberam o prêmio de artigo de destaque. O processo de seleção foi o seguinte.

Primeiro, os artigos passaram por uma pré-filtragem, e 32 trabalhos foram selecionados como potenciais vencedores. Nesse processo, foram escolhidos os artigos com notas médias mais altas e os recomendados pelo comitê do programa. Como resultado, esse conjunto incluía artigos que cobriam 16 tópicos tratados nas sessões de apresentação oral. Esses artigos foram então encaminhados ao comitê de artigos de destaque.

O comitê considerou esses trabalhos e selecionou os vencedores com base em sua clareza excepcional, capacidade de gerar insights, criatividade e impacto duradouro.

É claro que não existe um processo perfeito para escolher artigos premiados, mas acreditamos que a comunidade da ICML reconhecerá as contribuições extremamente fortes desses trabalhos.

  • Comitê de artigos de destaque: Danqi Chen, Bohyung Han, Samuel Kaski, Mengdi Wang, Tong Zhang

Os vencedores são os seguintes (em ordem de ID do artigo):

  1. Adaptação D por Aprendizado sem Taxa de Aprendizado (Learning-Rate-Free Learning by D-Adaptation)
    Aaron Defazio (FAIR), Konstantin Mishchenko (Samsung AI Center)
    https://openreview.net/forum?id=GXZ6cT5cvY
    Este artigo apresenta uma abordagem interessante para enfrentar o desafio de obter limites ótimos sem taxa de aprendizado para otimização convexa estocástica não suave. Os autores propõem um novo método para otimizar esse tipo de problema, superando as limitações da escolha tradicional da taxa de aprendizado. Este trabalho representa uma contribuição valiosa e prática para a área de otimização.

  2. Uma marca d’água para grandes modelos de linguagem (A Watermark for Large Language Models)
    John Kirchenbauer, Jonas Geiping, Yuxin Wen, Jonathan Katz, Ian Miers, Tom Goldstein (University of Maryland)
    https://openreview.net/forum?id=aX8ig9X2a7
    Este artigo propõe uma forma de aplicar uma marca d’água à saída de grandes modelos de linguagem, isto é, embutir no texto gerado um sinal invisível para humanos, mas detectável algoritmicamente. A marca d’água pode ser gerada sem reentreinar o modelo de linguagem e pode ser detectada sem acesso à API ou aos parâmetros. O artigo também propõe um teste estatístico com valor-p interpretável para detectar a marca d’água e apresenta um framework de teoria da informação para analisar sua sensibilidade. O método proposto é simples e inovador, e traz uma análise teórica rigorosa junto com experimentos sólidos. Dado o importante desafio de detectar e auditar texto sintético gerado por LLMs, este artigo tem potencial para causar um impacto significativo na comunidade.

  3. Generalização sobre o não visto, raciocínio lógico e currículo por grau (Generalization on the Unseen, Logic Reasoning and Degree Curriculum)
    Emmanuel Abbe (EPFL, Apple) , Samy Bengio (Apple), Aryo Lotfi (EPFL), Kevin Rizk (EPFL)
    https://openreview.net/forum?id=3dqwXb1te4
    Este trabalho traz avanços importantes para o aprendizado de funções booleanas, especialmente no contexto de generalização sobre o não visto (GOTU). Trata-se de um problema desafiador que levanta a questão da generalização fora da distribuição. O artigo aborda esse tema importante em profundidade e apresenta uma abordagem bem estruturada, sustentada por análise teórica e experimentos extensos. Esta pesquisa amplia a compreensão teórica do aprendizado de funções booleanas e mostra como aplicá-la a algoritmos práticos.

  4. Projetando estratégias de exploração-exploração usando a razão de informação algorítmica (Designing Exploration-Exploitation Strategies Using the Algorithmic Information Ratio)
    Yonathan Efroni (Technion), Gal Dalal (Technion), Shie Mannor (Technion), Ofer Shayevitz (Tel Aviv University)
    https://openreview.net/forum?id=tRhQsHnoFw
    Este artigo trata do problema muito geral de projetar estratégias para bandits e outras formas de tomada de decisão sequencial. Ele propõe uma maneira de limitar o arrependimento de uma estratégia usando uma nova quantidade chamada razão de informação algorítmica, e deriva como otimizar esse limite. Esse limite é mais apertado do que quantidades anteriores semelhantes baseadas em teoria da informação, e os métodos apresentam bom desempenho em cenários de bandits estocásticos e adversariais, alcançando o melhor desempenho em todos os mundos. Um ponto especialmente interessante é que o artigo sugere a possibilidade de abrir toda uma nova linha de estratégias de exploração-exploração para bandits, indo além de métodos bem conhecidos como Thompson Sampling e UCB. A extensão desse princípio para aprendizado por reforço parece muito promissora. Este artigo recebeu apoio fortemente consistente de revisores especialistas.

Materiais de referência

Este é o site oficial da ICML 2023. Você pode conferir diversos artigos e trabalhos premiados:
https://icml.cc/Conferences/2023

Esta é uma plataforma onde é possível acompanhar revisões e discussões sobre os artigos. Pelos links de cada trabalho, você pode ver mais detalhes e debates:
https://openreview.net/


  • Este texto é uma descrição gerada automaticamente com o uso do GPT-4 e pode conter erros.
  • Se você encontrar alguma informação incorreta, pedimos que avise nos comentários!