2 pontos por GN⁺ 2025-06-05 | 1 comentários | Compartilhar no WhatsApp
  • O banner da home é a principal área que aparece primeiro na tela inicial do cliente, e maximiza a taxa de cliques (CTR) e a experiência do usuário por meio de um sistema de recomendação hiperpersonalizado
  • Saindo do método anterior de simples otimização de CTR baseado em MAB (Multi-Armed Bandit), a empresa passou a refletir com mais precisão as características de banners e usuários com algoritmos modernos como DeepFM, Two-Tower e HGNN e embeddings baseados em grafos
  • Problemas característicos do domínio, como ciclo de vida curto dos banners, feedback de clique com muito ruído e desbalanceamento de dados, foram resolvidos com Continual Learning e operação híbrida entre modelos individuais e integrados
  • Como resultado final, foi construída uma pipeline de recomendação estruturada com melhoria de mais de 16% no CTR, resposta a novos banners e usuários cold start, além de integração com tempo real e políticas de negócio
  • Daqui para frente, a evolução continuará com serving em tempo real, Multi-Task Learning, aprimoramento da qualidade dos embeddings e adoção de métricas de desempenho mais amplas

Criando uma experiência melhor com big banners personalizados para cada cliente

  • Com o aumento dos gostos dos clientes e da diversidade do conteúdo exibido, havia um limite para oferecer uma experiência satisfatória com exibição uniforme de banners
  • Com o objetivo de maximizar o CTR, foi conduzido um projeto para introduzir lógica de exibição personalizada no big banner do topo da home de cada store

Importância e características do banner da home

  • O banner da home é um banner deslizante no topo da tela que o cliente vê primeiro no serviço da Musinsa (35 peças no total); no app, é exibida uma peça, e na web, três
  • Cerca de 97% de todo o tráfego da Musinsa encontra o banner da home ao entrar na tela principal
  • Os cliques no banner da home representam 35% do total de cliques e 37% das sessões em que ocorre clique, mostrando sua grande relevância
  • É uma área com impacto muito alto em conversão de negócio devido à alta frequência de exposição

Limitações do método de recomendação anterior

  • Antes, a recomendação era feita com foco em CTR usando o algoritmo MAB (Multi-Armed Bandit)
    • Balanceamento entre exploração (Exploration) e aproveitamento (Exploitation)
  • Três limitações:
    • Dependência de um único indicador de CTR, com pouca capacidade de refletir diferentes preferências de clientes e características dos banners
    • Dificuldade para refletir a relação entre banners (tratamento independente)
    • Cold start (queda de desempenho quando faltam dados de clique para novos banners)
  • Para superar essas limitações, foi projetado um novo sistema de recomendação

Pipeline do sistema de recomendação

  • O sistema é composto por uma pipeline em múltiplas etapas
    1. Reforço da representação do banner: extração de embeddings baseados em texto, imagem e produtos relacionados ao banner (com uso de HGNN e GraphSAGE)
    2. Treinamento do modelo de previsão de cliques: aplicação simultânea dos modelos DeepFM (interação entre features) e Two-Tower (embeddings separados de usuário/banner)
    3. Scoring e aplicação dos banners: cálculo batch/em tempo real do score previsto de CTR por usuário
      • Para usuários com dados suficientes, personalização refinada
      • Para usuários novos ou cold, recomendação baseada em segmento
    4. Reflexo das políticas de negócio: além da pontuação do sistema, políticas e estratégias da empresa, banners de campanha e mudanças urgentes também são refletidos em tempo real
    5. Exibição final dos banners: recomendação e exibição final dos banners Top-N com maior score

Apresentação dos principais modelos de recomendação

  • DeepFM: estrutura paralela de FM (interações de 2ª ordem) + DNN (interações de alta dimensão), aprendendo de forma eficaz tanto dados esparsos quanto interações complexas, com excelente desempenho em previsão de CTR
  • Two-Tower: extração de embeddings de usuário e banner em redes neurais independentes, com pontos fortes em dados de grande escala e serving em tempo real, além de recomendação baseada em similaridade

DeepFM

  • Combinação de camada FM (interação de features de 2ª ordem) + camada DNN (integração não linear de features em alta dimensão)
  • Forte para dados esparsos e com estrutura de aprendizado End-to-End, permitindo otimização consistente de desempenho
  • Usa como features informações do usuário, metadados do banner e embeddings (64 dimensões)
  • Trata o vetor de embedding como um único bloco para garantir eficiência e estabilidade no aprendizado
  • Gera o ranking dos banners com base no resultado de previsão de CTR

Two-Tower

  • Usuário e banner são embutidos em redes neurais separadas (torres), e a recomendação é feita por cálculo de similaridade
  • Oferece escalabilidade adequada para grandes volumes de dados e resposta rápida com vetorização prévia (baixa latência)
  • Cada tower aproveita diferentes informações de entrada, como demografia, logs de comportamento, texto/imagem etc.
  • Sua estrutura de aprendizado separado/processamento paralelo permite responder de forma rápida e flexível a grandes problemas de recomendação

Principais dificuldades encontradas na aplicação prática

  • Os banners da home têm ciclo de vida muito curto (2 a 3 dias, e às vezes até em escala de horas), exigindo reflexão em tempo real
  • O sinal de feedback depende principalmente de cliques, dificultando identificar a preferência real do usuário
  • Diferentemente de produtos e marcas, banners têm pouca metadata estruturada, e entender o contexto de imagem e texto é difícil
  • O desbalanceamento de dados entre stores (diferença de tráfego e atividade entre categorias especializadas) pode degradar o desempenho geral
  • Para superar esses problemas, o sistema foi redesenhado em torno de três eixos técnicos: reforço da expressividade, atualização contínua e mitigação do desbalanceamento

Medidas práticas de melhoria

Reforço das características do banner

  • Para superar as limitações do uso da média de embeddings do PinSAGE (limite para representar banners complexos e impossibilidade de recomendar novos banners), foi adotado HGNN
  • Com base nos padrões de comportamento dos usuários, a relação banner-produto foi embutida na estrutura de grafo com GraphSAGE
  • Para informações de texto e imagem, foi usada uma combinação de embeddings de LLM
  • Foi introduzida atualização em tempo real dos embeddings de usuário e Continual Learning, refletindo os interesses mais recentes do usuário
  • Aumento de 8,3% no CTR

Continual Learning

  • Em vez de aprendizado em lote com todos os dados, foi introduzida atualização contínua (a cada 1 hora, com logs das últimas 3 horas)
  • A taxa de aprendizado é ajustada dinamicamente conforme o volume de atividade (até 5x durante a semana, 2x à noite)
  • Isso viabilizou adaptação rápida, prevenção do envelhecimento do modelo e incorporação ágil de recomendações sem queda de desempenho
  • Aumento de 24% no CTR

Escolha estratégica de modelos

  • Foi definida a melhor estratégia de modelagem para cada store
  • Na main store, DeepFM+Continual; nas categorias especializadas, modelos individuais Two-Tower, com melhoria de 19% no CTR

Resultado final

  • Em relação ao MAB anterior, houve melhora de 11,2% no CTR com Two-Tower e 16,1% com DeepFM
  • Na home da Musinsa, foi aplicado em produção o DeepFM+Continual Learning; nas categorias especializadas, o modelo Two-Tower

Próximos passos

  • Estão em andamento avanços como migração para arquitetura de serving em tempo real, adoção de Multi-Task Learning (CTR+GGMV), melhoria da qualidade dos embeddings e da estrutura do grafo e diversificação das métricas de desempenho
  • O plano é evoluir para um modelo que vá além de um CTR único e avalie também diferentes objetivos de negócio e a qualidade da experiência

1 comentários

 
codemasterkimc 2025-06-05

Que bom texto ~