- O banner da home é a principal área que aparece primeiro na tela inicial do cliente, e maximiza a taxa de cliques (CTR) e a experiência do usuário por meio de um sistema de recomendação hiperpersonalizado
- Saindo do método anterior de simples otimização de CTR baseado em MAB (Multi-Armed Bandit), a empresa passou a refletir com mais precisão as características de banners e usuários com algoritmos modernos como DeepFM, Two-Tower e HGNN e embeddings baseados em grafos
- Problemas característicos do domínio, como ciclo de vida curto dos banners, feedback de clique com muito ruído e desbalanceamento de dados, foram resolvidos com Continual Learning e operação híbrida entre modelos individuais e integrados
- Como resultado final, foi construída uma pipeline de recomendação estruturada com melhoria de mais de 16% no CTR, resposta a novos banners e usuários cold start, além de integração com tempo real e políticas de negócio
- Daqui para frente, a evolução continuará com serving em tempo real, Multi-Task Learning, aprimoramento da qualidade dos embeddings e adoção de métricas de desempenho mais amplas
Criando uma experiência melhor com big banners personalizados para cada cliente
- Com o aumento dos gostos dos clientes e da diversidade do conteúdo exibido, havia um limite para oferecer uma experiência satisfatória com exibição uniforme de banners
- Com o objetivo de maximizar o CTR, foi conduzido um projeto para introduzir lógica de exibição personalizada no big banner do topo da home de cada store
Importância e características do banner da home
- O banner da home é um banner deslizante no topo da tela que o cliente vê primeiro no serviço da Musinsa (35 peças no total); no app, é exibida uma peça, e na web, três
- Cerca de 97% de todo o tráfego da Musinsa encontra o banner da home ao entrar na tela principal
- Os cliques no banner da home representam 35% do total de cliques e 37% das sessões em que ocorre clique, mostrando sua grande relevância
- É uma área com impacto muito alto em conversão de negócio devido à alta frequência de exposição
Limitações do método de recomendação anterior
- Antes, a recomendação era feita com foco em CTR usando o algoritmo MAB (Multi-Armed Bandit)
- Balanceamento entre exploração (Exploration) e aproveitamento (Exploitation)
- Três limitações:
- Dependência de um único indicador de CTR, com pouca capacidade de refletir diferentes preferências de clientes e características dos banners
- Dificuldade para refletir a relação entre banners (tratamento independente)
- Cold start (queda de desempenho quando faltam dados de clique para novos banners)
- Para superar essas limitações, foi projetado um novo sistema de recomendação
Pipeline do sistema de recomendação
- O sistema é composto por uma pipeline em múltiplas etapas
- Reforço da representação do banner: extração de embeddings baseados em texto, imagem e produtos relacionados ao banner (com uso de HGNN e GraphSAGE)
- Treinamento do modelo de previsão de cliques: aplicação simultânea dos modelos DeepFM (interação entre features) e Two-Tower (embeddings separados de usuário/banner)
- Scoring e aplicação dos banners: cálculo batch/em tempo real do score previsto de CTR por usuário
- Para usuários com dados suficientes, personalização refinada
- Para usuários novos ou cold, recomendação baseada em segmento
- Reflexo das políticas de negócio: além da pontuação do sistema, políticas e estratégias da empresa, banners de campanha e mudanças urgentes também são refletidos em tempo real
- Exibição final dos banners: recomendação e exibição final dos banners Top-N com maior score
Apresentação dos principais modelos de recomendação
- DeepFM: estrutura paralela de FM (interações de 2ª ordem) + DNN (interações de alta dimensão), aprendendo de forma eficaz tanto dados esparsos quanto interações complexas, com excelente desempenho em previsão de CTR
- Two-Tower: extração de embeddings de usuário e banner em redes neurais independentes, com pontos fortes em dados de grande escala e serving em tempo real, além de recomendação baseada em similaridade
DeepFM
- Combinação de camada FM (interação de features de 2ª ordem) + camada DNN (integração não linear de features em alta dimensão)
- Forte para dados esparsos e com estrutura de aprendizado End-to-End, permitindo otimização consistente de desempenho
- Usa como features informações do usuário, metadados do banner e embeddings (64 dimensões)
- Trata o vetor de embedding como um único bloco para garantir eficiência e estabilidade no aprendizado
- Gera o ranking dos banners com base no resultado de previsão de CTR
Two-Tower
- Usuário e banner são embutidos em redes neurais separadas (torres), e a recomendação é feita por cálculo de similaridade
- Oferece escalabilidade adequada para grandes volumes de dados e resposta rápida com vetorização prévia (baixa latência)
- Cada tower aproveita diferentes informações de entrada, como demografia, logs de comportamento, texto/imagem etc.
- Sua estrutura de aprendizado separado/processamento paralelo permite responder de forma rápida e flexível a grandes problemas de recomendação
Principais dificuldades encontradas na aplicação prática
- Os banners da home têm ciclo de vida muito curto (2 a 3 dias, e às vezes até em escala de horas), exigindo reflexão em tempo real
- O sinal de feedback depende principalmente de cliques, dificultando identificar a preferência real do usuário
- Diferentemente de produtos e marcas, banners têm pouca metadata estruturada, e entender o contexto de imagem e texto é difícil
- O desbalanceamento de dados entre stores (diferença de tráfego e atividade entre categorias especializadas) pode degradar o desempenho geral
- Para superar esses problemas, o sistema foi redesenhado em torno de três eixos técnicos: reforço da expressividade, atualização contínua e mitigação do desbalanceamento
Medidas práticas de melhoria
Reforço das características do banner
- Para superar as limitações do uso da média de embeddings do PinSAGE (limite para representar banners complexos e impossibilidade de recomendar novos banners), foi adotado HGNN
- Com base nos padrões de comportamento dos usuários, a relação banner-produto foi embutida na estrutura de grafo com GraphSAGE
- Para informações de texto e imagem, foi usada uma combinação de embeddings de LLM
- Foi introduzida atualização em tempo real dos embeddings de usuário e Continual Learning, refletindo os interesses mais recentes do usuário
- Aumento de 8,3% no CTR
Continual Learning
- Em vez de aprendizado em lote com todos os dados, foi introduzida atualização contínua (a cada 1 hora, com logs das últimas 3 horas)
- A taxa de aprendizado é ajustada dinamicamente conforme o volume de atividade (até 5x durante a semana, 2x à noite)
- Isso viabilizou adaptação rápida, prevenção do envelhecimento do modelo e incorporação ágil de recomendações sem queda de desempenho
- Aumento de 24% no CTR
Escolha estratégica de modelos
- Foi definida a melhor estratégia de modelagem para cada store
- Na main store, DeepFM+Continual; nas categorias especializadas, modelos individuais Two-Tower, com melhoria de 19% no CTR
Resultado final
- Em relação ao MAB anterior, houve melhora de 11,2% no CTR com Two-Tower e 16,1% com DeepFM
- Na home da Musinsa, foi aplicado em produção o DeepFM+Continual Learning; nas categorias especializadas, o modelo Two-Tower
Próximos passos
- Estão em andamento avanços como migração para arquitetura de serving em tempo real, adoção de Multi-Task Learning (CTR+GGMV), melhoria da qualidade dos embeddings e da estrutura do grafo e diversificação das métricas de desempenho
- O plano é evoluir para um modelo que vá além de um CTR único e avalie também diferentes objetivos de negócio e a qualidade da experiência
1 comentários
Que bom texto ~