5 pontos por GN⁺ 2025-12-16 | 2 comentários | Compartilhar no WhatsApp
  • Projeto que raspou dados de todos os restaurantes de Londres e construiu um modelo de machine learning para analisar o impacto estrutural do algoritmo do Google Maps na sobrevivência de pequenos negócios urbanos
  • O ranking do Google Maps não é apenas uma lista, mas atua como um 'formador de mercado', organizando ativamente a demanda por meio dos sinais de relevância, distância e prominence (proeminência)
  • O estudo mostra uma estrutura reforçada cumulativamente por volume e velocidade de reviews, reconhecimento de marca e menções na web, gerando um ciclo de exposição inicial → aumento da demanda → aumento de reviews → exposição adicional
  • Essa estrutura favorece redes e restaurantes em áreas centrais, enquanto novos restaurantes independentes enfrentam um ‘problema de cold start’, em que é difícil até serem descobertos por falta de reviews
  • Para distinguir isso, foi construído um modelo de ML que prevê a nota esperada (contrafactual) com base apenas nas condições estruturais do restaurante, e a diferença em relação à nota real é calculada como residual, identificando restaurantes superestimados ou subestimados pelo algoritmo
  • Indo além, o projeto agrega restaurantes por região e analisa a força estrutural dos hubs de restaurantes com PCA e clustering, mostrando como a plataforma reorganiza o ecossistema gastronômico da cidade

Google Maps não é um diretório, mas um formador de mercado (Market Maker)

  • Ao contrário da narrativa oficial de que o Google Maps apenas reflete passivamente “o que as pessoas gostam”, na prática ele organiza a demanda por meio de três sinais centrais: relevance (relevância), distance (distância) e prominence (proeminência)
  • relevance é inferida por correspondência textual entre a busca e os metadados do negócio; distance é um fator puramente espacial
  • prominence é calculada a partir de número de reviews, velocidade de reviews, nota média, reconhecimento de marca, visibilidade na web etc., e é aí que começa seu impacto político-econômico
    • Ela reflete com que frequência as pessoas interagem com um lugar, o mencionam e já o conhecem
  • Em outras palavras, o Google Maps não apenas ‘reflete’ a demanda: ele é um formador de mercado (market maker) que a organiza por meio de seu algoritmo de ranking

Estrutura de vantagem cumulativa e efeito Mateus

  • A visibilidade na lista de rankings determina os visitantes; os visitantes determinam a velocidade de acúmulo de reviews; e esses reviews voltam a alimentar o sinal de prominence, criando uma vantagem cumulativa (cumulative advantage)
  • É semelhante à forma como o capital se multiplica por juros compostos nos mercados financeiros, uma versão do efeito Mateus (Matthew Effect) de Robert Merton aplicada a uma lanchonete de kebab
    • O princípio de que “a quem tem, mais será dado
  • Redes saem na frente graças ao reconhecimento de marca em vários pontos da cidade, e estabelecimentos em áreas de alto fluxo acumulam reviews mais rapidamente mesmo com a mesma qualidade, subindo no ranking de prominence
  • Novos negócios independentes enfrentam o problema de cold start: sem reviews, são difíceis de descobrir; sem serem descobertos, também é difícil acumular reviews
  • O que parece uma escolha neutra do consumidor deve, na verdade, ser entendido como um desenho de mercado mediado por algoritmo

A plataforma como formadora de mercado

  • Em economia, um market maker não apenas reflete oferta e demanda, mas molda ativamente liquidez, matching e descoberta de preços
  • Plataformas como o Google Maps desempenham papel semelhante em serviços locais ao controlar não o preço, mas a visibilidade
  • Na linguagem da economia digital, o algoritmo de ranking funciona como um attention allocator, direcionando a demanda para certos negócios e afastando-a de outros

Uma cidade contrafactual construída com machine learning

  • Se o Google Maps é um formador de mercado da demanda urbana, a pergunta central passa a ser: como a cidade pareceria sem essa camada de amplificação?
  • Para separar o desempenho intrínseco de um restaurante do efeito de visibilidade da plataforma, foi construído um modelo de machine learning
  • Foi usado o HistGradientBoostingRegressor (árvore de decisão com gradient boosting do scikit-learn)
    • Adequado para dados tabulares grandes, mistos e desorganizados, além de capturar efeitos de interação sem definição manual
  • Features do modelo:
    • número de reviews (com transformação log para refletir o efeito decrescente da atenção)
    • tipo de culinária, se é rede ou independente, faixa de preço, categoria do negócio (restaurante/café/takeaway/bar)
    • localização na cidade por meio de uma grade espacial

Modelo separado para classificação do tipo de culinária

  • Foi identificado que a classificação de tipos de culinária no Google Maps é imprecisa e inconsistente
    • Muitos lugares aparecem com rótulos vagos como "restaurant", "cafe" e "meal takeaway"
  • Foi então criado um modelo de classificação separado para prever o tipo de culinária a partir do nome do restaurante, idioma do cardápio e texto das reviews
  • O filtro de tipo de culinária no dashboard usa o resultado do machine learning, e não as tags do Google
  • Erros na classificação de culinária distorcem análises de diversidade, clustering e relações competitivas de curta distância

Medindo a subavaliação algorítmica com o residual da nota

  • Todas as features passam por um pipeline padrão de pré-processamento, incluindo imputação de ausências e encoding
  • O modelo aprende apenas o mapeamento entre características observáveis na plataforma e a nota
  • Para cada restaurante, é gerada uma nota esperada contrafactual (counterfactual expected rating)
  • A diferença entre a nota real e a nota prevista é o rating residual
    • residual positivo: desempenho real superior ao baseline da plataforma
    • residual negativo: desempenho inferior ao que o algoritmo costuma recompensar
  • Não é uma medida perfeita da qualidade da comida, mas é um indicador forte para medir subprecificação algorítmica (algorithmic mispricing)
    • Ele captura pontos em que o valor social e culinário diverge daquilo que a plataforma amplifica estruturalmente

Limites da visibilidade paga por anúncio

  • Alguns restaurantes pagam por promoted pins ou anúncios em busca local
  • A visibilidade paga não é pública, então não pode ser estimada
    • Isso é um sinal de como o poder da plataforma se tornou opaco
  • O residual de nota pode acabar refletindo parcialmente gastos com publicidade não observáveis

Apresentando o London Food Dashboard

  • Foi criado o London food dashboard para resumir os resultados da análise
  • Recursos atuais: busca por nome, filtro de joias subestimadas (identificadas pelo algoritmo de machine learning), tipo de culinária, borough, faixa de preço, nota mínima e número de reviews
  • Ainda é uma versão beta, mas funciona como um microscópio para observar a economia alimentar algorítmica de Londres
  • Endereço: laurenleek.eu/food-map
  • O filtro “underrated gems” é um exemplo de uso do residual de machine learning
    • Bolhas maiores e mais escuras indicam lugares subestimados pelo algoritmo

Do restaurante individual à vizinhança algorítmica

  • Restaurantes não fracassam sozinhos; fracassam dentro de um ecossistema
  • Para analisar o que acontece quando a dinâmica da plataforma se expande do restaurante individual para todo o ecossistema alimentar do bairro, foi adicionada uma segunda camada de modelagem
  • Os restaurantes foram agregados em pequenas células espaciais (hexágonos no mapa, melhores que quadrados em edge effect)
  • Para cada área, foram calculadas características resumidas: densidade de restaurantes, nota média, residual médio, total de reviews, proporção de redes, entropia de culinária, faixa de preço
  • Após padronizar as features, foi aplicado PCA (análise de componentes principais) para comprimir a “força do ecossistema de restaurantes” em um hub score contínuo
  • Em seguida, foi aplicado K-means clustering nesse mesmo espaço de features para classificar as áreas em 4 tipos estruturais:
    • hubs elite, strong, everyday e weak

Resultados da análise de hubs

  • O padrão é familiar: o centro de Londres domina
  • O importante não é a localização dos hubs, mas o tipo de hub
  • Em vez de usar notas brutas, o hub score total foi usado para identificar os 5 hubs de restaurantes estruturalmente mais fortes de Londres
    • Lugares onde densidade, atenção algorítmica, sobrevivência de negócios independentes e poder de compra do consumidor estão alinhados
    • Eles aparecem rotulados no mapa
  • Para evitar provocar conflitos de bairro, o texto não lista explicitamente esse ranking

Densidade por tipo de culinária e a diversidade culinária de Londres

  • Ao sobrepor o painel de densidade de culinárias à análise de hubs, o resultado fica ainda mais claro
  • A diversidade culinária de Londres não está distribuída de forma uniforme pela economia de plataforma
  • Cozinhas de imigrantes se concentram fortemente em áreas urbanas com visibilidade algorítmica estruturalmente mais fraca
  • Italian, Indian, Turkish, Chinese, Thai, British, Japanese, French, American e fish-and-chips refletem, cada uma, histórias específicas de assentamento, redes de trabalho, formatos de varejo e relações com capital e aluguel
  • Algumas culinárias formam corredores longos e contínuos; outras aparecem em clusters descontínuos ligados a determinados centros comerciais ou faixas de renda
  • Diversidade culinária não é apenas questão de gosto: ela está ligada a onde as famílias se estabeleceram, quais centros comerciais permaneceram baratos por tempo suficiente para que a segunda geração abrisse negócios e quais partes da cidade receberam imigração antes de o ecossistema culinário amadurecer

Implicações para políticas públicas

  • O projeto começou como um problema de busca e acabou levando a uma questão maior
  • O resultado mais importante não é qual bairro ficou em primeiro lugar, mas o reconhecimento de que a plataforma agora estrutura silenciosamente a sobrevivência em mercados urbanos cotidianos
  • A cena gastronômica londrina já não é organizada apenas pelo gosto
    • Ela é organizada por visibilidade que cresce em compounding, aluguéis que sobem quando a descoberta chega e algoritmos que distribuem atenção muito antes de o consumidor aparecer
  • O que parece “escolha” está se tornando cada vez mais um efeito a jusante dos sistemas de ranking

Necessidade de transparência e auditoria algorítmica

  • Se a descoberta agora molda a sobrevivência de pequenos negócios, então concorrência, justiça e regeneração urbana já não podem ignorar os sistemas de ranking das plataformas
  • Mesmo que governos locais reconstruam ruas e flexibilizem licenças, a invisibilidade algorítmica pode isolar economicamente certos lugares
  • Transparência e auditabilidade das plataformas deixaram de ser um debate técnico de nicho e estão se tornando, silenciosamente, ferramentas de política econômica local
  • No mínimo, algoritmos de ranking com esse nível de impacto econômico devem ser auditáveis
    • Assim como auditamos mercados financeiros, também deveríamos auditar o mercado da atenção (attention market)
  • É preciso prestar atenção ao tamanho do poder que o Google Maps exerce como aplicativo de navegação

2 comentários

 
colus001 2025-12-16

Acho que isso, somado à interferência ativa de donos de estabelecimentos nas avaliações, está gerando uma grande ineficiência. É um problema difícil. Antes, as avaliações do Google Maps eram algo em que eu confiava para escolher um lugar, mas agora parece que a área de descoberta está completamente arruinada.

 
illiil1lii 2025-12-16

O Naver Maps se tornou bem pouco confiável, e o Kakao Map até que é um pouco melhor. Mesmo assim, também há comentários pagos, então nesse tipo de área, quanto mais mainstream o serviço é, menor tende a ser a confiabilidade.