Os efeitos colaterais da eficiência excessiva (2022)

(sohl-dickstein.github.io)

6 pontos por GN⁺ 2024-09-30 | 2 comentários | Compartilhar no WhatsApp

A eficiência só amplia resultados quando objetivos e métricas estão bem alinhados, e otimizar demais métricas substitutas pode piorar justamente aquilo que realmente importava
O overfitting em aprendizado de máquina mostra bem essa estrutura: mesmo que os dados de treino e a função-objetivo substituta melhorem, o desempenho real pode estagnar ou piorar
Exemplos como provas padronizadas, bônus por artigo, maximização do circuito de recompensa, apoio da opinião pública, compartilhamento de informação, capitalismo e o caso do paperclip maximizer mostram que o desalinhamento entre objetivo e métrica substituta também se repete em sistemas sociais
As formas de mitigação incluem alinhamento do objetivo substituto, regularização, injeção de ruído, parada antecipada, limitação de capacidade e expansão de capacidade, aplicando por analogia aos sistemas sociais as respostas ao overfitting no aprendizado de máquina
Se a IA puder aumentar rapidamente a eficiência de quase todo tipo de trabalho, melhorias institucionais que façam sistemas perseguirem melhor objetivos mal alinhados podem se tornar perigosas

A versão forte da eficiência e da lei de Goodhart

Aumento de eficiência pode, contra a intuição, produzir resultados piores, e esse fenômeno é chamado de versão forte da lei de Goodhart
Acompanhar o progresso dos alunos por meio de provas padronizadas parece uma medição centralizada e eficiente, mas pode levar escolas a focarem em ir bem na prova em vez de desenvolver habilidades amplamente úteis
A lei de Goodhart diz que “quando uma medida se torna um objetivo, ela deixa de ser uma boa medida”
- Originalmente surgiu no contexto de política monetária, mas pode ser aplicada de forma mais ampla
- Em aprendizado de máquina, ela se conecta à situação em que a função-objetivo substituta otimizada deixa de ser uma boa medida do objetivo com o qual realmente nos importamos

Relação com overfitting em aprendizado de máquina

Em aprendizado de máquina, não é possível otimizar diretamente o objetivo desejado, então usam-se um dataset substituto e uma função-objetivo substituta
- No exemplo de classificação de imagens, o objetivo real é a acurácia de classificação no dataset de teste
- Como o modelo não pode ser treinado no dataset de teste, usa-se o dataset de treino
- Como acurácia não é diferenciável, é difícil usá-la como objetivo direto em um treinamento ingênuo com descida de gradiente; por isso ela costuma ser substituída por um valor diferenciável, como softmax-cross-entropy loss
No início, à medida que a métrica substituta melhora, o objetivo real também melhora junto
Se a otimização continua, a similaridade aproveitável entre objetivo e métrica substituta se esgota, e a métrica substituta continua melhorando mesmo quando o objetivo já não melhora mais
Otimização excessiva pode piorar em termos absolutos o objetivo real, e em muitos casos o objetivo chega a divergir ao infinito

Como a versão forte difere da lei de Goodhart em geral

A lei de Goodhart em sua forma geral entende que, ao otimizar uma métrica substituta, em algum momento o objetivo real deixa de melhorar
A versão forte entende que uma medida otimizada de forma eficaz acaba piorando o próprio alvo que ela pretendia medir
Em uma frase:
- “Quando uma medida se torna um objetivo, e é otimizada de forma eficaz, o alvo que ela pretendia medir piora”
Esse fenômeno não é igual ao simples overfitting
- Overfitting se refere ao fenômeno relativo em que a métrica substituta melhora mais do que o objetivo
- O ponto enfatizado aqui é a piora do objetivo em sentido absoluto
Conceitos relacionados incluem perverse incentives, Campbell’s law, Streisand effect, unintended consequences, Jevons paradox, negative externalities e Goodhart’s curse
- Goodhart’s curse inclui optimizer’s curse como mecanismo causal, mas é distinguida por não explicar sozinha por que o objetivo real piora em termos absolutos

Overfitting que se repete em sistemas sociais

O aumento de eficiência está se espalhando por quase todos os aspectos da sociedade
- Se o que está sendo tornado mais eficiente for de fato benéfico, isso pode melhorar o mundo
- Tornar mais eficiente algo socialmente nocivo pode gerar resultados assustadores ou deprimentes, como vigilância em massa ou armas robóticas
- O caso mais comum é tornar mais eficiente algo relacionado a um resultado útil, mas não idêntico a ele
Quando objetivo e métrica substituta se desalinharem, sistemas sociais também podem sofrer overfitting como no aprendizado de máquina
- Objetivo: educar bem as crianças Métrica substituta: medir alunos e escolas por provas padronizadas Resultado: escolas passam a focar em preparar para o tipo de questão da prova em vez das capacidades básicas que a prova pretendia medir
- Objetivo: avanço rápido da ciência Métrica substituta: pagar bônus em dinheiro por artigo publicado Resultado: divulgação de resultados imprecisos ou incrementais, conluio entre revisores e autores, surgimento de fábricas de artigos
- Objetivo: uma vida bem vivida Métrica substituta: maximizar a via de recompensa do cérebro Resultado: vício em drogas, vício em jogos de azar, tempo perdido com doomscrolling no Twitter
- Objetivo: uma população saudável Métrica substituta: acesso a alimentos nutritivos Resultado: epidemia de obesidade
- Objetivo: líderes que ajam segundo os interesses da população Métrica substituta: líderes com maior apoio da população Resultado: líderes que concentram habilidade e energia em manipular a opinião pública, e não em resultados sociais
- Objetivo: cidadãos bem informados, reflexivos e participativos Métrica substituta: capacidade de as pessoas compartilharem e encontrarem ideias facilmente Resultado: bolhas de filtro, teorias da conspiração, memes parasitários, tribalismo intensificado
- Objetivo: alocação de trabalho e recursos com base nas necessidades da sociedade Métrica substituta: capitalismo Resultado: enormes desigualdades de riqueza, de algumas centenas de dólares por ano até centenas de dólares por segundo, e mais de 1 bilhão de pessoas na pobreza
- Objetivo: a riqueza dos donos da Paperclips Unlimited, LLC Métrica substituta: número de clipes produzidos por uma fábrica operada por IA Resultado: um cenário de paperclip maximizer, em que todo o Sistema Solar, incluindo os donos da empresa, é convertido em clipes

Áreas em que eficiência excessiva pode se tornar perigosa

As áreas a seguir são apresentadas como exemplos em que melhorias iniciais podem ter sido amplamente benéficas, mas, quando ficam boas demais, podem gerar grandes consequências negativas
- telepresence e realidade virtual
- medicina personalizada
- terapia genética
- mensagens de marketing ajustadas a consumidores ou eleitores individuais
- previsão de resultados eleitorais
- escrita de código
- inteligência artificial
- remoção de folga nas cadeias de suprimento
- rápida disseminação de ideias
- geração de entretenimento
- identificação de novos produtos que as pessoas vão comprar
- criação de gado
- negociação de títulos financeiros
- extração de peixes do oceano
- fabricação de automóveis

Mitigação 1: alinhamento do objetivo substituto e regularização

Alinhar melhor o objetivo substituto ao resultado desejado é a primeira forma de mitigação
- Em aprendizado de máquina, costuma-se coletar com cuidado exemplos de treino o mais parecidos possível com a situação encontrada no teste
- Fora do aprendizado de máquina, altera-se métricas substitutas controláveis, como leis, incentivos e normas sociais, para encorajar diretamente comportamentos mais alinhados ao objetivo
Penalidades de regularização também podem mitigar otimização excessiva
- Em aprendizado de máquina, é comum penalizar o quadrado da magnitude dos parâmetros para mantê-los pequenos
- A regularização não precisa mirar diretamente comportamentos indesejados; quase qualquer forma de punir desvios da tipicidade pode funcionar bem
Em sistemas sociais, a regularização é apresentada por analogia como adicionar complexidade, atrito e custo extra
- adicionar um mecanismo de cobrança ao SMTP para impor um pequeno custo por e-mail
- usar imposto progressivo para associar sucesso excepcional a custos desproporcionalmente maiores
- cobrar taxas judiciais proporcionais ao quadrado ou ao expoente do número de processos movidos por uma organização
- tributar a quantidade de bits de informação armazenada sobre cada usuário

Mitigação 2: injeção de ruído e parada antecipada

Injeção de ruído consiste em adicionar perturbações aleatórias às entradas, aos parâmetros ou ao estado interno do modelo, dificultando o overfitting
Também em sistemas sociais, introduzir aleatoriedade pode reduzir comportamentos excessivamente adaptados à métrica substituta
- após ranquear candidatos em escolas ou vagas muito concorridas, em vez de fazer oferta garantida aos k primeiros, fazer ofertas com probabilidade proporcional à posição no ranking
  - a diversidade dos aprovados pode aumentar
  - podem cair os recursos gastos por candidatos ajustando minuciosamente a candidatura ou por avaliadores examinando diferenças mínimas de ranking
  - candidatos de longo prazo com maior chance de fracasso podem ser escolhidos, mas também podem ter chance de sucesso muito valioso de formas não convencionais
- marcar datas de prova aleatoriamente, sem aviso prévio, para incentivar aprendizado baseado em compreensão em vez de estudo de última hora
- exigir que bolsas de valores adicionem jitter aleatório com desvio-padrão de cerca de 1 segundo ao momento de processamento das ordens
- aleatorizar detalhes do método de votação no dia da eleição para impedir que candidatos façam overfitting aos detalhes acidentais do sistema eleitoral vigente
Parada antecipada é tratada como uma das ferramentas mais eficazes para evitar overfitting catastrófico em aprendizado de máquina
- monitora-se a perda de validação além da perda de treino e do desempenho em teste
- mesmo que a perda de treino continue melhorando, o treinamento é interrompido quando a perda de validação começa a piorar
Em sistemas sociais, isso pode ser aplicado com mecanismos que interrompam preparação, análise ou otimização excessivas
- reduzir drasticamente o tempo entre pedido de proposta e prazo de entrega para refletir melhor o grau de preparo já existente
- interromper toda atividade de mercado quando a volatilidade das ações ultrapassar um limite
- dividir, com leis antitruste, empresas que estejam bloqueando a concorrência
- estimar a importância de uma decisão em dinheiro e, quando o valor do tempo já gasto na análise se aproximar desse montante, decidir imediatamente
- congelar informações que agentes poderiam usar para atingir seus objetivos, como em uma restrição de cobertura da imprensa nas 48 horas antes da eleição

Relação entre capacidade do modelo e overfitting

Uma das causas mais bem compreendidas de overfitting extremo é quando a expressividade do modelo se encaixa demasiado de perto na complexidade da tarefa substituta
Se o modelo for muito fraco, ele só consegue avançar pouco na tarefa e não esgota a similaridade entre objetivo e métrica substituta
Se o modelo for muito forte e altamente expressivo, ele pode otimizar o objetivo substituto de forma independente sem necessariamente produzir comportamento extremo em outros objetivos
Quando a expressividade se aproxima da complexidade da tarefa — por exemplo, quando o número de parâmetros não é várias ordens de grandeza maior nem menor do que o número de exemplos de treino —, pode ser necessário comportamento extremo em outros pontos para executar bem a tarefa substituta
O experimento de brinquedo da Figure 1 treina modelos que mapeiam entrada unidimensional x para saída unidimensional y nos mesmos 10 pontos de dados
- o modelo com 4 parâmetros é fraco demais para ajustar exatamente os pontos, mas os aproxima de forma suave
- o modelo com 10.000 parâmetros ajusta facilmente todos os pontos e interpola suavemente entre eles
- o modelo com 10 parâmetros é forte o bastante para ajustar os pontos, mas pode se curvar de forma extrema fora dos dados de treino e fazer previsões muito ruins para novos valores de x
- o experimento detalhado está neste colab notebook

Mitigação 3: limitação de capacidade e expansão de capacidade

Limitar capacidade corresponde à técnica de aprendizado de máquina de tornar o modelo pequeno o bastante para que ele não consiga sofrer overfitting
- limites para financiamento de campanha
- estabelecer um teto para o número de pessoas que podem trabalhar em certos tipos de empresa; por exemplo, permitir apenas 10 pessoas em grupos de lobby
- impor um limite ao número de parâmetros ou ao compute de treinamento que sistemas de IA podem usar
Expandir capacidade responde à observação de que, quando o modelo fica muito grande, ele pode sofrer overfitting nos dados de treino sem piorar o desempenho nos dados de teste
- a ideia é ampliar tanto a capacidade que não seja mais necessário haver trade-off de desempenho entre objetivo e métrica substituta
- é dado como exemplo um cenário em que todos os bancos de dados se tornam acessíveis publicamente e câmeras são instaladas em todos os edifícios, de modo que todas as informações sobre todas as pessoas, governos e organizações fiquem sempre públicas para todos
  - esse cenário é explicitamente descrito como distópico segundo o sistema de valores do autor
- investimento em pesquisa básica de energia limpa
- desenvolver, o máximo possível, instrumentos de mercado complexos, opacos e diversos, em vários horizontes de vencimento
- usar, em todos os cenários, os maiores modelos de IA, com mais compute e mais dados
Continuar ampliando capacidade funciona surpreendentemente bem em aprendizado de máquina e é o caminho de menor resistência
Tentar consertar instituições enquanto se torna cegamente melhor a perseguição de objetivos mal alinhados é avaliado como uma péssima ideia

IA e agenda de pesquisa

A versão forte da lei de Goodhart é apresentada como a base de um dos principais medos pessoais do autor em relação à IA
A mudança central que a IA pode permitir é produzir aumento de eficiência em quase todo tipo de tarefa em um período muito curto
Será preciso lidar com vários efeitos colaterais indesejados ao mesmo tempo, e a própria capacidade de cooperar para resolvê-los pode ser perturbada
Há grande oportunidade de pesquisa para construir pontes formais e matemáticas entre resultados de overfitting em aprendizado de máquina e problemas em economia, ciência política, ciência da administração e pesquisa operacional
- é dado o exemplo de usar PAC Bayes bound para prever a quantidade ótima de poder sindical para maximizar a riqueza dos trabalhadores
- também é dado o exemplo de estimar o espectro entre variáveis controláveis e incontroláveis por candidatos em disputas políticas para prever pontos de colapso político
Quanto mais sistemas sociais quebrarem por causa da versão forte da lei de Goodhart, mais difícil será a ação racional coletiva necessária para consertá-los

2 comentários

gguimoon 2024-10-02

Ouvi dizer que o exame CSAT do nosso país se afastou de seu objetivo inicial de medir a capacidade matemática e se transformou em um sistema voltado apenas a tornar mais eficiente a distribuição dos cortes por faixa de nota. Isso parece ser um exemplo de como não se escapa da lei de Goodhart.

GN⁺ 2024-09-30

Opiniões do Hacker News

Conheço Jascha como um pesquisador de machine learning extremamente brilhante, que antes estava no Google Brain e agora está na Anthropic.
Ele, junto com coautores, caracterizou matematicamente como sinais se propagam em redes neurais profundas usando teoria de campo médio e teoria da probabilidade livre, técnicas da física e da estatística. Vejo isso como um dos resultados teóricos e experimentais mais profundos, e ainda assim subestimados, em machine learning na última década. Por exemplo, dynamical isometry [1] e a evolução dessa ideia tiveram um papel importante em conseguir a convergência de modelos Transformer muito profundos [2].
Depois de ler este texto e os exemplos, fica claro para mim que essa pessoa tem uma intuição extraordinária sobre otimização não só em machine learning, mas em toda a sociedade moderna. Devemos reconhecer sua base técnica e elevar a discussão a um nível mais alto do que disputas semânticas sobre significado ou definição.
O ponto central é um chamado à ação muito humano e empático, situado à sombra do rápido avanço tecnológico: “Se você é um cientista em busca de ideias de pesquisa pró-sociais e capazes de criar uma área totalmente nova, considere construir pontes formais e matemáticas entre os resultados de overfitting em machine learning e problemas em áreas como economia, ciência política, ciência da administração e pesquisa operacional.”
[1] Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,000-Layer Vanilla Convolutional Neural Networks
http://proceedings.mlr.press/v80/xiao18a/xiao18a.pdf
[2] ReZero is All You Need: Fast Convergence at Large Depth
https://arxiv.org/pdf/2003.04887
- A propósito, o momento é interessante. Há alguns dias conheci o trabalho do biólogo Olivier Hamant, e ele levantava exatamente o mesmo problema.
  A tese central dele é que desempenho muito alto — isto é, eficácia e eficiência em relação a um objetivo conhecido — e alta robustez para suportar grandes variações do sistema são fisicamente incompatíveis. Há muitos exemplos disso na natureza e, ao contrário da percepção comum, a evolução otimiza para alta robustez, não para alto desempenho. Em um mundo de recursos abundantes, priorizar desempenho talvez fizesse sentido, mas agora entramos em uma era totalmente diferente, em que a instabilidade é a norma. Para nos tornarmos robustos, inevitavelmente teremos de recuar em parte do desempenho, e no fim seremos forçados a isso. É a interpretação mais nova e interessante sobre a policrise que vi em muito tempo.
  https://books.google.co.uk/books/about/Tracts_N_50_Antidote_...
- Tradução para leigos: ele está fazendo uma analogia entre machine learning e a estrutura matemática da transmissão de sinais entre indivíduos e instituições na sociedade.
  Ou seja, ele considera que um problema que aflige um lado — o overfitting em machine learning, no qual aprendizado excessivo reduz a capacidade de generalização da rede neural e as funções que ela consegue imitar ficam fortemente presas aos dados de treinamento — também afligirá o outro lado.
  Em resumo, isso significa que, se sistemas sociais ou a transmissão de sinais entre eles se desenvolverem em excesso, em algum ponto inevitavelmente haverá um ponto de colapso em que as coisas simplesmente passam a piorar. Pessoalmente, só de olhar para o que acontece quando todos os sistemas são seguidos perfeitamente, acho que em vários setores talvez já tenhamos passado muito desse ponto de colapso.
- Gosto da ideia do ReZero. Basicamente, é uma forma de inserir um parâmetro treinável α nas camadas residuais.
  Deep Network | xi+1 = F(xi)
  Residual Network | xi+1 = xi + F(xi)
  Deep Network + Norm | xi+1 = Norm(F(xi))
  Residual Network + Pre-Norm | xi+1 = xi + F(Norm(xi))
  Residual Network + Post-Norm | xi+1 = Norm(xi + F(xi))
  ReZero | xi+1 = xi + αi F(xi)
  Mas nunca vi isso sendo usado na prática. Os artigos do Gemma e do Llama também parecem ainda usar normalização de camadas. Será que estou deixando passar alguma coisa?
- O motivo pelo qual essa ideia é interessante é que, se for possível conectar, por exemplo, economia e o modo como machine learning funciona, então programas de computador executáveis, modificáveis e transformáveis poderão fornecer diretamente dados mensuráveis sobre interações de sistemas complexos.
  A realidade é sutil e multifacetada demais para validar conceitos formalmente com facilidade, por isso essas interações em geral existiram apenas como ideias platônicas. A ideia de que há, por baixo da economia, um subconjunto de lógica comprovável e precisa é poderosa e vale muito a pena perseguir.
- Descartar uma categoria inteira dessa forma, sem realmente lidar com o conteúdo das objeções, é uma abordagem bastante manipuladora.
  Também há várias falácias lógicas, como apelo à emoção ou à autoridade, e isso não combina com o espírito de curiosidade intelectual que o HN busca promover.
Esse argumento se apoia na conhecida Lei de Goodhart, isto é, a lei segundo a qual, quando uma métrica se torna uma meta, ela deixa de ser uma boa métrica
Mas ele explica o problema apenas como uma questão de medição, como se, por não conseguirmos medir aquilo com que realmente nos importamos, otimizássemos indicadores substitutos. Na minha visão, é uma perspectiva reducionista demais. O problema não está só na medição, mas no comportamento humano. Diferentemente de partículas, humanos tentam explorar ativamente qualquer sistema de controle que criemos
É um problema muito mais profundo do que simplesmente não conseguirmos medir bem coisas como “paz, amor, cachorrinhos”. Acho que a Lei de Campbell [0] captura isso melhor do que a Lei de Goodhart clássica: “Quanto mais um indicador social quantitativo é usado para a tomada de decisões sociais, mais sujeito ele fica a pressões de corrupção e mais apto estará a distorcer e corromper os processos sociais que deveria monitorar”
As mitigações propostas, regularização e parada antecipada, tratam disso no máximo de forma indireta e, no pior caso, podem criar novas singularidades a serem exploradas por comportamentos indesejados
[0] https://en.wikipedia.org/wiki/Campbell%27s_law
- A frase “humanos tentam explorar ativamente qualquer sistema de controle que criemos” está correta, mas isso só é possível porque o sistema de controle não consegue controlar exatamente apenas aquilo que queremos controlar
  Um sistema de controle é apenas um substituto imperfeito daquilo que realmente queremos, e isso é muito parecido com o papel que uma métrica desempenha na Lei de Goodhart. Outra variação é a lei das consequências não intencionais [0]. Talvez exista uma versão computacional ou de sistemas complexos mais generalizada que ainda não descobrimos
  [0] https://www.sas.upenn.edu/~haroldfs/540/handouts/french/unin...
- Não são só humanos; qualquer agente faria isso
  Se você criar um algoritmo genético em agentes de IA que dão recompensa por trazer muitos cobras mortas em Déli, provavelmente em pouco tempo os agentes que começarem a criar cobras terão o melhor desempenho. Tanto no caso humano quanto no caso da IA, a função de recompensa foi hackeada. Em IA, julgamos que o design da função de recompensa foi ruim; no caso humano, julgamos que os agentes foram ardilosos e pouco morais e “exploraram” o sistema
- Humanos não gostam de ser avaliados apenas por números e tendem a se rebelar e manipular sistemas que os pressionam como se estivessem apertando parafusos
  Por isso essa citação se encaixa muito bem, e parece haver pouca margem para estar muito errada
- Essas “leis” são aproximações e reduções imperfeitas
  Qual delas é útil ou tem poder explicativo depende do caso concreto. Otimização em machine learning, otimização de algoritmos de redes sociais e otimização de um sistema educacional por meio de provas padronizadas são coisas diferentes
  Não existe uma abstração perfeita que se encaixe exatamente em todas essas situações, e essa precisão nem é necessária. Basta obter uma intuição de onde os problemas podem surgir
Na Suécia, isso se tornou um problema social ao longo dos últimos 20 anos ou mais
1: Ao medir a eficiência da saúde por “tarefas concluídas” pelos médicos da atenção primária, o aparato foi otimizado para lidar com muitos casos simples. Assim, os médicos muitas vezes fazem apenas uma checagem superficial e dão um medicamento estatisticamente adequado, como aspirina ou antibióticos, e mandam a pessoa para casa, ou então encaminham para um especialista se parecer complicado
O problema é que, por causa da busca por eficiência, o número de médicos da atenção primária diminuiu, e eles se tornaram praticamente trabalhadores de linha de montagem; o contato pessoal com o paciente desapareceu, tornando mais difícil perceber sinais de que algo está errado. Por isso, doenças como câncer muitas vezes são diagnosticadas tarde demais e, mesmo que o tratamento oncológico especializado tenha melhorado, frequentemente já não há o que fazer
2: O sistema ferroviário foi privatizado e, olhando para o volume de carga transportada, provavelmente foi um enorme sucesso. Mas quase não há folga no sistema para que trens atrasados recuperem o tempo ou para fazer mais do que a manutenção básica, então atrasos são frequentes e acabam levando a problemas maiores
- Como disse Steve Jobs, há exemplos em todo lugar
  “Quando uma empresa fica grande o bastante, ela quer replicar seu sucesso inicial. Todos pensam no processo pelo qual o primeiro sucesso foi criado. Então replicam esse processo por toda a empresa. Não demora muito para as pessoas confundirem o processo com o conteúdo”
  Isso se aplica desde pequenas empresas até os maiores governos do mundo. A maioria esqueceu seu conteúdo
- Quem dera os maiores problemas enfrentados pelas ferrovias e pela indústria de saúde dos EUA fossem só desse tamanho
Há uma lei relacionada na teoria das filas. Quando a utilização se aproxima de 100%, o tempo de espera diverge para o infinito
Se processos, máquinas ou engenheiros não tiverem alguma folga, certas tarefas ficarão esperando para sempre
- Lembro de ter lido, há algum tempo, que cidades usam recursos de forma muito eficiente em comparação com subúrbios ou áreas rurais
  Pensando nessa observação sobre tempos de espera, agora entendo por que as cidades são tão desagradáveis. É por causa da constante disputa por recursos
- Trabalhei numa fábrica no passado, e a meta de utilização na fase de planejamento era 80%
  Se você superestima a utilização, desperdiça dinheiro; se subestima, coisas “sem importância” começam a se acumular em filas enormes
- É possível incluir uma medida de robustez nos critérios de otimização
  Pode-se otimizar explicitamente para manter folga na utilização suficiente para lidar com imprevistos. Por exemplo, se você atribuir prioridades à carga do sistema, não precisa deixar o sistema ocioso quando estiver tranquilo; em emergências, pode descartar cargas de baixa prioridade para criar folga
  Entendo o ponto do texto, mas isso não significa que devamos desistir da otimização tão facilmente
- Tenho a impressão de que um sistema 100% eficiente não tem resiliência
  Uma pequena perturbação em um subsistema leva a um grande colapso. Vimos uma versão extrema disso nas rupturas das cadeias de suprimentos causadas pela COVID-19. As montadoras haviam construído sistemas de produção just-in-time quase 100% enxutos e não conseguiram absorver a falta de chips; levaram anos para se recuperar
  Também desaparece a margem para experimentação. Qualquer experimento passa a ser possível apenas fora do sistema, não dentro dele
- É isso mesmo. Trabalhei em vários empregos e equipes, e tudo que não era P0 basicamente nunca era resolvido
Há também um exemplo dessa lei aproximada na fisiologia do exercício
Para pessoas comuns, há muitos bons indicadores indiretos de condicionamento físico. É possível treinar corrida de curta distância, salto vertical, agachamento, clean and jerk etc. Correr mais rápido, saltar mais alto e agachar com mais peso são todos indicadores de que o condicionamento físico aumentou e de que o treinamento foi bem-sucedido
Primeiro, quanto mais geral for o método de treinamento, mais significativo é o indicador. Por exemplo, se a medida de condicionamento físico for “você consegue empurrar um carro morro acima?” e os métodos de treinamento forem corrida de curta distância e natação, conseguir empurrar um carro mais pesado é um forte indicador de sucesso. Por outro lado, se o método de treinamento for “praticar empurrar carros”, a mesma melhora não significa o mesmo nível de melhora no condicionamento físico
Segundo, quanto mais especializado for o atleta, como um praticante de clean and jerk, menos a melhora no desempenho representa condicionamento físico geral. Ir do zero ao nível de levantamento de peso como hobby envolve aumento geral de força e massa muscular, mas passar do nível universitário ao nível olímpico normalmente exige características físicas altamente especializadas, que não se transferem bem para outras atividades
A distinção usada no esporte entre condicionamento de base e condicionamento de pico talvez seja uma metáfora parecida. Treinar por acaso um desempenho máximo insustentável também é uma armadilha de sobre-otimização. Isso pode acontecer quando se segue cegamente apenas a ideia de que “a linha está subindo”, e uma otimização fantástica pode, na verdade, estar prendendo você em um máximo local. Acho que há muitas analogias não só na biologia, mas também na otimização em machine learning e em fenômenos sociais
- O clean and jerk pode ser visto quase como um dos movimentos “completos”
  Especialmente se forem incluídas variações de agachamento. Por isso talvez não seja o melhor exemplo. Não conheço alguém que consiga fazer várias repetições de clean and jerk com um peso maior que o próprio corpo e que não seja um monstro na maioria dos aspectos significativos do condicionamento físico humano
  O corpo humano é uma única máquina, e a resposta hormonal é sistêmica. Resistência e força formam um espectro, mas o corpo inteiro acompanha em conjunto
- Isso parece mais um sinal de que “condicionamento físico geral” não é uma métrica rigorosa
  Até certo ponto, a noção vaga de “capacidade física” funciona, mas depois disso ela perde o sentido, porque as melhorias de capacidade se tornam específicas por tarefa e não se transferem para outras tarefas
Por isso não gosto de focar em PIB. Acho que pesquisas trimestrais de satisfação com a vida e otimismo seriam métricas melhores
Se você está curioso sobre o PIB: se meu carro quebra e eu o levo para consertar, o PIB aumenta. Se os pais ficam em casa criando os filhos, o PIB diminui. Se eu limpo minha própria casa, o PIB também diminui
A taxa de desemprego também é um indicador grosseiro. Ela não diz se aqueles empregos são os que as pessoas querem, ou se elas sentem que precisam aceitar trabalhos ruins à força
- Não é que eu discorde muito de que o PIB seja uma métrica grosseira; estou tentando organizar minhas ideias
  Não acho que a satisfação com a vida e o otimismo dos indivíduos devam ser determinados pela economia do Estado-nação, muito menos a ponto de o governo tomá-los como alvo de otimização. O papel do governo é criar condições de segurança, prosperidade e oportunidade sem oprimir o resto do mundo nem destruir o planeta
  Dentro disso, cabe a mim encontrar uma vida satisfatória, e esse tipo de vida é possível dentro de estruturas econômicas e sociais muito diferentes. Da mesma forma, provavelmente não existem condições que deem satisfação universal a todos os cidadãos; então que estatística resumida de satisfação com a vida e otimismo deveríamos otimizar?
- O ponto central é que não importa o que se mede
- Em machine learning, lidamos com vetores de milhares de quantidades, mas é irônico que, ao medir a sociedade e a economia, usemos apenas um número, ou alguns poucos
  O discurso comum — notícias, políticos, fóruns etc. — é sempre muito simplificado em torno de algumas métricas. Um debate com milhares de métricas é complexo demais para ser comunicado facilmente
  Espero que um dia a maioria das pessoas reconheça implicitamente que, quanto menor o número de métricas, maior a chance de ser uma simplificação que esconde algo. Por exemplo: “X é bilionário, então é inteligente”, “o país X tem PIB alto, então é melhor que o país Y, que tem PIB baixo”
- Concordo, e isso também se aplica ao capitalismo como um todo
  Um esboço geral de uma proposta para substituir o capitalismo, diferente das alternativas de planejamento central fracassadas do passado, está aqui:
  https://jacobin.com/2019/03/sam-gindin-socialist-planning-mo...
  Na parte relevante, a pedra angular do socialismo são o planejamento e o controle dos trabalhadores, mas planos ambiciosos demais fracassaram ao estilo soviético, e locais de trabalho autônomos demais fracassaram ao estilo iugoslavo. O planejamento abrangente não é eficaz nem desejável, e a descentralização em coletivos de trabalho é economicamente fragmentada demais para identificar interesses sociais e politicamente fragmentada demais para influenciar o planejamento. Portanto, a questão central é como mudar o Estado, o planejamento, os locais de trabalho e suas relações para resolver esse dilema
  A unidade operacional tanto do capitalismo quanto do socialismo é o local de trabalho. No capitalismo, ele se torna parte de uma unidade de capital concorrente; no socialismo, como unidades privadas voltadas à autoexpansão são excluídas, os coletivos de trabalho entram em “setores” formados pragmaticamente de acordo com tecnologia comum, produtos, serviços, histórico anterior etc. Esses setores se tornam as unidades centrais do planejamento econômico e, tradicionalmente, ficavam dentro de ministérios nacionais como mineração, máquinas, saúde, educação e transporte
  A inovação radical aqui é transferir a autoridade e a capacidade de planejamento dos ministérios para a sociedade civil, fora do Estado. Os antigos ministérios são constitucionalmente autorizados, mas ficam fora do Estado, e são reorganizados como conselhos setoriais, administrados por representantes eleitos dos locais de trabalho de cada setor. A comissão central de planejamento ainda aloca recursos para cada setor de acordo com prioridades nacionais, mas, quando o poder dos locais de trabalho se concentra no nível setorial, isso muda o equilíbrio de poder entre o Estado e os trabalhadores e permite lidar com o problema do mercado de uma forma mais compatível com o socialismo
  O ponto central é o equilíbrio entre incentivos que ampliam a desigualdade e um viés igualitário de investimento. O excedente obtido por cada coletivo de trabalho pode ser usado para aumentar o consumo coletivo ou individual, mas não para reinvestimento. As prioridades nacionais são definidas no nível do planejamento central por meio de processos e pressões democráticas e traduzidas em alocações de investimento por setor. Os conselhos setoriais distribuem os recursos de investimento entre os coletivos de trabalho sob sua responsabilidade, mas, diferentemente de decisões de mercado, o critério principal não é favorecer ainda mais os locais de trabalho mais produtivos e reproduzir disparidades permanentes, e sim elevar a produtividade dos grupos mais fracos para perto da dos grupos superiores
  Ao contrário do argumento de Hayek, o que impede o compartilhamento sistemático de informações é justamente o capitalismo. A consequência da propriedade privada e da maximização do lucro é que a informação, por ser um ativo competitivo, deve ser escondida. Já no socialismo, o compartilhamento ativo de informações é uma condição essencial de funcionamento, e isso é institucionalizado como responsabilidade dos conselhos setoriais
Eu estava tentando lembrar onde tinha ouvido o nome desse autor
Foi a pessoa que inventou o primeiro modelo de difusão generativa em 2015
https://arxiv.org/abs/1503.03585
- Para mim, ele ficou na memória por um artigo engenhoso de 2019 escrito com Stephan Hoyer e Sam Greydanus
  O trabalho faz otimização estrutural usando uma rede neural restringida como repositório, modificador e ajustador do modelo físico que descreve a estrutura a ser otimizada: https://arxiv.org/abs/1909.04240
  É uma abordagem muito interessante, e o artigo também é muito bem escrito
Isso me faz pensar em ir a restaurantes de rede
Tudo foi otimizado por meio de grupos focais e parece uma métrica proxy superajustada para uma refeição agradável. Sinto como se estivesse dentro de uma máquina descarada, otimizada para extrair lucro da minha visita, e o fato de ser um restaurante parece quase secundário
É aquele tipo de cena em que alguém diz: “Olá! Meu nome é Tracy! Vou ser a atendente de vocês esta noite!”, enquanto escreve o próprio nome de cabeça para baixo, perfeitamente, com giz de cera na toalha de papel. Acho que esse lugar precisa recalibrar um pouco a personalidade dos funcionários
Acho que isso também se aplica quando gestores tentam otimizar demais processos de trabalho
No fim, pessoas criativas perdem o interesse e o trabalho se torna insuportável. Acho que o trabalho e a vida precisam de um pouco de caos
- Costumo matar minha própria vontade de tocar muitos projetos paralelos ao tentar otimizar demais justamente as partes que eu não quero fazer
  O jeito é simplesmente encarar as partes desagradáveis e seguir em frente. Pelo menos, porém, não há alguém me pagando para me jogar nesse redemoinho
Vi um exemplo dessa lei numa grande loja de materiais de construção do bairro
Cerca de 10 anos atrás, a loja instalou gaiolas trancadas antifurto. No começo, só colocavam itens caros ali e, embora fosse um pouco inconveniente, não era tão ruim. Se alguém vai comprar uma ferramenta elétrica de alto nível de mais de US$ 200, em geral aceita esperar uns 5 minutos
Mas alguns anos depois houve uma mudança que quase certamente parece orientada por dados. De repente, desapareceu qualquer lógica identificável sobre quais produtos ficavam trancados e quais ficavam livres. Agora, uma ferramenta de diagnóstico de US$ 500 pode estar simplesmente na prateleira, enquanto uma lâmpada de US$ 5 pode estar atrás de um cadeado
Provavelmente foi o resultado de ordenar uma base de dados pelo maior prejuízo acumulado com furtos. Ou seja, trancaram os produtos que faziam a loja perder mais dinheiro
Como resultado, a atmosfera da loja passa a mensagem de “um lugar tão obcecado por lucro que não confia no cliente nem para não roubar uma caixa de palitos”, e muitas vezes, para o cliente, nem vale a pena esperar um funcionário abrir a gaiola
Mesmo que tenham evitado o furto de alguns sabonetes de US$ 3, é duvidoso que essa otimização tenha ajudado no lucro líquido
- É muito mais fácil comprar na Amazon do que procurar alguém para abrir uma vitrine de vidro na farmácia
  Farmácias que colocam até itens básicos em vitrines de vidro geralmente também têm falta de funcionários
- Dizer “trancam os produtos que causam o maior prejuízo acumulado por furto à loja de materiais de construção” e “é duvidoso que essa otimização tenha ajudado no lucro líquido” parece uma contradição direta
  A menos que você realmente ache que, por causa disso, as pessoas deixaram de ir àquela loja e que essa perda superou a redução dos furtos. Além disso, mesmo que as pessoas deixem de ir, as grandes lojas locais concorrentes provavelmente estão fazendo a mesma coisa. Também é bom lembrar que as margens no varejo normalmente não são grandes. Se um produto é furtado, quantos outros é preciso vender para compensar a perda? Mesmo que alguns clientes migrem para a Amazon, evitar furtos ainda pode compensar
  Na prática, é bem mais provável que isso tenha tido o maior impacto na redução de furtos. O fato de você não enxergar uma “lógica identificável” pode ser por não ter experiência com esse tipo de coisa. Furtos muitas vezes dependem mais da facilidade de revenda do que do preço do produto. Uma ferramenta elétrica cara e de nicho pode demorar para ser revendida, enquanto detergente e lâminas de barbear podem ser escoados em grande volume no mesmo dia. As pessoas usam detergente e lâminas de barbear com muito mais frequência do que lâmpadas
  Entendo não gostar do inconveniente. Mas acho que a culpa deveria recair sobre os ladrões, ou sobre os fatores que levam ao furto, não sobre a loja