14 pontos por GN⁺ 2025-12-28 | 3 comentários | Compartilhar no WhatsApp
  • O texto é a tecnologia de comunicação mais poderosa da história da humanidade, com expressividade e eficiência que superam todas as outras mídias
  • É o meio mais adequado para transmitir com precisão conceitos abstratos e pensamentos complexos do que imagens, vídeos ou áudio
  • É uma tecnologia com durabilidade e estabilidade comprovadas, a ponto de ainda podermos ler registros de milhares de anos atrás
  • Em termos de custo de armazenamento e transmissão, é esmagadoramente eficiente e repetidamente serviu como ponto de partida para o avanço das tecnologias de comunicação
  • Nenhuma outra mídia consegue acompanhar seu alcance e profundidade de uso social em busca, tradução, resumo, colaboração e mais

Posição básica sobre o texto

  • Sempre repeti a mesma posição sempre que recebi perguntas sobre vídeo, 3D, jogos e sistemas multimídia dinâmicos
  • Não nego o valor de imagens, fotografias, filmes e música, mas considero que a superioridade do texto é absoluta
  • Defino o texto como a tecnologia de comunicação mais poderosa, útil e eficaz

A tecnologia mais antiga e estável

  • A fala e a língua de sinais existem naturalmente na sociedade humana, mas o texto é uma tecnologia adquirida por aprendizado e transmissão
  • Tem uma durabilidade que resiste ao tempo a ponto de podermos ler hoje registros de cerca de 5 mil anos atrás
  • Também pode ser gravado em meios físicos como pedra, com a possibilidade de durar mais do que a própria humanidade

O meio de expressão mais flexível

  • Imagens são poderosas em certas situações, mas é impossível expressar visualmente frases abstratas arbitrárias
  • Frases conceituais, como uma definição de direitos humanos, não podem ser substituídas por desenhos
  • O texto permite transmitir ideias controlando o nível de precisão e ambiguidade
  • Não é coincidência que literatura, filosofia, história, matemática, lógica, programação e engenharia sejam baseadas em texto

A forma de comunicação mais eficiente

  • O texto tem uma eficiência de outra ordem de grandeza em espaço de armazenamento e custo de transmissão
  • Alguns milhares de bytes de texto podem ser menores até do que uma simples imagem de ícone
  • Do telégrafo óptico, telégrafo elétrico e teletipo às primeiras redes de computadores, o texto sempre apareceu primeiro
  • Voz, imagem e vídeo só surgiram depois que a largura de banda se tornou suficientemente barata
  • Tem densidade suficiente para colocar a Wikipédia inteira em um smartphone

A tecnologia socialmente mais útil

  • Funciona com eficiência em comunicação 1:1, 1:N e M:N
  • Permite busca e indexação, inclusive manuais
  • É otimizado para processamento algorítmico como tradução, comparação, diff, agrupamento, revisão, resumo e filtragem
  • Pode ser usado de forma assíncrona, com liberdade para controlar a velocidade
  • Dá suporte a edição colaborativa, citações, anotações, discussões ramificadas, resumos, revisões e obras derivadas
  • Não existe tecnologia capaz de substituir a complexidade social e cognitiva de bibliotecas e publicações na internet

Conclusão

  • Por isso, a posição sobre o texto é clara: deve-se sempre escolher texto primeiro (always pick text first)
  • Para tomar emprestadas as palavras de um antigo chefe, deve-se sempre apostar em texto (always bet on text)
  • Se algo pode ser feito com texto, deve ser feito dessa forma. O texto quase nunca decepciona

3 comentários

 
cronex 2025-12-30

É verdade que o texto é uma ferramenta de expressão realmente boa, e também muito importante, mas......
Não dá para armazenar tudo em texto.
No fim das contas, texto é uma expressão comprimida. Ele comprime e expressa, em um formato socialmente acordado, aquilo que podemos perceber com os cinco sentidos (visão, audição, tato, paladar e olfato).
Mas, se não houver informação sobre o objeto original que serve de base, por mais que os dados sejam armazenados em texto, esse texto perde o sentido mais tarde para quem não conhece esse objeto original.
Nós sabemos o que é uma fita cassete, mas se mostrarmos apenas a palavra “fita cassete” para crianças nascidas recentemente e perguntarmos o que é isso, quantas delas conseguiriam responder corretamente? Por mais que alguém descreva com cuidado a forma, a função e o modo de funcionamento de uma fita cassete, será que daqui a alguns milhares de anos seria possível recriá-la perfeitamente tendo apenas esse texto?
Nesses casos, algumas fotos da fita cassete, desenhos técnicos ou alguns minutos de vídeo mostrando seu uso podem ser mais úteis.

 
roxie 2025-12-29

O texto certamente é estável, mas não tenho certeza se é intuitivo.

 
GN⁺ 2025-12-28
Comentários do Hacker News
  • Eu não entendo essa dicotomia da discussão
    Não sei por que eu teria que escolher entre UTF-8 e uma gravação de alguém tocando piano
    Parece alguém empolgado com o tema falando só em termos de uma oposição simplista no estilo “Ford vs. Chevy”
    Todos nós gostamos de texto, então preferia que não tentassem me convencer disso

  • Eu concordo com a flexibilidade infinita e a durabilidade do texto, mas depois de ver o trabalho do Bret Victor passei a sentir os limites do texto
    Ao aprender piano, havia um ciclo de feedback imediato, e esse tipo de aprendizado é difícil de implementar com texto
    O ponto central do Victor é aplicar esse aprendizado orientado por feedback à engenharia e à educação em geral
    O texto ainda é importante, mas acho que há muito potencial em formas que usem outras intuições sensoriais

    • No curto prazo, implementar um meio mais rico que texto tem um grau de dificuldade de engenharia muito maior
      As demonstrações do Bret Victor são inspiradoras, mas a implementação real exige um esforço enorme
      A ideia em si é excelente, mas é preciso entender que realizá-la exige grande investimento e dedicação
    • Se você trabalha em ciência, esse ponto fica mais claro
      É difícil explicar dados ou resultados em texto, mas um gráfico transmite muita informação de imediato
      O texto é bom por ser assíncrono, mas os humanos têm preferência instintiva por falar ou por expressões visuais
      No fim, uma abordagem híbrida parece mais natural do que um único modo de comunicação
    • Por exemplo, explicar em texto como desembaraçar um monte de fios é ineficiente
      A criança simplesmente observa e aprende, entendendo pela intuição física
      Conhecimentos aprendidos com o corpo, como andar de bicicleta, quase não são transmitidos por texto
    • Eu diria: “sempre aposte em representações simbólicas
      O texto é simbólico, e a imagem é sensorial
      É impossível expressar perfeitamente em texto uma pintura de Norman Rockwell
      Sistemas simbólicos baseados em texto, como partituras ou diagramas de Feynman, continuam muito poderosos
    • Esta própria discussão mostra a superioridade do texto
      Eu resumi o post do OP em 30 segundos, mas o vídeo do Bret Victor tem 54 minutos e a maioria não vai assistir
      O texto continua sendo o meio ideal em termos de eficiência e transformabilidade
      Acho melhor usar outras mídias como recursos complementares
  • Eu me chamo de maximalista do texto
    Texto é o ponto natural de contato entre humanos e máquinas, e o equilíbrio entre eficiência e transparência
    Tudo pode ser armazenado como string e representado com base64, JSON, HTML, CSS, SQL etc.
    No fim das contas, a bala de prata (silver bullet) que a indústria perseguia era a string
    Formatos binários complexos perdem legibilidade, e depois de compressão GZIP quase não sobra vantagem

    • Mas não dá para ter ao mesmo tempo “eficiência, flexibilidade e transparência”
      Protocolos baseados em texto ficam instáveis por causa do problema da lei de Postel
      Uma diferença de 30% em largura de banda não é nada pequena, e é por isso que o HTTP3 migrou para binário
      Mesmo comprimindo base64, a legibilidade já foi perdida
      Referências relacionadas: Robustness principle, problema com regex, ReDoS
    • Sobre a afirmação de que “o custo de CPU da desserialização é desprezível”, dá para argumentar o contrário: “o custo de usar ferramentas para humanos lerem isso” também é desprezível
      De qualquer forma, JSON compactado com gzip não pode ser lido diretamente por humanos, então passar por ferramentas não é um grande problema
    • Eu lido com protobuf todos os dias, e a estrutura binária desse formato existe para garantir compatibilidade
      Para arquivos de configuração manipulados por humanos, text proto ou JSON são mais adequados
    • Eu migrei o armazenamento de documentos de DOC e PDF para texto em Markdown
      grep, git e conversão ficaram todos fáceis
      Artigos antigos eu escrevi em Lotus Word Pro, então hoje não consigo lê-los, mas se fosse texto não haveria problema
    • A versão textual do protobuf não é base64 nem JSON
      Em sistemas de grande escala circulam muitos arquivos de texto, mas quase sem transparência
      Em ambientes grandes, economizar alguns bits pode significar grande redução de custos, então campos autoidentificados são excluídos
  • No fim, texto é apenas uma representação de bytes
    Mas a insistência no texto vem do caráter fechado dos formatos binários e da falta de ferramentas
    Mesmo que um CSV tenha milhões de colunas em base64, sem ferramentas apropriadas isso não é melhor que binário

    • Texto não é simplesmente bytes, e sim um sistema de símbolos legível por humanos
    • Texto impõe restrições sobre sequências de bytes aceitáveis e carrega uma estrutura comprimida da evolução da linguagem
      Graças à padronização, podemos compartilhar significado, e modelos como LLM conseguem aprender isso
    • É brincadeira, mas existe até uma civilização baseada em comunicação bináriacivilização Bynar
  • Como na frase “tente representar uma sentença aleatória da Wikipédia como imagem”, nem tudo pode ser substituído por texto
    Por outro lado, também é impossível descrever perfeitamente em texto um clipe de filme
    Texto não é um superconjunto de todas as mídias, é apenas outro tipo de representação

  • Sobre a afirmação de que “texto é a tecnologia de comunicação mais antiga e estável”
    Na verdade, a própria linguagem é uma tecnologia mais antiga
    Tradições orais transmitiram conhecimento ao longo de gerações, e a linguagem humana é a mais complexa entre elas
    Por exemplo, os aborígenes australianos Gunditjmara transmitem em narrativas uma erupção vulcânica de 30 mil anos atrás (Budj Bim)
    O texto é singular no sentido de conseguir transmitir informação entre gerações sem distorcê-la
    No fim, a conclusão é: “aposte na linguagem”

    • Se incluirmos até comunicação biológica, o código genético do RNA talvez seja o “texto” mais antigo
    • O caso Gunditjmara é fascinante, mas não passa de uma estimativa impossível de verificar
  • O motivo de os LLMs serem impressionantes é que a humanidade vem registrando todo o conhecimento em texto há milhares de anos
    Modelos de imagem também avançaram graças ao espaço compartilhado de embeddings entre texto e imagem

    • Mas quando um LLM encontra a resposta desejada após dezenas de interações, isso é mais exploratório do que eficiente
      É conveniente, mas difícil chamar de um modelo realmente “eficaz”
  • Como linguista, acredito que, ao registrar línguas ameaçadas, texto (Unicode) é o formato mais sustentável
    Gramáticas de grego ou sânscrito de milhares de anos atrás ainda podem ser lidas
    Nossa equipe publicou em PDF, mas internamente preservou tudo em XML
    Espero que ainda possa ser lido daqui a 2000 anos

    • Mas, pessoalmente, já tive a experiência de arquivos de texto salvos há 10 anos serem mais difíceis de abrir
      Havia muita confusão de codificações, como UTF-16, SJIS e EUC, enquanto PDF e JPEG continuavam abrindo perfeitamente
      Se o espaço de armazenamento permitir, sinto que arquivar em formato de imagem é mais seguro
      Além disso, ainda existem caracteres que nem mesmo Unicode representa
    • Como na notação musical, algumas formas de representação não podem ser divididas simplesmente em texto ou binário
      Pinturas rupestres transmitem intenção melhor do que texto
  • Se você olhar a série Future Text Publishing,
    “texto” é, em essência, uma imagem 2D
    Computadores não entendem texto; apenas processam números
    Foram os humanos que atribuíram significado a esses números e criaram sistemas de símbolos e linguagem
    DNA/RNA pode ser visto como um exemplo de sistema universal de escrita fisicamente constituído

  • Este artigo já apareceu várias vezes no HN
    Em 2014, 2015 e 2021 também recebeu centenas de comentários
    versão de 2014, versão de 2015, versão de 2021