- O texto é a tecnologia de comunicação mais poderosa da história da humanidade, com expressividade e eficiência que superam todas as outras mídias
- É o meio mais adequado para transmitir com precisão conceitos abstratos e pensamentos complexos do que imagens, vídeos ou áudio
- É uma tecnologia com durabilidade e estabilidade comprovadas, a ponto de ainda podermos ler registros de milhares de anos atrás
- Em termos de custo de armazenamento e transmissão, é esmagadoramente eficiente e repetidamente serviu como ponto de partida para o avanço das tecnologias de comunicação
- Nenhuma outra mídia consegue acompanhar seu alcance e profundidade de uso social em busca, tradução, resumo, colaboração e mais
Posição básica sobre o texto
- Sempre repeti a mesma posição sempre que recebi perguntas sobre vídeo, 3D, jogos e sistemas multimídia dinâmicos
- Não nego o valor de imagens, fotografias, filmes e música, mas considero que a superioridade do texto é absoluta
- Defino o texto como a tecnologia de comunicação mais poderosa, útil e eficaz
A tecnologia mais antiga e estável
- A fala e a língua de sinais existem naturalmente na sociedade humana, mas o texto é uma tecnologia adquirida por aprendizado e transmissão
- Tem uma durabilidade que resiste ao tempo a ponto de podermos ler hoje registros de cerca de 5 mil anos atrás
- Também pode ser gravado em meios físicos como pedra, com a possibilidade de durar mais do que a própria humanidade
O meio de expressão mais flexível
- Imagens são poderosas em certas situações, mas é impossível expressar visualmente frases abstratas arbitrárias
- Frases conceituais, como uma definição de direitos humanos, não podem ser substituídas por desenhos
- O texto permite transmitir ideias controlando o nível de precisão e ambiguidade
- Não é coincidência que literatura, filosofia, história, matemática, lógica, programação e engenharia sejam baseadas em texto
A forma de comunicação mais eficiente
- O texto tem uma eficiência de outra ordem de grandeza em espaço de armazenamento e custo de transmissão
- Alguns milhares de bytes de texto podem ser menores até do que uma simples imagem de ícone
- Do telégrafo óptico, telégrafo elétrico e teletipo às primeiras redes de computadores, o texto sempre apareceu primeiro
- Voz, imagem e vídeo só surgiram depois que a largura de banda se tornou suficientemente barata
- Tem densidade suficiente para colocar a Wikipédia inteira em um smartphone
A tecnologia socialmente mais útil
- Funciona com eficiência em comunicação 1:1, 1:N e M:N
- Permite busca e indexação, inclusive manuais
- É otimizado para processamento algorítmico como tradução, comparação, diff, agrupamento, revisão, resumo e filtragem
- Pode ser usado de forma assíncrona, com liberdade para controlar a velocidade
- Dá suporte a edição colaborativa, citações, anotações, discussões ramificadas, resumos, revisões e obras derivadas
- Não existe tecnologia capaz de substituir a complexidade social e cognitiva de bibliotecas e publicações na internet
Conclusão
- Por isso, a posição sobre o texto é clara: deve-se sempre escolher texto primeiro (always pick text first)
- Para tomar emprestadas as palavras de um antigo chefe, deve-se sempre apostar em texto (always bet on text)
- Se algo pode ser feito com texto, deve ser feito dessa forma. O texto quase nunca decepciona
3 comentários
É verdade que o texto é uma ferramenta de expressão realmente boa, e também muito importante, mas......
Não dá para armazenar tudo em texto.
No fim das contas, texto é uma expressão comprimida. Ele comprime e expressa, em um formato socialmente acordado, aquilo que podemos perceber com os cinco sentidos (visão, audição, tato, paladar e olfato).
Mas, se não houver informação sobre o objeto original que serve de base, por mais que os dados sejam armazenados em texto, esse texto perde o sentido mais tarde para quem não conhece esse objeto original.
Nós sabemos o que é uma fita cassete, mas se mostrarmos apenas a palavra “fita cassete” para crianças nascidas recentemente e perguntarmos o que é isso, quantas delas conseguiriam responder corretamente? Por mais que alguém descreva com cuidado a forma, a função e o modo de funcionamento de uma fita cassete, será que daqui a alguns milhares de anos seria possível recriá-la perfeitamente tendo apenas esse texto?
Nesses casos, algumas fotos da fita cassete, desenhos técnicos ou alguns minutos de vídeo mostrando seu uso podem ser mais úteis.
O texto certamente é estável, mas não tenho certeza se é intuitivo.
Comentários do Hacker News
Eu não entendo essa dicotomia da discussão
Não sei por que eu teria que escolher entre UTF-8 e uma gravação de alguém tocando piano
Parece alguém empolgado com o tema falando só em termos de uma oposição simplista no estilo “Ford vs. Chevy”
Todos nós gostamos de texto, então preferia que não tentassem me convencer disso
Eu concordo com a flexibilidade infinita e a durabilidade do texto, mas depois de ver o trabalho do Bret Victor passei a sentir os limites do texto
Ao aprender piano, havia um ciclo de feedback imediato, e esse tipo de aprendizado é difícil de implementar com texto
O ponto central do Victor é aplicar esse aprendizado orientado por feedback à engenharia e à educação em geral
O texto ainda é importante, mas acho que há muito potencial em formas que usem outras intuições sensoriais
As demonstrações do Bret Victor são inspiradoras, mas a implementação real exige um esforço enorme
A ideia em si é excelente, mas é preciso entender que realizá-la exige grande investimento e dedicação
É difícil explicar dados ou resultados em texto, mas um gráfico transmite muita informação de imediato
O texto é bom por ser assíncrono, mas os humanos têm preferência instintiva por falar ou por expressões visuais
No fim, uma abordagem híbrida parece mais natural do que um único modo de comunicação
A criança simplesmente observa e aprende, entendendo pela intuição física
Conhecimentos aprendidos com o corpo, como andar de bicicleta, quase não são transmitidos por texto
O texto é simbólico, e a imagem é sensorial
É impossível expressar perfeitamente em texto uma pintura de Norman Rockwell
Sistemas simbólicos baseados em texto, como partituras ou diagramas de Feynman, continuam muito poderosos
Eu resumi o post do OP em 30 segundos, mas o vídeo do Bret Victor tem 54 minutos e a maioria não vai assistir
O texto continua sendo o meio ideal em termos de eficiência e transformabilidade
Acho melhor usar outras mídias como recursos complementares
Eu me chamo de maximalista do texto
Texto é o ponto natural de contato entre humanos e máquinas, e o equilíbrio entre eficiência e transparência
Tudo pode ser armazenado como string e representado com base64, JSON, HTML, CSS, SQL etc.
No fim das contas, a bala de prata (silver bullet) que a indústria perseguia era a string
Formatos binários complexos perdem legibilidade, e depois de compressão GZIP quase não sobra vantagem
Protocolos baseados em texto ficam instáveis por causa do problema da lei de Postel
Uma diferença de 30% em largura de banda não é nada pequena, e é por isso que o HTTP3 migrou para binário
Mesmo comprimindo base64, a legibilidade já foi perdida
Referências relacionadas: Robustness principle, problema com regex, ReDoS
De qualquer forma, JSON compactado com gzip não pode ser lido diretamente por humanos, então passar por ferramentas não é um grande problema
Para arquivos de configuração manipulados por humanos, text proto ou JSON são mais adequados
grep, git e conversão ficaram todos fáceis
Artigos antigos eu escrevi em Lotus Word Pro, então hoje não consigo lê-los, mas se fosse texto não haveria problema
Em sistemas de grande escala circulam muitos arquivos de texto, mas quase sem transparência
Em ambientes grandes, economizar alguns bits pode significar grande redução de custos, então campos autoidentificados são excluídos
No fim, texto é apenas uma representação de bytes
Mas a insistência no texto vem do caráter fechado dos formatos binários e da falta de ferramentas
Mesmo que um CSV tenha milhões de colunas em base64, sem ferramentas apropriadas isso não é melhor que binário
Graças à padronização, podemos compartilhar significado, e modelos como LLM conseguem aprender isso
Como na frase “tente representar uma sentença aleatória da Wikipédia como imagem”, nem tudo pode ser substituído por texto
Por outro lado, também é impossível descrever perfeitamente em texto um clipe de filme
Texto não é um superconjunto de todas as mídias, é apenas outro tipo de representação
Exemplos: Flight management system, NOTAM
Sobre a afirmação de que “texto é a tecnologia de comunicação mais antiga e estável”
Na verdade, a própria linguagem é uma tecnologia mais antiga
Tradições orais transmitiram conhecimento ao longo de gerações, e a linguagem humana é a mais complexa entre elas
Por exemplo, os aborígenes australianos Gunditjmara transmitem em narrativas uma erupção vulcânica de 30 mil anos atrás (Budj Bim)
O texto é singular no sentido de conseguir transmitir informação entre gerações sem distorcê-la
No fim, a conclusão é: “aposte na linguagem”
O motivo de os LLMs serem impressionantes é que a humanidade vem registrando todo o conhecimento em texto há milhares de anos
Modelos de imagem também avançaram graças ao espaço compartilhado de embeddings entre texto e imagem
É conveniente, mas difícil chamar de um modelo realmente “eficaz”
Como linguista, acredito que, ao registrar línguas ameaçadas, texto (Unicode) é o formato mais sustentável
Gramáticas de grego ou sânscrito de milhares de anos atrás ainda podem ser lidas
Nossa equipe publicou em PDF, mas internamente preservou tudo em XML
Espero que ainda possa ser lido daqui a 2000 anos
Havia muita confusão de codificações, como UTF-16, SJIS e EUC, enquanto PDF e JPEG continuavam abrindo perfeitamente
Se o espaço de armazenamento permitir, sinto que arquivar em formato de imagem é mais seguro
Além disso, ainda existem caracteres que nem mesmo Unicode representa
Pinturas rupestres transmitem intenção melhor do que texto
Se você olhar a série Future Text Publishing,
“texto” é, em essência, uma imagem 2D
Computadores não entendem texto; apenas processam números
Foram os humanos que atribuíram significado a esses números e criaram sistemas de símbolos e linguagem
DNA/RNA pode ser visto como um exemplo de sistema universal de escrita fisicamente constituído
Este artigo já apareceu várias vezes no HN
Em 2014, 2015 e 2021 também recebeu centenas de comentários
versão de 2014, versão de 2015, versão de 2021