The Website Specification

(specification.website)

16 pontos por GN⁺ 2026-06-01 | 1 comentários | Compartilhar no WhatsApp

Uma especificação independente de plataforma que organiza os recursos técnicos que um bom site deve ter, cobrindo de <title> até llms.txt
Voltada tanto para pessoas quanto para agentes, com referência a padrões modernos da web como WHATWG, W3C, IETF RFCs, WCAG e MDN
Independentemente da forma de implantação — WordPress, Next.js, apps em Django, HTML puro etc. — a especificação em si é a mesma, e também inclui dicas de implementação
O conteúdo é dividido em 10 áreas como Foundations, SEO, Accessibility, Security e Performance, mapeadas para padrões amplamente aceitos
Oferece um servidor MCP público, Agent Skill, /llms.txt e respostas em Markdown para uso por agentes e operadores em fluxos de auditoria, aprendizado e melhoria

Uma especificação independente de plataforma para bons sites

The Website Specification é uma especificação independente de plataforma que organiza os recursos técnicos que um bom site deve ter, cobrindo de <title> até /.well-known/security.txt, conformidade com WCAG e llms.txt
Voltada tanto para pessoas quanto para agentes, e cada tópico se conecta a fontes de padrões modernos da web como WHATWG, W3C, IETF RFCs, WCAG e MDN
Seja com WordPress, Drupal, TYPO3, Next.js, Astro, Hugo, apps em Django ou HTML puro, a especificação em si é a mesma em qualquer forma de implantação, e as dicas de implementação vêm depois
Todas as páginas têm um link Edit on GitHub, aceitam PRs e exibem suas fontes
Áreas abordadas
- Os tópicos completos são divididos em 10 áreas mapeadas para padrões amplamente aceitos
- Foundations: 14 itens cobrindo HTML, head e elementos básicos do documento
- SEO: 13 itens incluindo robots.txt, sitemap, canonical, dados estruturados e outros elementos de visibilidade em buscas
- Accessibility: 20 itens com regras baseadas em WCAG para que usuários com todas as capacidades possam usar o site
- Security: 12 itens cobrindo cabeçalhos, transporte e políticas para proteger visitantes com segurança
- Well-Known URIs: 9 itens organizando caminhos padronizados definidos em /.well-known/
- Agent Readiness: 18 itens cobrindo elementos que permitem que agentes de IA e crawlers leiam o site
- Performance: 19 itens abrangendo Core Web Vitals, cache, imagens, fontes e comportamento de rede
- Privacy: 6 itens sobre consentimento, sinais e respeito às escolhas do visitante
- Resilience: 5 itens sobre falhas elegantes, como páginas de erro, modo offline e redirecionamentos
- Internationalisation: 12 itens cobrindo idioma, localidade, direção e conteúdo traduzido

Como usar para agentes e operadores de sites

A especificação completa é oferecida por meio de um servidor público MCP de somente leitura e sem autenticação
Há um Agent Skill publicado, informando quando e como agentes compatíveis devem usar a especificação
Cada URL da especificação fornece Markdown por página via /llms.txt e Accept: text/markdown
Um exemplo de configuração do servidor MCP é o seguinte

{  
  "mcpServers": {  
    "specification-website": {  
      "transport": "http",  
      "url": "https://mcp.specification.website/mcp";  
    }  
  }  
}

Fluxo de uso
- Audit: percorra o checklist e verifique cada item com “o site faz isso — sim/não”
- Learn: em cada item, veja o que é, por que é importante e como implementar
- Improve: se encontrar algo faltando, informações desatualizadas ou tópicos ausentes, é possível abrir um PR com as fontes

1 comentários

GN⁺ 2026-06-01

Comentários do Hacker News

Agent Readiness tem cara de algo que vai dar vergonha com o tempo, tipo "Web 4.0 Blockchain Integration"
Não porque agentes vão se tornar irrelevantes, mas porque, mesmo que fiquem importantes, se o site tiver que criar tratamento especial para agentes isso já contraria o propósito original
No fim, isso provavelmente vai ser usado por agentes maliciosos para mostrar uma coisa para os agentes e outra para as pessoas, e por isso acho que vai acabar sendo deliberadamente ignorado
- Queria voltar para os anos 2000. Naquela época, o padrão era simplesmente HTML puro com um pouco de CSS, e só com a stylesheet padrão do navegador já saía um layout quase responsivo, texto legível e uma GUI amigável
  Hoje em dia, tudo em um site é componente. Até um dropdown simples com uma lista finita tem seu próprio loader e dispara 10 requisições fetch sem motivo. Não é exagero; é só olhar a web do Instagram e do Facebook
  Esqueçam todas essas especificações e me deem o HTML original, sem ofuscação por coisas como React, que insistem que um novo framework JS vai mudar tudo
- No começo eu ia discordar, mas pensando melhor concordo com a conclusão. Só que por um motivo um pouco diferente
  A web é, por natureza, um ambiente hostil, e considero que uma boa parte de quem opera sites é ela mesma um agente malicioso. Diferenciar o que pessoas e agentes veem é algo que os sites vão usar de propósito, como já faziam com mecanismos de busca
  O motivo de "Agent Readiness" não durar muito é que os operadores de sites logo vão perceber que agentes são, na prática, automação de acesso. E isso é justamente contra o que eles vêm lutando, porque ameaça a capacidade de monetização deles
- Vendo como os sites ficaram inchados e cheios de anúncios, seria bom existir também uma versão em texto puro para humanos. Eu preferiria deixar os agentes lidarem com a complexidade feita para pessoas
  Ainda assim, duvido que isso aconteça na prática. O problema dos agentes maliciosos já era possível há muito tempo. Por exemplo, entregar para crawlers de mecanismos de busca um conteúdo diferente daquele que o usuário vê depois de clicar. Se não me falha a memória, houve uma época em que o Google penalizava sites assim
- A ideia geral do site é boa, mas se você não gosta da bobagem de AI/blockchain, esse tipo de checklist é bem comum. Há anos, o meu favorito é este aqui
  https://frontendchecklist.io/rules
- Agent readiness parece uma etapa totalmente útil. No meu site, pessoas não usam blockchain, mas usam AI, e AI não precisa usar um site como uma pessoa
  Pessoas querem um site bonito, e dá para fazer isso até com HTML puro. Agentes não precisam nem disso; idealmente, bastaria ver o conteúdo da página só em Markdown
  Por que não ter uma versão para agentes? Isso economiza tempo e dinheiro tanto para o agente cliente quanto para o host do site
  Seria bom poder indicar, com um padrão como llms.txt, que "agentes devem visitar este espelho, que é uma versão Markdown bruta do que os humanos veem"
  Parte da agent readiness deste site equivale a SEO para AI. E, no caso de sites que não querem crawling por AI, isso também serve no sentido oposto
Seria bom ter boas práticas para áreas como formulários de login. Por exemplo: usar nomes padronizados de campos de entrada que gerenciadores de senha reconheçam, desativar autocomplete e capitalização automática nos campos de login, usar o input type correto do HTML5 se for e-mail, evitar formulários que fazem a pessoa digitar só o e-mail e clicar de novo para então poder inserir a senha, seguir o NIST SP 800-53 e evitar autenticação em dois fatores por SMS ou trocas periódicas arbitrárias de senha e regras de composição, entre outras coisas
Há sites demais que nem sequer dão foco automático quando o formulário tem apenas um campo
- Foi bem interessante ler sobre boas práticas de formulários no blog do Adam Silver
  https://adamsilver.io/blog/form-design-from-zero-to-hero-all...
  Depois disso ele publicou muitos textos novos, e talvez seja um dos melhores materiais de UX na web
- Fazer a pessoa enviar primeiro só o e-mail de login é, na prática, necessário em qualquer sistema de autenticação minimamente sofisticado
  Até receber o identificador do usuário, não dá para saber se aquele usuário usa senha ou outro método
- Uso o frontendchecklist há anos, e ele tem esse tipo de coletânea de regras e boas práticas. Uma pena que, recentemente, o site pareça ter mudado para adotar ai-readiness, mas as regras ainda estão lá
  https://frontendchecklist.io/rules/html/input-types
  Quando começo a criar componentes de UI do zero, gosto muito deste site
  https://component.gallery/
  Ele liga você aos componentes de vários design systems, e muitos deles também incluem diretrizes profundas sobre acessibilidade, internacionalização e afins. Como exemplos de documentação especialmente boa, há o Lightning Design System da Salesforce e o Stacks do StackOverflow
  https://www.lightningdesignsystem.com/2e1ef8501/p/99642e-car...
  https://stackoverflow.design/system/forms/checkbox
- Não dar foco automático em um formulário com apenas um campo é um exemplo de como a stack web espera que cada site implemente por conta própria algo que era padrão em toolkits de UI nativos
  Aí a maioria dos sites não trata isso como prioridade, ou nem sabe que isso é algo a considerar, e acabamos no estado atual
- Parece que os formulários de login que pedem primeiro só o e-mail estão ficando mais comuns, especialmente em sites de grandes empresas de tecnologia. Pessoalmente também acho irritante
  Sempre imaginei que os sites tivessem algum motivo para migrar para esse padrão. Talvez funcione melhor para defesa contra bots, por exemplo. Fico curioso se alguém sabe mais sobre isso
À primeira vista, quase tudo parece gerado por IA, então o jeito como isso é apresentado pode não funcionar muito bem. Ainda assim, se você ler vários itens, tirando a seção de Agent o resto transmite uma higiene web sólida de forma bem clara, então acho que daria para mandar isso para um desenvolvedor web em início de carreira
Ainda assim, é irônico que o próprio site não aplique nem as práticas que ele mesmo diz serem "obrigatórias"
- "Compression (gzip, brotli, zstd): required" e "cache-control: required"; isso é resíduo de IA do começo ao fim
https://validator.w3.org/nu/?doc=https%3A%2F%2Fspecification...
Não entendo qual é o objetivo deste site. Ele se anuncia como uma especificação, mas não entendo exatamente o que ele estaria especificando
Todos os itens usam outras "fontes da verdade" como referência
- É uma coletânea de boas práticas, e tem valor como checklist para ver tudo em um só lugar
- Vi isso postado no LinkedIn[1], e o autor escreveu o seguinte
  "Eu estava cansado de apontar para seis fontes diferentes para sustentar uma única recomendação. HTML era WHATWG, acessibilidade era WCAG, cabeçalhos eram IETF, dados estruturados eram schema.org, e o resto era MDN, web.dev e Google Search Central
  Não existia uma especificação única, opinativa e neutra em relação à plataforma sobre o que um website moderno realmente deve fazer
  Então eu escrevi uma"
  [1] https://www.linkedin.com/posts/jdevalk_the-website-specifica...
Fico curioso sobre o quão comum é o que está aqui. /.well-known/change-password seria bom de ter, mas olhando https://news.ycombinator.com/.well-known/change-password e google.com/.well-known/change-password, parece que isso não está implementado
- Parece funcionar no Safari e no Chrome: https://web.dev/articles/change-password-url
  Nunca ouvi falar de isso ser usado na prática
  A URL do Google está em https://accounts.google.com/.well-known/change-password, e não no domínio principal
- security.txt, quando existe, fica sempre sob esta pasta. O Let's Encrypt também usa esse local para coisas relacionadas a certificado ou falha de renovação
Isso parece ter saído de uma fábrica de resíduo. "SEO", "Agent-readiness". É exatamente o tipo de coisa que um bom website não deveria fazer
Como não poderia deixar de ser, foi feito por um especialista em "SEO" de Wordpress que usa Claude LLM e também é investidor-anjo. Alguém que enriqueceu destruindo a internet que amávamos com resíduo publicitário agora quer destruir o que resta com resíduo de LLM
- Pelos travessões longos e pelos padrões de frase, por exemplo expressões como "não X, mas Y", além do conteúdo repetitivo, para mim isso praticamente denuncia que foi gerado por IA
  Classificar "stable URLs" como "agent readiness" parece um sinal de que o autor se importa mais com IA do que com pessoas. Vou colocar esse domínio na lista de bloqueio. Já dá para ver que isso vai piorar a busca por informações de desenvolvimento web
- Na página about (https://specification.website/about/) está escrito o seguinte
  "Não é um framework. Não é um guia. É uma especificação — o que é obrigatório, o que é recomendado e o que deve ser evitado."
  É difícil dizer quanto do site é resíduo de LLM, mas parte do texto certamente parece ser
- Parece puro resíduo de IA. Eu uso https://tropes.fyi/vetter
- A especificação completa em página única parece o grande pôster representativo do desenvolvimento web com resíduo de IA hoje em dia
  https://specification.website/llms-full.txt
- Para mim também acendeu o alerta de resíduo
  Primeiro, os pequenos rótulos coloridos como required, optional, recommended
  Segundo, a quantidade insana de conteúdo que ninguém vai ler
  Terceiro, o desenvolvimento que empurra uma ideia fraca com um nível de detalhe doloroso
Eu estava pensando em fazer algo assim por conta própria, mas colei isso em um chat de agente qualquer e funcionou muito bem
Acabei de usar um modelo local (Qwen3.6 27B / pi) para gerar uma lista dos padrões obrigatórios que faltavam em um site antigo feito em Hugo, depois criar uma lista de tarefas e ir resolvendo uma por uma, deixando cada mudança para eu revisar
Ele até fez um favicon que faltava, recortando um símbolo a partir do logo, e o resultado ficou bem bom
- Fico curioso para saber o quanto você mexeu no pi. Gosto da sensação de zero atrito com prompts curtos de agente/sistema, mas se você simplesmente largar uma tarefa aleatória para ele, parece que vão surgir bastante espera e becos sem saída
Abri o site no MacBook e o uso de CPU passou de 50%
Considerando que é uma especificação sobre como websites deveriam ser, isso é bem irônico
- Aqui não estou vendo o mesmo comportamento. Seria bom verificar o que está acontecendo do lado do usuário
Parte do conteúdo é bem boa, mas espero que padronizar isso como uma checklist de 128 itens não faça as pessoas terem medo de criar websites
Minha especificação favorita é a especificação alucinada. Acho que devo dizer parabéns
Já estou ansioso pela alternativa ISO conduzida por agentes ou pelo caça-níquel operado por LLM

The Website Specification

Uma especificação independente de plataforma para bons sites

Áreas abordadas

Como usar para agentes e operadores de sites

Fluxo de uso

Leituras relacionadas

1 comentários

Comentários do Hacker News