- Um projeto web em que 9 modelos de IA geram, a cada minuto, novos designs de relógios analógicos
- Cada modelo cria o relógio em código HTML/CSS dentro do limite de 2.000 tokens
- Os relógios incluem numeração ou algarismos romanos, ponteiro de segundos com animação em CSS, design responsivo e fundo branco
- Os resultados gerados são exibidos em código puro, sem Markdown
- Um projeto experimental interativo que mostra ao mesmo tempo a criatividade visual da IA e sua capacidade de gerar código
Visão geral do projeto
- AI World Clocks é um site que mostra designs de relógios gerados a cada minuto por 9 modelos de IA diferentes
- Cada relógio mostra a mesma hora, mas o design e a estrutura do código variam conforme o modelo
- Os relógios são feitos apenas com HTML e CSS, sem uso de JavaScript
Regras de geração e prompt
- Cada modelo de IA gera o código do relógio dentro do limite de 2.000 tokens
- O prompt usado inclui os seguintes requisitos
- Exibir a hora atual no formato de relógio analógico
- Pode usar números ou algarismos romanos
- Incluir ponteiro de segundos com animação em CSS
- Manter design responsivo e fundo branco
- A saída deve retornar apenas código HTML/CSS, sem formato Markdown
Criador e inspiração
- O projeto foi criado por Brian Moore
- A ideia foi inspirada por Matthew Rayfield
- O criador também está ativo no Instagram
Características e significado
- É possível comparar visualmente a diversidade de design e as diferenças de estilo de código entre os modelos de IA
- Mais do que apenas gerar relógios, o projeto funciona como um experimento da capacidade criativa da IA na geração de código
- Novos resultados são exibidos a cada minuto, oferecendo mudança contínua e atualização em tempo real
Informações adicionais
- Não há explicações adicionais além do conteúdo descrito no texto original
1 comentários
Comentários do Hacker News
Agradece por ser um projeto que ele mesmo fez
Gosta de explorar o tema de relógios e os limites da tecnologia
Observou vários modelos, e o Kimi é o mais preciso, mas varia pouco e é meio entediante
Já o Qwen frequentemente produz resultados absurdos e engraçados, o que diverte. Não sabe qual dos dois é “melhor”
Dá até vontade de tentar fabricar alguns designs no mundo real. Muito legal você ter investido dinheiro para experimentar isso
Fiquei em dúvida se o site era real. A escala e a rotação dos números eram estranhas demais
Coloquei o prompt diretamente no ChatGPT e ele gerou mostradores bem decentes, mas a hora ficava errada por várias horas
Depois percebi que isso talvez pudesse ser por causa do fuso horário geográfico do ISP
Depois de observar por alguns minutos, o Kimi K2 parece ser o que gera com mais consistência mostradores bem acabados
Foi a primeira vez que ouvi falar desse modelo hoje, e fiquei impressionado. Já o Qwen 2.5 chega perto de ser quase um fracasso total
O K2 hospedado no Groq tem uma relação inteligência/por segundo impressionante (embora ainda haja limite de taxa)
Desde que os modelos de geração de imagem apareceram pela primeira vez, tentei fazer um relógio de 13 horas, mas nunca consegui
A maioria só troca o “12” por “13” ou destrói o mostrador. Se alguém conseguiu, adoraria que compartilhasse como
A parte externa é um relógio normal de 12 horas, e a interna usa notação estranha de algarismos romanos como “IIII” e “VIIII”
Alguns percebem que há algo estranho, mas no fim não conseguem entender corretamente
Mesmo pedindo correções, o resultado acabava sendo só um relógio de 12 horas com um “13” acrescentado
É o ápice da não determinismo. Uma vez apareceu um relógio perfeito, aí recarreguei e ele virou um relógio que parecia uma pintura do Dalí
Passei a semana inteira tentando fazer o Claude Code escrever código de renderização em GPU, mas nada funcionou direito
Dei prompts detalhados e até explicações sobre matrizes, mas o resultado continuou péssimo
Depois de falhar, ele adiciona logs e diz com confiança que “corrigiu perfeitamente”, mas continua errado
Mesmo quando peço para escrever testes, ele só verifica se o código errado continua consistentemente errado
No fim, entra em “modo estagiário”, altera o código aleatoriamente e insiste que “agora está perfeito”
É fofo, mas a utilidade prática ainda está longe
É natural que não consiga validar screenshots. VLLM não lida bem com detalhes visuais finos
Para quem confia cegamente em LLMs, este projeto é um bom exemplo de realidade
É tipo: “o teste falhou” → o LLM apaga o teste e diz “corrigido!”
Mas, em problemas cuja resposta certa não conhecemos, não há como medir a incerteza do LLM
No fim, só dá para detectar erros comparando com a realidade
“Então, crianças, commits feitos por IA sempre precisam de revisão”
O LLM não consegue ver diretamente o HTML renderizado
Estou fazendo um programa de visualização OpenGL com o Cursor, e é frustrante demais tentar explicar bugs visuais
É difícil fazer ele entender coisas como “esta linha não está conectada”, então no fim acabo pedindo prints de depuração com as coordenadas
Também dá para fazer ele enviar screenshots para a conversa via MCP. Só precisa implementar
Ideia realmente muito boa. Surpreendentemente, só o Kimi K2 funciona sem problemas
E isso sem nem ser a versão completa de “thinking”
Isso me fez reler o texto relacionado Kimi K2 Thinking
Fico curioso por que o Deepseek e o Kimi produzem resultados tão superiores aos de outros modelos
Será que são modelos que receberam treinamento especializado para esse tipo de tarefa?