25 pontos por GN⁺ 2025-06-21 | 2 comentários | Compartilhar no WhatsApp
  • Corretor gramatical open source. Um produto que pode ser usado no lugar do famoso serviço comercial Grammarly
  • Qualquer pessoa pode usar gratuitamente, e o código e os algoritmos são publicados de forma transparente
  • Oferece recursos para detectar e corrigir automaticamente problemas de gramática, estilo e ortografia em textos em inglês
  • É adequado para diferentes perfis de usuários, como desenvolvedores, escritores e estudantes, com possibilidade de personalização livre
  • Como permite hospedagem própria do servidor e execução local, oferece vantagens em privacidade e proteção de dados

Introdução ao Harper

  • Harper é um corretor gramatical e de estilo open source que oferece funcionalidades semelhantes ao Grammarly
  • É totalmente gratuito e qualquer pessoa pode consultar e utilizar o código-fonte livremente
  • Implementa recursos de revisão de texto em inglês, como verificação ortográfica, detecção de erros gramaticais e recomendações de melhoria de estilo
  • Os usuários podem instalar o Harper em um servidor local ou em sua própria infraestrutura para reforçar a privacidade dos dados
  • Tem excelente escalabilidade e personalização, facilitando a modificação de algoritmos e a adição de recursos conforme cada necessidade

Principais recursos e vantagens

  • Por ser um projeto open source, permite gerenciar e aprimorar ideias internamente sem dependência do serviço
  • Embora seja otimizado para o inglês, também traz potencial para expansão futura com suporte multilíngue
  • Conta com suporte ativo da comunidade, com feedback e melhorias de funcionalidade acontecendo continuamente
  • Oferece alta flexibilidade tanto em modelo baseado em servidor quanto em instalação direta

Público-alvo e exemplos de uso

  • É indicado para usuários como engenheiros de software, redatores de documentação técnica e estudantes interessados em melhorar a qualidade da escrita em inglês
  • É vantajoso para organizações que desejam estruturar um processo próprio de revisão de documentos sem expor informações pessoais a serviços externos
  • É eficaz em ambientes que exigem personalização avançada, como regras sob medida e integração com fluxos de trabalho

2 comentários

 
GN⁺ 2025-06-21
Comentários do Hacker News
  • Para a maioria dos documentos, o fato de o Harper conseguir oferecer sugestões em menos de 10ms desperta a curiosidade: unidades como 10l ou 10kg são aceitas com naturalidade, então por que 10ms causa estranheza?

  • A ideia de regras gramaticais estarem hardcoded em um programa open source e poderem ser ajustadas pelo próprio usuário é algo muito mais preferível do que ajuste de prompt ou regras implicitamente hardcoded nos dados de treino de um LLM A configuração de LSP para Neovim parece bem interessante documentação de integração com Neovim Ferramentas assim é que parecem ser o futuro Sugestão de que a Automattic deveria destacar isso na página inicial

    • Há a opinião de que essa abordagem pode deixar passar o aspecto da evolução natural da linguagem
  • Pessoalmente, o fato de não usar LLM é visto como uma grande vantagem O Grammarly ficou cada vez mais instável depois que adicionou recursos de IA, e perdeu consistência, como quando uma hora manda remover uma vírgula e logo depois diz para colocá-la de volta

    • Modelos gerais baseados em LLM realmente costumam se confundir com pontuação, e isso foi percebido na prática como uma desvantagem bem clara; surpreende que um serviço como o Grammarly deixe esse problema acontecer

    • No último ano, os resultados preditivos do Grammarly e do gboard ficaram muito ruins

    • Curiosidade sobre a existência de ferramentas parecidas desenvolvidas com base em LLM LLM nem sempre é melhor, mas seria interessante comparar as diferenças entre as duas abordagens

    • Resposta em tom de piada dizendo que sugestões sobre pontuação mudando a todo momento parecem professores de inglês

  • O LanguageTool (concorrente do Grammarly) também é open source e pode ser executado localmente GitHub, imagem Docker Eu geralmente executo o LanguageTool localmente em um contêiner Docker Não usei o Harper a fundo, mas já conhecia sua existência há algum tempo; é bom ver que há várias opções Também há o desejo de que o site do Harper deixasse mais claro que uma das ferramentas concorrentes também pode rodar localmente

  • Situação em que nenhum erro é detectado em “Me and Jennifer went to have seen the ducks cousin.” Aponta-se que seria necessário complementar muito mais as regras desse tipo para chegar ao nível do Grammarly

    • No começo pareceu impressionante, mas depois de vários testes a conclusão foi que o desempenho é inconsistente, porque ele deixa passar até erros bem básicos

    • De forma semelhante, “My name John. What your name? What day today?” também não é identificado como erro gramatical

    • Há quem questione o que exatamente essas frases de teste significam

  • Opinião de que seria realmente útil existir um site com demo ou testes antes de baixar ou instalar uma extensão A extensão para Firefox leva para esta página, mas há o problema de que, ao colar textos longos, o destaque não funciona direito

  • Curiosidade sobre por que não usar LLM em ferramentas de aprendizado de idiomas Há quem ache que questões de idioma podem ser deixadas 100% para LLMs Pergunta se alguém já viu o ChatGPT cometer erros em inglês

    • O Grammarly, ao reforçar seus recursos de IA, chegou a sugerir frases estranhas como separar “wasn't” em algo como “was trulyn't” imagem relacionada

    • Os erros de LLM são vistos com frequência suficiente e, às vezes, aparecem sugestões bastante absurdas Claro que na maior parte do tempo funciona muito bem, mas está longe de ser algo realmente “confiável”, e há até uma tendência de seguir os próprios erros do usuário

    • Aponta-se que esse tipo de ferramenta de aprendizado de idiomas é frequentemente usado, em essência, para evitar “aprender de fato” o idioma

  • Curiosidade sobre quem seria o mercado-alvo do Grammarly Há dúvida se o público seriam profissionais que usam inglês como segunda língua

    • Suposição de que pessoas que nem sabem da existência de LLMs também sejam um alvo importante
  • Apresentação de que ele oferece um excelente servidor LSP capaz até de fazer verificação gramatical em comentários de código documentação do LSP

  • Como é um produto feito pela Automattic, há hesitação em usar por receio de que, se fizer sucesso, o Matt estrague tudo em busca de lucro

    • Contra-argumento de que, por ser open source (FOSS), mesmo no pior cenário a comunidade poderia fazer um fork da última boa versão e continuar o desenvolvimento

    • Posição firme de que esse fato (ser um produto da Automattic) já é motivo suficiente para não usar

 
secwind 2025-06-23

Aaah, era 10L, não 10l!