Data room da Nico levanta suspeitas de apropriação de código da Papermark
(twitter.com/mfts0)- Vieram a público suspeitas de que o produto de data room da Nico não seria resultado de desenvolvimento próprio, mas teria sido extraído do código open source e de licença enterprise da Papermark
- A questão central é se houve violação de direitos autorais e de licença, e a pessoa que levantou o problema exige que o produto seja retirado do ar imediatamente
- O caso levou a críticas fortes, dizendo que isso não seria “mover-se rápido e quebrar coisas”, mas algo mais próximo de fraude
- Também há a observação de que a polêmica em torno do produto pode espalhar desconfiança para o restante dos negócios da Nico
- Garry Tan, Jared Friedman e Y Combinator foram marcados, ampliando o caso também para uma questão de reputação da comunidade YC
Suspeitas de apropriação de código da Papermark
- Foram levantadas publicamente suspeitas de que o produto de data room da Nico não teria sido desenvolvido internamente, mas pareceria ter sido retirado do código open source e de licença enterprise da Papermark
- A pessoa que levantou o problema considera difícil ver isso como simples desenvolvimento rápido de produto ou “vibe coding”, apontando a possibilidade de violação de direitos autorais e de licença
- A exigência é clara
- A posição é que o produto deve ser retirado do ar imediatamente
- Se a violação for confirmada, o ato pode ser visto como algo mais grave do que um simples erro
Ampliação das críticas
- As críticas não se limitam ao produto de data room da Nico, mas também levantam dúvidas sobre a confiabilidade do restante dos negócios da empresa
- Com Garry Tan, Jared Friedman e Y Combinator marcados, o caso passa de uma disputa entre indivíduos a algo ligado também à reputação da comunidade YC
- Com base apenas no que foi publicado até agora, o foco está nas suspeitas levantadas e nas exigências, sem que tenham sido fornecidas verificações adicionais ou refutações
1 comentários
Opiniões no Hacker News
Se você colocar uma captura de tela de uma página da web em uma ferramenta como o Figma Make, dá para criar uma cópia bastante parecida
As capturas dão exatamente essa impressão: é muito parecido, mas não totalmente igual. O fato de muito do texto ser igual provavelmente vem daí também. Nem sequer deixar a reescrita do texto para uma ferramenta de texto generativo é simplesmente desleixo
Vendo outros comentários no Twitter, parece que eles provavelmente pediram à IA para copiar o Papermark
Há indícios em um comentário da IA de que a página foi alinhada à “reference”
https://xcancel.com/ffumarola/status/2070479755892371713#m
A resposta deles foi esta:
Eu nem ficaria tão surpreso se o Nico realmente achar que “não copiamos o código” é uma defesa razoável. Parece uma regra clara, e tipos extremamente “shape rotator” costumam ter dificuldade com ambiguidades em áreas como o direito. Na prática, infração de copyright muitas vezes é como o critério para identificar pornografia: você sabe quando vê
Em algum lugar, ele também afirmou que essa empresa/setor era a aplicação mais importante de IA no mundo. Não tenho dúvida de que eles copiaram, e no mínimo não é alguém confiável
https://x.com/nico_laqua/status/2061130574358773852?s=20
Se tivessem feito isso com uma empresa mais inclinada a litigar, acho que haveria uma chance razoável de processo, e as chances de vitória seriam algo como 50/50. É difícil dizer se isso seria visto como cópia de elementos criativos/artísticos ou apenas como cópia do modo de funcionamento, mas embora copiar funcionalidades seja aceitável, copiar toda a experiência do usuário rapidamente vira infração de copyright
Quanto ao texto, para uma solução de data room de due diligence, acho que ele é bem próximo de um conteúdo padrão e previsível
Você poderia dar um pouco mais de contexto sobre esta thread? Não faço ideia de quem é Nico, o que é a Papermark e o que ela faz.
Separadamente, parece que as pessoas estão ficando mais acostumadas não só a recriar soluções ou projetos existentes com vibe coding, mas também a “roubar” código open source e usá-lo como bem entendem, sem respeitar as premissas morais, éticas e legais do open source. Tenho a impressão de que há mais violações de open source por toda parte do que antes, sem grandes consequências legais.
Além disso, muitos dos novos desenvolvedores que chegaram só por causa de IA não entendem, ou não se importam, que FOSS não significa grátis como cerveja, mas sim liberdade.
Eu trabalho em uma biblioteca GPL3 que faz parsing de arquivos de dados binários de samplers de áudio de hardware. Alguém criou um app que permite fazer várias coisas em cima da minha biblioteca e cumpriu a licença GPL3.
Mas recentemente alguém replicou esse app totalmente com vibe coding, colocou até um site e um link de compra de cerca de US$ 60. Era uma cópia escancarada, com cores diferentes, mas exatamente a mesma UI, e não cumpria nenhuma condição da GPL3. A moderação removeu o post da lista e bloqueou o desenvolvedor do app copiado, e a comunidade do fórum apoiou o desenvolvedor do app original. Também enviamos um pedido de remoção por DMCA e, alguns dias depois, o site da cópia saiu do ar.
O desenvolvedor do app original teve sorte porque há basicamente um único fórum principal onde se publicam posts relacionados àquele fabricante, e a moderação também não gosta de coisas relacionadas a IA. Ironicamente, o próprio desenvolvedor do app original também fez todo o trabalho dele com vibe coding. Sem aquele fórum e sua moderação, tanto o desenvolvedor do app original quanto eu, como mantenedor da biblioteca GPL3, francamente estaríamos ferrados.
A centralização tem suas vantagens. Sem isso, não vejo muita alternativa além de todo mundo voltar para código fechado ou de algum movimento popular que force uma discussão sobre respeitar o trabalho dos outros. Até agora, estávamos contando com um sistema de honra e reação da comunidade.
As empresas estão se acostumando a sair impunes de qualquer coisa. “Mova-se rápido e quebre coisas” originalmente era sobre tecnologia, mas agora virou uma atitude em relação à lei. A Uber popularizou essa tendência, e agora todo mundo faz a mesma coisa. A IA quebrar a lei de direitos autorais faz parte desse movimento.
Parece que teremos tempos difíceis pela frente por causa dessa nova mentalidade de que leis são para perdedores.
Agora devemos considerar que tudo na internet, na prática, virou algo que qualquer um pega à vontade.
Porque a única forma garantida de perder é não participar do jogo.
A Papermark é uma alternativa open source ao DocSend. Ela pode ser usada com hospedagem própria ou como serviço hospedado, e é popular por ser muito mais econômica que o DocSend.
A Corgi é uma startup de seguros investida pela YC que vende seguros para outras startups da YC. Nico é o fundador. Recentemente levantou US$ 100 milhões a uma avaliação de cerca de US$ 3 bilhões e atualmente é uma das empresas que a YC está impulsionando com especial força.
Como a subscrição de seguros exige muitos documentos, a Corgi pagava milhares de dólares por mês ao DocSend. Por algum motivo, a Corgi parece ter montado uma equipe de 12 pessoas para criar sua própria alternativa ao DocSend, chamada Dataroom. E a Corgi decidiu posicioná-la como um DocSend mais barato, a partir de US$ 10 por mês, transformando-a em um produto SaaS em um mercado já lotado.
A Papermark percebeu imediatamente que o Dataroom da Corgi usava muitas frases e estruturas idênticas às do seu produto open source. Por isso, concluiu que a Corgi havia se apropriado do trabalho da Papermark sem atribuição. A Corgi nega, dizendo que as correspondências palavra por palavra entre os produtos são mera coincidência.
Outra startup da YC, a Delve, foi flagrada fazendo de fato muito mais do que aquilo de que a Corgi é suspeita e foi excluída da YC.
Do meu ponto de vista, o argumento dele é basicamente duplo:
Mas a maior pista aqui é o layout e a redação idênticos dos dois produtos. Instruir um LLM a “escrever este produto e criar uma réplica 1:1” ainda é cópia, pela definição de senso comum. Alegar que nada foi copiado não faz sentido.
ShadCN é o design system mais popular, que a IA escolhe automaticamente em mais de 90% dos casos, e em plataformas como lovable ele é quase o padrão.
O Google copiou a API, mas manteve a implementação em clean room, e no fim isso foi claramente decidido como uso justo. Se uso justo se aplica até a algo tão estrito quanto a reimplementação de APIs, dá para argumentar que também se aplica a algo muito mais nebuloso, como replicar UI ou layout.
Não entendo por que alguém ainda usa seriamente aquilo que era o antigo Twitter.
Mesmo que eles não tenham copiado e colado código, como disseram, na prática pode ser que o LLM tenha reproduzido o mesmo código com base nos resultados de rastrear o repositório, sem respeitar a licença.
Seria um bom caso civil para um tribunal decidir. A defesa deles parece ser algo como: “nós só mandamos o LLM reproduzir o seu trabalho, então não fomos ‘nós’ que copiamos o código”. Fica um cheiro ruim.
A licença em questão: https://github.com/papermark/papermark?tab=License-1-ov-file
É AGPL, o que basicamente significa que o código-fonte deve ser disponibilizado mesmo quando os usuários interagem com o software pela rede. Projetos que usam esse código também precisam ser AGPL.
Há formas de contornar isso por separação. Por exemplo, usar um servidor de autenticação AGPL não significa que o código com a lógica de negócio também precise ser afetado.
Especialmente se eles tivessem visto controvérsias anteriores, poderiam ter encontrado uma forma de projetar o produto de acordo com a licença.
Mas digo isso partindo da premissa de que o código de fato foi copiado, e não temos como saber isso com certeza. Parece muito parecido, mas não sei bem como isso seria aplicado na prática.
As questões de direitos autorais envolvendo esses modelos são realmente uma bagunça.
A indústria de tecnologia vai fazer de tudo para normalizar roubo e chamar isso de inovação.
Um movimento típico de startup da YC.