Data room da Nico levanta suspeitas de apropriação de código da Papermark

(twitter.com/mfts0)

1 pontos por GN⁺ 3 시간 전 | 1 comentários | Compartilhar no WhatsApp

Vieram a público suspeitas de que o produto de data room da Nico não seria resultado de desenvolvimento próprio, mas teria sido extraído do código open source e de licença enterprise da Papermark
A questão central é se houve violação de direitos autorais e de licença, e a pessoa que levantou o problema exige que o produto seja retirado do ar imediatamente
O caso levou a críticas fortes, dizendo que isso não seria “mover-se rápido e quebrar coisas”, mas algo mais próximo de fraude
Também há a observação de que a polêmica em torno do produto pode espalhar desconfiança para o restante dos negócios da Nico
Garry Tan, Jared Friedman e Y Combinator foram marcados, ampliando o caso também para uma questão de reputação da comunidade YC

Suspeitas de apropriação de código da Papermark

Foram levantadas publicamente suspeitas de que o produto de data room da Nico não teria sido desenvolvido internamente, mas pareceria ter sido retirado do código open source e de licença enterprise da Papermark
A pessoa que levantou o problema considera difícil ver isso como simples desenvolvimento rápido de produto ou “vibe coding”, apontando a possibilidade de violação de direitos autorais e de licença
A exigência é clara
- A posição é que o produto deve ser retirado do ar imediatamente
- Se a violação for confirmada, o ato pode ser visto como algo mais grave do que um simples erro

Ampliação das críticas

As críticas não se limitam ao produto de data room da Nico, mas também levantam dúvidas sobre a confiabilidade do restante dos negócios da empresa
Com Garry Tan, Jared Friedman e Y Combinator marcados, o caso passa de uma disputa entre indivíduos a algo ligado também à reputação da comunidade YC
Com base apenas no que foi publicado até agora, o foco está nas suspeitas levantadas e nas exigências, sem que tenham sido fornecidas verificações adicionais ou refutações

1 comentários

GN⁺ 3 시간 전

Opiniões no Hacker News

Se você colocar uma captura de tela de uma página da web em uma ferramenta como o Figma Make, dá para criar uma cópia bastante parecida
As capturas dão exatamente essa impressão: é muito parecido, mas não totalmente igual. O fato de muito do texto ser igual provavelmente vem daí também. Nem sequer deixar a reescrita do texto para uma ferramenta de texto generativo é simplesmente desleixo
Vendo outros comentários no Twitter, parece que eles provavelmente pediram à IA para copiar o Papermark
Há indícios em um comentário da IA de que a página foi alinhada à “reference”
https://xcancel.com/ffumarola/status/2070479755892371713#m
A resposta deles foi esta:

The team that made dataroom has stated that they did not use any of papermark’s code and that dataroom was made from scratch with inspiration from existing document sharing softwares, and that this post’s allegations of us stealing code are false. [...]
Pelas capturas de tela, fica claro que tanto o design quanto o texto foram copiados quase integralmente, página por página. A postura do fundador Nico Laqua, que basicamente respondeu apenas “não copiamos o código” e não assumiu responsabilidade nenhuma, mostra bem os padrões morais dele e da empresa. Pode não ser suficiente para uma ação judicial, mas isso não torna a coisa correta
https://x.com/nico_laqua/status/2070158170937581951
- Alguns anos atrás, quando a Corgi estava contratando seu primeiro engenheiro, fiz uma entrevista lá; eu realmente não me dei bem com o Nico, e mesmo sendo só uma triagem por telefone, foi uma das entrevistas menos fluidas que já fiz
  Eu nem ficaria tão surpreso se o Nico realmente achar que “não copiamos o código” é uma defesa razoável. Parece uma regra clara, e tipos extremamente “shape rotator” costumam ter dificuldade com ambiguidades em áreas como o direito. Na prática, infração de copyright muitas vezes é como o critério para identificar pornografia: você sabe quando vê
- É alguém que, no passado, se gabava de trabalhar no fim de semana e comparava sua seguradora sem grande relevância ao Projeto Manhattan
  Em algum lugar, ele também afirmou que essa empresa/setor era a aplicação mais importante de IA no mundo. Não tenho dúvida de que eles copiaram, e no mínimo não é alguém confiável
  https://x.com/nico_laqua/status/2061130574358773852?s=20
- “Pode não ser suficiente para levar um processo” é principalmente porque projetos open source raramente processam alguém
  Se tivessem feito isso com uma empresa mais inclinada a litigar, acho que haveria uma chance razoável de processo, e as chances de vitória seriam algo como 50/50. É difícil dizer se isso seria visto como cópia de elementos criativos/artísticos ou apenas como cópia do modo de funcionamento, mas embora copiar funcionalidades seja aceitável, copiar toda a experiência do usuário rapidamente vira infração de copyright
- Só o fato de ele insistir ainda mais na mentira já diz bastante sobre que tipo de pessoa o Nico é
- O design é shadcn, um sistema de design muito popular sob licença MIT
  Quanto ao texto, para uma solução de data room de due diligence, acho que ele é bem próximo de um conteúdo padrão e previsível
Você poderia dar um pouco mais de contexto sobre esta thread? Não faço ideia de quem é Nico, o que é a Papermark e o que ela faz.
Separadamente, parece que as pessoas estão ficando mais acostumadas não só a recriar soluções ou projetos existentes com vibe coding, mas também a “roubar” código open source e usá-lo como bem entendem, sem respeitar as premissas morais, éticas e legais do open source. Tenho a impressão de que há mais violações de open source por toda parte do que antes, sem grandes consequências legais.
- Sim. Agora ficou muito mais fácil.
  Além disso, muitos dos novos desenvolvedores que chegaram só por causa de IA não entendem, ou não se importam, que FOSS não significa grátis como cerveja, mas sim liberdade.
  Eu trabalho em uma biblioteca GPL3 que faz parsing de arquivos de dados binários de samplers de áudio de hardware. Alguém criou um app que permite fazer várias coisas em cima da minha biblioteca e cumpriu a licença GPL3.
  Mas recentemente alguém replicou esse app totalmente com vibe coding, colocou até um site e um link de compra de cerca de US$ 60. Era uma cópia escancarada, com cores diferentes, mas exatamente a mesma UI, e não cumpria nenhuma condição da GPL3. A moderação removeu o post da lista e bloqueou o desenvolvedor do app copiado, e a comunidade do fórum apoiou o desenvolvedor do app original. Também enviamos um pedido de remoção por DMCA e, alguns dias depois, o site da cópia saiu do ar.
  O desenvolvedor do app original teve sorte porque há basicamente um único fórum principal onde se publicam posts relacionados àquele fabricante, e a moderação também não gosta de coisas relacionadas a IA. Ironicamente, o próprio desenvolvedor do app original também fez todo o trabalho dele com vibe coding. Sem aquele fórum e sua moderação, tanto o desenvolvedor do app original quanto eu, como mantenedor da biblioteca GPL3, francamente estaríamos ferrados.
  A centralização tem suas vantagens. Sem isso, não vejo muita alternativa além de todo mundo voltar para código fechado ou de algum movimento popular que force uma discussão sobre respeitar o trabalho dos outros. Até agora, estávamos contando com um sistema de honra e reação da comunidade.
- Juízes e governos são favoráveis às empresas e hostis a consumidores e cidadãos.
  As empresas estão se acostumando a sair impunes de qualquer coisa. “Mova-se rápido e quebre coisas” originalmente era sobre tecnologia, mas agora virou uma atitude em relação à lei. A Uber popularizou essa tendência, e agora todo mundo faz a mesma coisa. A IA quebrar a lei de direitos autorais faz parte desse movimento.
  Parece que teremos tempos difíceis pela frente por causa dessa nova mentalidade de que leis são para perdedores.
- O que esperar se os maiores ladrões estão indo rumo a avaliações na casa dos trilhões?
  Agora devemos considerar que tudo na internet, na prática, virou algo que qualquer um pega à vontade.
- Se você acredita que isto é uma corrida winner-takes-all rumo à superinteligência geral, e que a superinteligência geral leva ao domínio absoluto do mundo, então naturalmente deixa de se sentir preso às leis atuais, especialmente a meras regras de propriedade intelectual.
  Porque a única forma garantida de perder é não participar do jogo.
- Empresas que lidam com documentos de clientes externos ou parceiros usam data rooms como o DocSend by Dropbox para compartilhar e receber documentos com controle de acesso, analytics e auditoria.
  A Papermark é uma alternativa open source ao DocSend. Ela pode ser usada com hospedagem própria ou como serviço hospedado, e é popular por ser muito mais econômica que o DocSend.
  A Corgi é uma startup de seguros investida pela YC que vende seguros para outras startups da YC. Nico é o fundador. Recentemente levantou US$ 100 milhões a uma avaliação de cerca de US$ 3 bilhões e atualmente é uma das empresas que a YC está impulsionando com especial força.
  Como a subscrição de seguros exige muitos documentos, a Corgi pagava milhares de dólares por mês ao DocSend. Por algum motivo, a Corgi parece ter montado uma equipe de 12 pessoas para criar sua própria alternativa ao DocSend, chamada Dataroom. E a Corgi decidiu posicioná-la como um DocSend mais barato, a partir de US$ 10 por mês, transformando-a em um produto SaaS em um mercado já lotado.
  A Papermark percebeu imediatamente que o Dataroom da Corgi usava muitas frases e estruturas idênticas às do seu produto open source. Por isso, concluiu que a Corgi havia se apropriado do trabalho da Papermark sem atribuição. A Corgi nega, dizendo que as correspondências palavra por palavra entre os produtos são mera coincidência.
  Outra startup da YC, a Delve, foi flagrada fazendo de fato muito mais do que aquilo de que a Corgi é suspeita e foi excluída da YC.
Do meu ponto de vista, o argumento dele é basicamente duplo:
1. O desenvolvedor não copiou o código manualmente
2. Todo software na mesma área copia uns aos outros
  Mas a maior pista aqui é o layout e a redação idênticos dos dois produtos. Instruir um LLM a “escrever este produto e criar uma réplica 1:1” ainda é cópia, pela definição de senso comum. Alegar que nada foi copiado não faz sentido.
- Ambos parecem, superficialmente, boilerplate do ShadCN: https://ui.shadcn.com/blocks
  ShadCN é o design system mais popular, que a IA escolhe automaticamente em mais de 90% dos casos, e em plataformas como lovable ele é quase o padrão.
- Acho que esse foi o ponto central em Google v. Oracle.
  O Google copiou a API, mas manteve a implementação em clean room, e no fim isso foi claramente decidido como uso justo. Se uso justo se aplica até a algo tão estrito quanto a reimplementação de APIs, dá para argumentar que também se aplica a algo muito mais nebuloso, como replicar UI ou layout.
- Ele está alegando que o código não foi copiado.
Não entendo por que alguém ainda usa seriamente aquilo que era o antigo Twitter.
Mesmo que eles não tenham copiado e colado código, como disseram, na prática pode ser que o LLM tenha reproduzido o mesmo código com base nos resultados de rastrear o repositório, sem respeitar a licença.
Seria um bom caso civil para um tribunal decidir. A defesa deles parece ser algo como: “nós só mandamos o LLM reproduzir o seu trabalho, então não fomos ‘nós’ que copiamos o código”. Fica um cheiro ruim.
A licença em questão: https://github.com/papermark/papermark?tab=License-1-ov-file
É AGPL, o que basicamente significa que o código-fonte deve ser disponibilizado mesmo quando os usuários interagem com o software pela rede. Projetos que usam esse código também precisam ser AGPL.
Há formas de contornar isso por separação. Por exemplo, usar um servidor de autenticação AGPL não significa que o código com a lógica de negócio também precise ser afetado.
Especialmente se eles tivessem visto controvérsias anteriores, poderiam ter encontrado uma forma de projetar o produto de acordo com a licença.
Mas digo isso partindo da premissa de que o código de fato foi copiado, e não temos como saber isso com certeza. Parece muito parecido, mas não sei bem como isso seria aplicado na prática.
- Para aplicar a licença, provavelmente seria necessário entrar com uma ação judicial, e isso parece que vai se tornar algo maior do que apenas um problema da Corgi.
  As questões de direitos autorais envolvendo esses modelos são realmente uma bagunça.
A indústria de tecnologia vai fazer de tudo para normalizar roubo e chamar isso de inovação.
Um movimento típico de startup da YC.

Data room da Nico levanta suspeitas de apropriação de código da Papermark

Suspeitas de apropriação de código da Papermark

Ampliação das críticas

Leituras relacionadas

1 comentários

Opiniões no Hacker News