13 pontos por laeyoung 2021-08-02 | 12 comentários | Compartilhar no WhatsApp
  • Copilot é um serviço que comercializa o Codex, criado com base no GPT-3

  • O treinamento foi feito com um conjunto de dados de 159 GB extraído de 54 milhões de repositórios no GitHub

  • Foram criados 164 conjuntos de dados de benchmark, e o Codex resolveu 28,8% deles

  • Vai bem em problemas algorítmicos, como os do LeetCode

    -> Presume-se que isso aconteça porque há muitos repositórios no GitHub com soluções de problemas de algoritmos, e ele aprendeu com esse material


Já apareceram alguns posts sobre o Copilot no GeekNews.

Desta vez, uma pessoa da empresa estava escrevendo um texto sobre o Copilot, e como eu era o único com uma conta do Copilot Preview, acabei ajudando um pouco no meu computador.

Enquanto fazia alguns testes, o que mais me surpreendeu foi que coloquei 3 problemas de programação e ele já devolveu respostas que passavam de primeira.

Um dos problemas era do Baekjoon, e mesmo colocando uma versão traduzida por tradutor automático, ele acertou a resposta.

Até pensei que pode haver gente usando isso para trapacear em testes de programação online...

Minha conclusão depois de usar por um mês integrado ao VSCode é:

  • É bom para desenvolver em linguagens ou ambientes que você conhece só mais ou menos.

    -> Eu estava desenvolvendo em React e precisava fazer algo usando e.target.value; apareceu uma sugestão de umas 20 letras, apertei Tab para autocompletar e funcionou exatamente como eu queria.

    -> Claro, como sou desconfiado, fui verificar no StackOverFlow e a sugestão estava correta.

  • Se for uma linguagem ou ambiente que você conhece bem, as sugestões podem não ser as ideais e acabar incomodando.

  • Fico um pouco preocupado com a ideia de que o código será enviado para inferência; ainda assim, penso “o que alguém faria com o código de cada arquivo isoladamente?” e continuo usando.

12 comentários

 
ruinnel 2021-08-03

https://www.youtube.com/watch?v=a9349pRiCRk

Também vi opiniões desse tipo.

Depois de ver isso, meu interesse caiu bastante.

 
budlebee 2021-08-03

Não entendo muito bem sobre direitos autorais de código, mas se eu pegar um código protegido por direitos autorais e usar fazendo só pequenas alterações, como mudar nomes de variáveis ou nomes de funções, isso configura violação de licença?

 
dalinaum 2021-08-05

Sim. É uma violação.

 
ruinnel 2021-08-03

A questão talvez não seja se o código é completamente idêntico, mas sim... de onde esse código veio? Acho que isso não seria um fator importante em direitos autorais de código?

No caso das licenças MIT ou Apache, pegar, modificar e usar provavelmente não seria um grande problema, mas...

Se o código recomendado pelo Copilot fosse idêntico a um código sob licença GPL...

e o desenvolvedor modificasse parte dele e o incluísse no projeto em desenvolvimento...

pela licença GPL, isso não significaria que o projeto inteiro teria de ter seu código-fonte divulgado?

Pelo que eu sei, se você usa código sob licença GPL e não divulga todo o código que o utiliza, isso seria uma violação da GPL.

Para escrever um exemplo extremo, quase como uma ficção...

se uma empresa estiver desenvolvendo uma solução, e o desenvolvedor usar o Copilot, e por azar o código sugerido for algo que a IA aprendeu a partir de um código sob licença GPL e simplesmente cuspiu de volta...... não pode surgir um problema em que a empresa teria de divulgar todo o código da solução?

 
budlebee 2021-08-03

Uma curiosidade: então, quando o usuário pega o código gerado pelo Copilot e faz pequenas alterações antes de usar, existe alguma forma de detectar isso? Mesmo com a mesma entrada/saída e a mesma funcionalidade, podem surgir códigos em estilos bem diferentes, então fico curioso sobre como esse tipo de plágio de código é descoberto (será que existe uma metodologia de comparação com referências, como em processos por plágio musical?)

 
ruinnel 2021-08-03

Pois é. Como verificar a similaridade e até que ponto dá para considerar que é o mesmo código, sinceramente eu também não sei muito bem qual seria o critério de avaliação haha

 
laeyoung 2021-08-03

Um post relacionado também foi publicado no GeekNews

https://pt.news.hada.io/topic?id=4659

Nesse vídeo do YouTube falam sobre direitos autorais, mas, ao mesmo tempo, vendo que não há indicação de fonte nem de copyright para os materiais mostrados no próprio vídeo (notícias, desenhos animados etc.), parece mesmo algo bem complicado ;_;

 
ruinnel 2021-08-03

Os direitos autorais das notícias/quadrinhos presentes no vídeo que você mencionou são... algo cuja responsabilidade caberia ao próprio autor que os usou (a pessoa que produziu/distribuiu o vídeo), mas...

A questão é: e se, ao usar o Copilot, um código que infringe direitos autorais acabar sendo incluído no meu código?

Eu só usei a ferramenta, mas meu programa desenvolvido por mim acabaria envolvido em um processo por violação de direitos autorais.

 
yeop2 2021-08-02

Eu também queria experimentar, mas quando será que vou conseguir acesso? buá

 
ktseo41 2021-08-02

+1 ainda estou esperando

 
cog25 2021-08-02

Pelo que sei, quanto mais você usa o GitHub, mais rápido ele libera.

 
laeyoung 2021-08-02

Por acaso, no ano passado um repositório que fiz às pressas por causa da COVID acabou recebendo mais de 100 estrelas. Talvez por causa disso, tanto no Copilot quanto no GitHub Codespaces, quando eu me inscrevo acabo sendo selecionado com facilidade.