- Tive acesso antecipado ao sistema de raciocínio aprimorado da OpenAI, o "Strawberry", e pude experimentá-lo; agora ele foi lançado e posso compartilhar minhas opiniões
- O novo modelo de IA, o o1-preview, permite que a IA "pense" antes de resolver um problema
- Com isso, ele consegue lidar com problemas muito difíceis que exigem planejamento e iteração e, na prática, pode superar especialistas humanos com doutorado na resolução de problemas de física muito difíceis
- Esse sistema é impressionante, mas ainda é limitado, e aponta para a direção dos próximos avanços
- No entanto, o o1-preview não é melhor em tudo; por exemplo, não escreve melhor do que o GPT-4o
- Palavras cruzadas são especialmente difíceis para LLMs
- Porque exigem um processo iterativo de solução, em que muitas respostas que afetam umas às outras precisam ser tentadas e descartadas
- LLMs não conseguem fazer isso, porque só podem adicionar um token/palavra à resposta por vez
- LLMs comuns, como o Claude, não conseguem resolver palavras cruzadas corretamente
- Mas o Strawberry, após "pensar" por 108 segundos, resolveu as palavras cruzadas quase perfeitamente
- O o1-preview torna possível fazer coisas que eram impossíveis sem o Strawberry, mas ainda não é perfeito
- Erros e alucinações ainda acontecem, e ele é limitado pela "inteligência" do modelo-base, o GPT-4o
- Mesmo depois de receber o novo modelo, continuo usando o Claude para crítica de estilo de escrita, e o Claude ainda é superior nesse aspecto
- Porém, parei de usar o Claude em tarefas relacionadas a planejamento complexo ou resolução de problemas, o que representa um grande salto nessa área
Em Co-Intelligence..
- Ao usar o o1-preview, passamos a enfrentar uma mudança de paradigma na IA
- Planejamento é uma forma de ação em que a IA chega por conta própria a um caminho para resolver o problema
- Dá a sensação de que o papel do parceiro humano diminui, já que a IA entrega um resultado completo por meio de muito raciocínio e trabalho
- A IA propõe a resposta por conta própria, e o usuário pode revisar seu processo de raciocínio para encontrar erros, mas a sensação de conexão com o resultado ou de contribuição para a direção da solução diminui
- Essa mudança não é necessariamente ruim, mas é diferente do que havia antes
- À medida que esses sistemas evoluem para verdadeiros agentes autônomos, precisamos pensar em como nos envolver para detectar erros e entender o fluxo do problema que estamos tentando resolver
- Apesar das limitações atuais, o o1-preview está mostrando capacidades de IA que não esperávamos
- A questão importante é como vamos evoluir nossa forma de colaboração com a IA à medida que ela avança
- Essa é uma parte que o o1-preview ainda não consegue resolver
2 comentários
"A pergunta importante é como vamos evoluir nossa forma de colaborar com a IA à medida que a IA avança"
É difícil.
O autor é Ethan Mollick, professor da Wharton School da Universidade da Pensilvânia. Ele pesquisa empreendedorismo, inovação e IA.
O conteúdo acima foi publicado no Substack dele, One Useful Thing, e esta newsletter tem cerca de 190 mil assinantes.