"O futuro segue pelo caminho da IA open source." por Mark Zuckerberg

xguru · 2024-07-24T09:22:58+09:00

No início da computação de alto desempenho, as principais empresas de tecnologia desenvolveram internamente versões fechadas de Unix Com o passar do tempo, o Linux open source ganhou popularidade e hoje se tornou o padrão em computação em nuvem e sistemas operacionais móveis Espera-se que a IA evolua de forma semelhante Atualmente, várias empresas de tecnologia estão desenvolvendo modelos fechados, mas o open source está alcançando rapidamente No ano passado, o Llama 2 ficou atrás dos modelos da geração anterior, mas neste ano o Llama 3 alcançou um nível capaz de competir com os modelos mais avançados A partir do ano que vem, espera-se que os modelos Llama estejam entre os mais avançados do setor O Llama já lidera em abertura, possibilidade de modificação e eficiência de custos Agora estamos dando o próximo passo para que a IA open source se torne o padrão da indústria A Meta anunciou hoje o Llama 3.1 405B, o primeiro modelo de IA open source de ponta, além dos modelos Llama 3.1 70B e 8B Em comparação com modelos fechados, ele oferece uma relação custo-desempenho muito superior, e o fato de o modelo 405B ser open source fará dele a melhor opção para ajustar finamente e refinar modelos menores Em colaboração com várias empresas, estamos expandindo um ecossistema mais amplo Em parceria com Amazon, Databricks, NVIDIA e outras, oferecemos um conjunto completo de serviços para suportar fine-tuning e destilação de modelos de IA A Groq está construindo serviços de inferência de baixa latência e baixo custo Os modelos estão disponíveis em todos os principais provedores de nuvem, como AWS, Azure, Google e Oracle Scale.AI, Dell, Deloitte e outras ajudam empresas a adotar o Llama e treinar modelos personalizados com seus próprios dados À medida que a comunidade cresce e mais empresas desenvolvem novos serviços, podemos transformar o Llama no padrão da indústria e levar os benefícios da IA a todos A Meta está comprometida com a IA open source. Por que acreditamos que o open source é a stack de desenvolvimento mais adequada para você, por que tornar o Llama open source é bom para a Meta, e por que a IA open source é boa para o mundo, explicando assim a plataforma que acreditamos que vai perdurar no longo prazo Por que a IA open source é boa para desenvolvedores É possível treinar, ajustar finamente e destilar modelos diretamente: cada organização pode adaptar o modelo ao tamanho ideal usando seus próprios dados Mantém independência sem depender de fornecedores fechados: o open source oferece um ecossistema de toolchains compatíveis, permitindo liberdade para migrar Proteção de dados: é possível processar dados sensíveis no próprio modelo sem enviá-los para APIs em nuvem Eficiência de custo: o modelo Llama 3.1 405B permite inferência por cerca de 50% menos que modelos fechados Investimento em um padrão de longo prazo: o open source está evoluindo mais rápido que os modelos fechados Por que a IA open source é boa para a Meta O modelo de negócios da Meta é oferecer as melhores experiências e serviços. Para isso, é necessário ter sempre acesso à tecnologia mais avançada e não ficar preso ao ecossistema fechado dos concorrentes A experiência de construir serviços sobre a plataforma da Apple mostrou as limitações dos ecossistemas fechados. Ao construir um ecossistema aberto, é possível oferecer serviços melhores Há preocupações de que tornar algo open source signifique abrir mão da vantagem técnica, mas isso perde a visão do quadro geral Desenvolvimento do ecossistema: o Llama precisa evoluir para um ecossistema completo, com ferramentas, melhorias de eficiência, otimização para silício e outras integrações. Se a Meta for a única empresa usando o Llama, o ecossistema não se desenvolverá Manutenção da competitividade: o desenvolvimento de IA será extremamente competitivo, então tornar algo open source não significa abrir mão de uma grande vantagem técnica. O Llama precisa ser competitivo, eficiente e aberto a cada geração Diferença no modelo de negócios: vender acesso a modelos de IA não é o modelo de negócios da Meta, portanto tornar o Llama open source não prejudica sua receita, sustentabilidade nem sua capacidade de investir em pesquisa. Esse é um dos motivos pelos quais vários provedores fechados fazem lobby contra open source junto a governos Experiência com open source: a Meta tem um histórico de projetos open source bem-sucedidos. Por meio do Open Compute Project, abriu designs de servidores, redes e data centers e economizou bilhões de dólares. Também tornou open source ferramentas como PyTorch e React, beneficiando-se da inovação do ecossistema. Essa abordagem tem sido consistentemente vantajosa para a Meta no longo prazo Por que a IA open source é boa para o mundo O open source é essencial para um futuro positivo da IA A IA pode aumentar a produtividade, a criatividade e a qualidade de vida, acelerar o crescimento econômico e possibilitar avanços em saúde e pesquisa científica O open source permite que mais pessoas tenham acesso aos benefícios e oportunidades da IA e garante que o poder não fique concentrado em poucas empresas Ele ajuda a distribuir a tecnologia de IA de forma mais equilibrada e segura por toda a sociedade, e é mais seguro porque é desenvolvido com transparência Minha estrutura para entender segurança é que precisamos nos proteger de duas categorias de danos Danos não intencionais: quando sistemas de IA causam prejuízo sem intenção Ex.: fornecer aconselhamento de saúde incorreto, autorreplicação ou otimização excessiva de objetivos Danos intencionais: quando usuários maliciosos usam modelos de IA para causar danos Os danos não intencionais respondem pela maior parte das preocupações Ex.: impactos de sistemas de IA sobre pessoas, cenários de ficção científica em que a IA prejudica humanos O open source é mais seguro para prevenir danos não intencionais porque os sistemas são mais transparentes e podem ser amplamente revisados Modelos open source como o Llama podem ser ainda mais seguros e protegidos do que modelos fechados graças a sistemas de segurança como o Llama Guard Estamos tentando avaliar a nocividade dos modelos e mitigar riscos, incluindo testes rigorosos e atividades de red team Os modelos são públicos e qualquer pessoa pode testá-los. Como os modelos de IA aprendem com informações da internet, é preciso considerar se eles podem causar mais danos do que as informações já existentes Considerações sobre danos intencionais É preciso distinguir entre atores de pequena escala e atores de grande escala No futuro, indivíduos mal-intencionados poderão usar modelos de IA para criar novos tipos de danos A IA precisa ser amplamente distribuída para que grandes atores possam contrabalançar o poder de pequenos agentes maliciosos Quando grandes instituições implantam IA em larga escala, isso promove segurança e estabilidade em toda a sociedade A resposta dos Estados Unidos e das democracias A força dos Estados Unidos está na inovação aberta e descentralizada Há quem diga que os modelos devem ser fechados para impedir o acesso da China, mas isso não é eficaz Como a espionagem é sofisticada, é fácil que modelos sejam roubados Um mundo com apenas modelos fechados faria com que poucas grandes empresas e países adversários tivessem acesso a eles, enquanto startups, universidades e pequenas empresas provavelmente perderiam a oportunidade Se a inovação dos Estados Unidos ficar limitada ao desenvolvimento fechado, será difícil manter a liderança É preciso construir um ecossistema aberto e cooperar com governos e aliados para maximizar os benefícios das tecnologias mais avançadas A IA open source é a melhor forma do mundo de aproveitar ao máximo as oportunidades econômicas e a segurança As principais empresas de tecnologia e a pesquisa científica de hoje se baseiam em software open source A próxima geração de empresas e pesquisas também usará IA open source Vamos construir isso juntos A Meta está adotando uma abordagem diferente em relação aos modelos Llama anteriores Internamente, estamos montando equipes para ajudar o maior número possível de desenvolvedores e parceiros a usar o Llama Estamos formando ativamente parcerias para que mais empresas do ecossistema possam oferecer recursos únicos a seus clientes Acreditamos que o lançamento do Llama 3.1 será um ponto de inflexão para o setor, em que a maioria dos desenvolvedores começará a usar principalmente open source

(about.fb.com)

13 pontos por xguru 2024-07-24 | 5 comentários | Compartilhar no WhatsApp

No início da computação de alto desempenho, as principais empresas de tecnologia desenvolveram internamente versões fechadas de Unix
Com o passar do tempo, o Linux open source ganhou popularidade e hoje se tornou o padrão em computação em nuvem e sistemas operacionais móveis
Espera-se que a IA evolua de forma semelhante
- Atualmente, várias empresas de tecnologia estão desenvolvendo modelos fechados, mas o open source está alcançando rapidamente
- No ano passado, o Llama 2 ficou atrás dos modelos da geração anterior, mas neste ano o Llama 3 alcançou um nível capaz de competir com os modelos mais avançados
- A partir do ano que vem, espera-se que os modelos Llama estejam entre os mais avançados do setor
- O Llama já lidera em abertura, possibilidade de modificação e eficiência de custos
Agora estamos dando o próximo passo para que a IA open source se torne o padrão da indústria
- A Meta anunciou hoje o Llama 3.1 405B, o primeiro modelo de IA open source de ponta, além dos modelos Llama 3.1 70B e 8B
- Em comparação com modelos fechados, ele oferece uma relação custo-desempenho muito superior, e o fato de o modelo 405B ser open source fará dele a melhor opção para ajustar finamente e refinar modelos menores
Em colaboração com várias empresas, estamos expandindo um ecossistema mais amplo
- Em parceria com Amazon, Databricks, NVIDIA e outras, oferecemos um conjunto completo de serviços para suportar fine-tuning e destilação de modelos de IA
- A Groq está construindo serviços de inferência de baixa latência e baixo custo
- Os modelos estão disponíveis em todos os principais provedores de nuvem, como AWS, Azure, Google e Oracle
- Scale.AI, Dell, Deloitte e outras ajudam empresas a adotar o Llama e treinar modelos personalizados com seus próprios dados
- À medida que a comunidade cresce e mais empresas desenvolvem novos serviços, podemos transformar o Llama no padrão da indústria e levar os benefícios da IA a todos
A Meta está comprometida com a IA open source.
- Por que acreditamos que o open source é a stack de desenvolvimento mais adequada para você,
- por que tornar o Llama open source é bom para a Meta,
- e por que a IA open source é boa para o mundo,
- explicando assim a plataforma que acreditamos que vai perdurar no longo prazo

Por que a IA open source é boa para desenvolvedores

É possível treinar, ajustar finamente e destilar modelos diretamente: cada organização pode adaptar o modelo ao tamanho ideal usando seus próprios dados
Mantém independência sem depender de fornecedores fechados: o open source oferece um ecossistema de toolchains compatíveis, permitindo liberdade para migrar
Proteção de dados: é possível processar dados sensíveis no próprio modelo sem enviá-los para APIs em nuvem
Eficiência de custo: o modelo Llama 3.1 405B permite inferência por cerca de 50% menos que modelos fechados
Investimento em um padrão de longo prazo: o open source está evoluindo mais rápido que os modelos fechados

Por que a IA open source é boa para a Meta

O modelo de negócios da Meta é oferecer as melhores experiências e serviços.
Para isso, é necessário ter sempre acesso à tecnologia mais avançada e não ficar preso ao ecossistema fechado dos concorrentes
A experiência de construir serviços sobre a plataforma da Apple mostrou as limitações dos ecossistemas fechados.
Ao construir um ecossistema aberto, é possível oferecer serviços melhores
Há preocupações de que tornar algo open source signifique abrir mão da vantagem técnica, mas isso perde a visão do quadro geral
- Desenvolvimento do ecossistema: o Llama precisa evoluir para um ecossistema completo, com ferramentas, melhorias de eficiência, otimização para silício e outras integrações. Se a Meta for a única empresa usando o Llama, o ecossistema não se desenvolverá
- Manutenção da competitividade: o desenvolvimento de IA será extremamente competitivo, então tornar algo open source não significa abrir mão de uma grande vantagem técnica. O Llama precisa ser competitivo, eficiente e aberto a cada geração
- Diferença no modelo de negócios: vender acesso a modelos de IA não é o modelo de negócios da Meta, portanto tornar o Llama open source não prejudica sua receita, sustentabilidade nem sua capacidade de investir em pesquisa. Esse é um dos motivos pelos quais vários provedores fechados fazem lobby contra open source junto a governos
- Experiência com open source: a Meta tem um histórico de projetos open source bem-sucedidos. Por meio do Open Compute Project, abriu designs de servidores, redes e data centers e economizou bilhões de dólares. Também tornou open source ferramentas como PyTorch e React, beneficiando-se da inovação do ecossistema. Essa abordagem tem sido consistentemente vantajosa para a Meta no longo prazo

Por que a IA open source é boa para o mundo

O open source é essencial para um futuro positivo da IA
A IA pode aumentar a produtividade, a criatividade e a qualidade de vida, acelerar o crescimento econômico e possibilitar avanços em saúde e pesquisa científica
O open source permite que mais pessoas tenham acesso aos benefícios e oportunidades da IA e garante que o poder não fique concentrado em poucas empresas
Ele ajuda a distribuir a tecnologia de IA de forma mais equilibrada e segura por toda a sociedade, e é mais seguro porque é desenvolvido com transparência
Minha estrutura para entender segurança é que precisamos nos proteger de duas categorias de danos
- Danos não intencionais: quando sistemas de IA causam prejuízo sem intenção
  - Ex.: fornecer aconselhamento de saúde incorreto, autorreplicação ou otimização excessiva de objetivos
- Danos intencionais: quando usuários maliciosos usam modelos de IA para causar danos
  - Os danos não intencionais respondem pela maior parte das preocupações
  - Ex.: impactos de sistemas de IA sobre pessoas, cenários de ficção científica em que a IA prejudica humanos
  - O open source é mais seguro para prevenir danos não intencionais porque os sistemas são mais transparentes e podem ser amplamente revisados
  - Modelos open source como o Llama podem ser ainda mais seguros e protegidos do que modelos fechados graças a sistemas de segurança como o Llama Guard
Estamos tentando avaliar a nocividade dos modelos e mitigar riscos, incluindo testes rigorosos e atividades de red team
- Os modelos são públicos e qualquer pessoa pode testá-los.
- Como os modelos de IA aprendem com informações da internet, é preciso considerar se eles podem causar mais danos do que as informações já existentes
Considerações sobre danos intencionais
- É preciso distinguir entre atores de pequena escala e atores de grande escala
- No futuro, indivíduos mal-intencionados poderão usar modelos de IA para criar novos tipos de danos
- A IA precisa ser amplamente distribuída para que grandes atores possam contrabalançar o poder de pequenos agentes maliciosos
- Quando grandes instituições implantam IA em larga escala, isso promove segurança e estabilidade em toda a sociedade
A resposta dos Estados Unidos e das democracias
- A força dos Estados Unidos está na inovação aberta e descentralizada
- Há quem diga que os modelos devem ser fechados para impedir o acesso da China, mas isso não é eficaz
- Como a espionagem é sofisticada, é fácil que modelos sejam roubados
- Um mundo com apenas modelos fechados faria com que poucas grandes empresas e países adversários tivessem acesso a eles, enquanto startups, universidades e pequenas empresas provavelmente perderiam a oportunidade
- Se a inovação dos Estados Unidos ficar limitada ao desenvolvimento fechado, será difícil manter a liderança
- É preciso construir um ecossistema aberto e cooperar com governos e aliados para maximizar os benefícios das tecnologias mais avançadas
A IA open source é a melhor forma do mundo de aproveitar ao máximo as oportunidades econômicas e a segurança
- As principais empresas de tecnologia e a pesquisa científica de hoje se baseiam em software open source
- A próxima geração de empresas e pesquisas também usará IA open source

Vamos construir isso juntos

A Meta está adotando uma abordagem diferente em relação aos modelos Llama anteriores
Internamente, estamos montando equipes para ajudar o maior número possível de desenvolvedores e parceiros a usar o Llama
Estamos formando ativamente parcerias para que mais empresas do ecossistema possam oferecer recursos únicos a seus clientes
Acreditamos que o lançamento do Llama 3.1 será um ponto de inflexão para o setor, em que a maioria dos desenvolvedores começará a usar principalmente open source

5 comentários

savvykang 2024-07-28

Pelo que a Meta tem feito, parece bastante provável que acabe sendo conivente tanto com danos não intencionais quanto com danos intencionais. Na minha avaliação pessoal, Zuckerberg é alguém em quem não dá para confiar.

jaehong747 2024-07-27

Llama é open source? Não.

Dados de treinamento = código-fonte
O modelo Llama 3.1 foi divulgado como open source desta vez. Porém, os dados de treinamento não são públicos. Em IA e deep learning, os dados de treinamento são o "código-fonte", e o modelo é algo como um app. Portanto, na prática, não dá para dizer que o Llama é open source. Foi apenas lançado um app gratuito de modelo de linguagem.

A Meta tem chance de divulgar os dados de treinamento do Llama? Não.

Os dados de treinamento do Llama têm 15 trilhões de tokens só em texto, e também deve haver dados de imagem, vídeo e áudio para o treinamento multimodal. É possível que uma parte considerável desses dados seja de usuários do Facebook ou do Instagram. Por isso, tornar isso público criaria grandes questões sociais de propriedade de dados e direitos autorais, então é provável que a Meta não consiga divulgar esses dados, mesmo que queira.

2024-07-24

[Este comentário foi ocultado.]

joon14 2024-07-24

A Meta é muito legal.

xguru 2024-07-24

Opiniões do Hacker News

A linguagem sobre IA de código aberto é confusa
- Código aberto normalmente deveria ter código legível por humanos
- Os modelos de ML atuais são compostos por matrizes muito grandes, o que dificulta para os usuários entender e modificar
- Parece haver confusão entre código aberto e simplesmente código que não roda por meio de uma API remota
Há grandes vantagens para startups de IA e desenvolvedores
- A dependência de fornecedor desaparece
- Desenvolvedores podem integrar IA a produtos de forma econômica e com bom desempenho
- A expectativa é de respostas de LLM rápidas a baixo custo
- Com o avanço da IA, os produtos tendem a melhorar automaticamente, ficar mais baratos e ganhar escalabilidade
A Meta é uma das poucas grandes empresas de IA que oferecem modelos abertos
- Diferentemente de Anthropic e OpenAI, a Meta está comprometida com modelos abertos
- Isso a diferencia de outros grupos que discutem segurança e a necessidade de sistemas de IA fechados
O modelo de receita publicitária da Meta merece atenção
- Permitir que usuários gerem seu próprio conteúdo por meio de modelos de código aberto favorece a Meta
- Ao lançar modelos abertos, deixa de ser necessário monitorar o conteúdo gerado pelos modelos
- Isso é uma boa estratégia de negócios para a Meta
A Meta quer se posicionar como a campeã do código aberto em IA
- Isso acontece porque ela foi surpreendida pela OpenAI e porque não participa do jogo de infraestrutura
- Não é altruísmo, mas ainda assim é bom para desenvolvedores e startups
- O investimento da Meta em GPUs é voltado principalmente para novos produtos de IA, sistemas de recomendação e vendas de anúncios