Gemma — o modelo aberto de ponta do Google
(blog.google)- O Google acredita em criar uma IA útil para todos e vem contribuindo com inovações para a comunidade aberta, como Transformers, TensorFlow, BERT, T5, JAX, AlphaFold e AlphaCode
- Gemma é uma família de modelos abertos leves e de ponta, criada com base nas mesmas pesquisas e tecnologias usadas para desenvolver os modelos Gemini
- Foi desenvolvida pelo Google DeepMind e outras equipes, com inspiração em
gemma, palavra em latim que significa “joia”
- Foi desenvolvida pelo Google DeepMind e outras equipes, com inspiração em
- A partir de hoje, está disponível globalmente, junto com pesos de modelo, ferramentas para apoiar a inovação dos desenvolvedores, incentivar a colaboração e orientar o uso responsável dos modelos Gemma
- Ao compartilhar componentes de tecnologia e infraestrutura com o Gemini, o Gemma 2B e o 7B alcançam o melhor desempenho proporcional ao tamanho em comparação com outros modelos abertos
- Pode ser executado diretamente no laptop ou desktop do desenvolvedor e, ao mesmo tempo em que supera modelos muito maiores nos principais benchmarks, segue padrões rigorosos para fornecer resultados seguros e responsáveis
- Oferece um toolchain para inferência e SFT (ajuste fino supervisionado) em todos os principais frameworks, como JAX, PyTorch e TensorFlow, por meio do Native Keras 3.0
- É fácil começar a usar o Gemma com integrações a ferramentas populares como notebooks do Colab e do Kaggle, Hugging Face, MaxText, NVIDIA NeMo e TensorRT-LLM
- Os modelos Gemma pré-treinados e ajustados por instrução podem ser implantados facilmente no Vertex AI e no Google Kubernetes Engine (GKE), para execução em notebooks, workstations ou no Google Cloud
- Garante desempenho líder do setor com otimizações para várias plataformas de hardware de IA, incluindo GPUs da NVIDIA e Google Cloud TPU
- Permite uso comercial e distribuição para organizações de qualquer porte, de acordo com os termos de uso
Responsável desde a concepção
- O Gemma foi projetado com os princípios de IA em primeiro lugar e usa técnicas automatizadas para filtrar informações pessoais e outros dados sensíveis do conjunto de treinamento
- Além disso, faz amplo uso de aprendizado por reforço com feedback humano (RLHF) em modelos ajustados por instrução para alinhá-los a comportamentos responsáveis
- Para entender e reduzir o perfil de risco dos modelos Gemma, foram realizadas avaliações robustas, incluindo red teaming manual, testes adversariais automatizados e avaliação da capacidade do modelo para atividades perigosas
Otimizado em frameworks, ferramentas e hardware
- Os modelos Gemma podem ser ajustados com dados próprios para atender às necessidades de aplicações específicas e oferecem suporte a diversas ferramentas e sistemas
- Ferramentas multiframeowork: uso do framework de sua preferência, como Keras 3.0, PyTorch nativo, JAX e Hugging Face Transformers. Implementações de referência disponíveis
- Compatibilidade entre dispositivos: pode ser executado em dispositivos populares, incluindo laptops, desktops, IoT, mobile e cloud
- Plataformas de hardware de ponta: em parceria com a NVIDIA, garante desempenho líder do setor e integração com tecnologia de ponta por meio de otimizações para GPUs da NVIDIA, de data centers e nuvem até PCs locais com RTX AI
- Otimizado no Google Cloud: com o Vertex AI, oferece um amplo conjunto de ferramentas de MLOps e várias opções de tuning, além de implantação com um clique usando otimizações de inferência integradas
Créditos gratuitos para pesquisa e desenvolvimento
- O Gemma foi criado para a comunidade de desenvolvedores e pesquisadores que impulsiona a inovação em IA, e é possível começar a usá-lo hoje com acesso gratuito no Kaggle, camada gratuita de notebooks do Colab e US$ 300 em créditos para novos usuários do Google Cloud
- Pesquisadores podem solicitar até US$ 500.000 em créditos do Google Cloud para acelerar seus projetos
2 comentários
Agora parece que só a OpenAI é que está fechada.
Opiniões no Hacker News
d_model, diferente da maioria dos modelos, que usam 4 vezes.