Gemini: o modelo de IA mais capaz do Google até agora

(blog.google)

1 pontos por GN⁺ 2023-12-07 | 1 comentários | Compartilhar no WhatsApp

Título do resumo: apresentação do novo modelo de IA 'Gemini' do Google e da DeepMind

Sundar Pichai, CEO do Google e da Alphabet, acredita que a IA trará uma transformação maior do que a transição para o mobile ou para a web.
O Google, como uma empresa centrada em IA, percorreu uma jornada de 8 anos e, com a IA generativa, passou a permitir que os usuários colaborem e criem de novas maneiras.
O Google busca ambição em pesquisa e a capacidade de trazer grandes benefícios para a sociedade, ao mesmo tempo em que trabalha com governos e especialistas para lidar com os riscos da IA.

Apresentação do Gemini

Demis Hassabis, CEO e cofundador do Google DeepMind, acredita que a IA trará benefícios extraordinários para a humanidade.
O Gemini é o modelo mais capaz já criado por meio de uma colaboração em larga escala entre equipes do Google, podendo compreender e operar com diversos tipos de informação, como texto, código, áudio, imagem e vídeo.
O Gemini 1.0 foi otimizado em três tamanhos e pode funcionar com eficiência desde data centers até dispositivos móveis.

Desempenho de ponta

Os modelos Gemini apresentam desempenho que supera os atuais resultados de ponta em várias tarefas.
O Gemini Ultra registrou 90,0% no MMLU, mostrando desempenho superior ao de especialistas humanos.
Também supera modelos anteriores em benchmarks de imagem, mostrando sinais iniciais da capacidade de raciocínio complexo do Gemini.

Capacidades de próxima geração

O Gemini é multimodal por natureza, e sua capacidade de compreensão e raciocínio em diferentes modalidades é muito superior à dos modelos anteriores.
O Gemini 1.0 se destaca especialmente na extração de conhecimento de documentos complexos e na explicação de raciocínio em temas complexos como matemática e física.
O Gemini pode compreender e gerar código de alta qualidade, sendo um dos principais modelos fundacionais em tarefas entre linguagens de programação e em raciocínio sobre informações complexas.

Mais confiável, escalável e eficiente

O Gemini 1.0 foi treinado em larga escala usando a infraestrutura otimizada para IA do Google e os TPUs v4 e v5e.
O Gemini roda mais rápido que os modelos anteriores e conta com aceleradores de IA personalizados, que desempenham papel central nos produtos de IA do Google.
O Google anunciou o Cloud TPU v5p para acelerar o desenvolvimento do Gemini e permitir que desenvolvedores treinem modelos de IA em larga escala com mais rapidez.

Construído com responsabilidade e segurança no centro

O Google adicionou novas medidas de proteção levando em conta as capacidades multimodais do Gemini e considerou riscos potenciais em todas as etapas do desenvolvimento.
O Gemini passou pela avaliação de segurança mais abrangente entre os modelos de IA do Google, e a empresa trabalhou com especialistas externos para identificar pontos cegos em seus métodos internos de avaliação.
O Gemini usa classificadores de segurança e filtros robustos para identificar e classificar conteúdos como violência ou estereótipos negativos.

Levando o Gemini ao mundo

O Gemini 1.0 está sendo incorporado aos produtos e plataformas do Google, e o Bard usa uma versão avançada do Gemini Pro para oferecer raciocínio e compreensão mais avançados.
Desenvolvedores e clientes corporativos podem acessar o Gemini Pro pelo Google AI Studio ou pelo Google Cloud Vertex AI.
O Gemini Ultra será disponibilizado a clientes selecionados, desenvolvedores, parceiros e especialistas para feedback em estágio inicial, após passar por verificações de confiabilidade e segurança.

Opinião do GN⁺

O ponto mais importante deste artigo é que o Google e a DeepMind desenvolveram um novo modelo de IA chamado Gemini, abrindo uma nova era para a tecnologia de IA. O Gemini tem capacidades multimodais, o que lhe permite compreender e processar diferentes tipos de informação, como texto, imagem e áudio, oferecendo a desenvolvedores e empresas a oportunidade de criar produtos e serviços ainda mais inovadores. O que torna este artigo interessante é que ele apresenta exemplos concretos de como a tecnologia de IA pode transformar a vida humana e mostra a abordagem do Google sobre como esse avanço tecnológico deve ser conduzido com responsabilidade.

1 comentários

GN⁺ 2023-12-07

Também é um post duplicado no HN, então vejam o que eu publiquei separadamente no GeekNews: Google revela o modelo de IA Gemini.