Tudo o que foi anunciado no Google I/O 2024

xguru · 2024-05-15T08:34:19+09:00

Anúncio do modelo Gemini 1.5 Flash Novo modelo multimodal tão poderoso quanto o Gemini 1.5 Pro, mas otimizado para tarefas mais específicas, frequentes e de baixa latência Mais adequado para gerar respostas rápidas As capacidades de tradução, raciocínio e programação do Gemini 1.5 também foram aprimoradas A janela de contexto do Gemini 1.5 Pro (quantidade de informação que pode absorver) dobrou de 1 milhão para 2 milhões de tokens Project Astra: a visão de futuro de IA ao estilo Star Trek do Google Um assistente de IA multimodal que tem como objetivo ver e compreender por meio da câmera do dispositivo, lembrar a localização de objetos e executar tarefas em nome do usuário Foi aplicado à maioria das demos mais impressionantes deste I/O O objetivo é se tornar um verdadeiro agente de IA que vai além de apenas conversar e realmente executa tarefas em nome do usuário Veo: geração de vídeo do Google no estilo Sora Novo modelo de IA generativa do Google para competir com o Sora da OpenAI, capaz de gerar vídeos em 1080p a partir de prompts baseados em texto, imagem e vídeo Pode produzir vídeos em vários estilos, como tomadas aéreas ou timelapse, e pode ser ajustado com prompts adicionais Já está sendo oferecido a alguns criadores para uso na produção de vídeos para o YouTube, e o Google também o apresenta como útil para produção cinematográfica Integração do Gemini com o Workspace O Gemini 1.5 Pro, modelo de linguagem de próxima geração, foi integrado à barra lateral do Docs, Sheets, Slides, Drive e Gmail Deve ser disponibilizado no próximo mês para assinantes pagos e atuará como um assistente geral dentro do Workspace Pode buscar informações em todo o conteúdo do Drive Pode executar tarefas como redigir e-mails combinando informações do documento que você está vendo no momento ou lembrar você de responder mais tarde a um e-mail que está lendo Expansão dos recursos do Google Lens Agora será possível pesquisar não apenas com imagens, mas também com vídeos Foi adicionada uma função em que, ao gravar um vídeo e fazer uma pergunta, a IA do Google encontra respostas relevantes na web Uso do Gemini no Google Photos O recurso "Ask Photos", previsto para este verão, analisará a biblioteca do Google Photos do usuário para responder perguntas Vai além de apenas encontrar fotos de cães ou gatos e também pode responder a perguntas complexas, como perguntar o número da placa do próprio carro, como demonstrou o CEO Sundar Pichai Gems: criação de chatbots personalizados no Gemini Assim como os GPTs da OpenAI, o Gems permitirá que o usuário dê instruções ao Gemini para personalizar a forma de resposta e a área de especialidade Por exemplo, em breve será possível ter um treinador de corrida positivo e persistente que ofereça motivação diária e planos de corrida (no caso de assinantes do Gemini Advanced) Melhoria nas capacidades de conversa do Gemini O novo recurso Gemini Live tem como objetivo tornar o chat por voz com o Gemini mais natural A voz do chatbot ganha mais personalidade, e o usuário poderá interromper no meio da fala ou pedir que ele receba informações em tempo real pela câmera do smartphone O Gemini será integrado ao Google Calendar, Tasks e Keep para atualizar ou buscar informações, além de usar recursos multimodais para adicionar detalhes de um panfleto ao calendário pessoal, por exemplo Circle to Search com suporte para resolver problemas de matemática Agora, ao circular um problema de matemática em um celular ou tablet Android, será possível receber ajuda para resolvê-lo A IA do Google não resolverá diretamente o problema para não incentivar estudantes a colar na lição de casa, mas vai dividi-lo em etapas para facilitar a conclusão Reformulação da Busca do Google com IA O "AI Overviews" (antes chamado de "Search Generative Experience") deve ser lançado em todos os Estados Unidos nesta semana Agora um modelo Gemini "especializado" vai estruturar a página de resultados de busca e preenchê-la com respostas resumidas da web (semelhante ao que se vê em ferramentas de busca com IA como Perplexity ou Arc Search) Detecção de golpes com IA no Android O Google afirma que, usando a IA Gemini Nano no dispositivo, celulares Android poderão detectar sinais de alerta, como padrões comuns de conversa de golpistas, e exibir avisos em tempo real para ajudar a evitar chamadas fraudulentas Mais detalhes sobre esse recurso serão divulgados no fim deste ano Mais inteligência de IA em dispositivos Android O Google informou que em breve o Gemini permitirá que o usuário faça perguntas sobre um vídeo exibido na tela e responderá com base nas legendas automáticas No caso de usuários pagos do Gemini Advanced, ele também poderá absorver PDFs para fornecer informações Essas atualizações multimodais e outras novidades do Gemini no Android serão disponibilizadas nos próximos meses Assistente de IA chegando ao Google Chrome O Google anunciou que adicionará ao Chrome no desktop uma versão leve, o Gemini Nano O assistente integrado usará IA no dispositivo para ajudar diretamente dentro do Google Chrome na geração de texto para postagens em redes sociais, avaliações de produtos e mais Upgrade na marca d’água de IA SynthID O Google informou que ampliará os recursos do SynthID Ele inserirá marca d’água no conteúdo gerado pelo novo gerador de vídeo Veo, e agora também será capaz de detectar vídeos gerados por IA

(theverge.com)

19 pontos por xguru 2024-05-15 | 6 comentários | Compartilhar no WhatsApp

Anúncio do modelo Gemini 1.5 Flash

Novo modelo multimodal tão poderoso quanto o Gemini 1.5 Pro, mas otimizado para tarefas mais específicas, frequentes e de baixa latência
Mais adequado para gerar respostas rápidas
As capacidades de tradução, raciocínio e programação do Gemini 1.5 também foram aprimoradas
A janela de contexto do Gemini 1.5 Pro (quantidade de informação que pode absorver) dobrou de 1 milhão para 2 milhões de tokens

Project Astra: a visão de futuro de IA ao estilo Star Trek do Google

Um assistente de IA multimodal que tem como objetivo ver e compreender por meio da câmera do dispositivo, lembrar a localização de objetos e executar tarefas em nome do usuário
Foi aplicado à maioria das demos mais impressionantes deste I/O
O objetivo é se tornar um verdadeiro agente de IA que vai além de apenas conversar e realmente executa tarefas em nome do usuário

Veo: geração de vídeo do Google no estilo Sora

Novo modelo de IA generativa do Google para competir com o Sora da OpenAI, capaz de gerar vídeos em 1080p a partir de prompts baseados em texto, imagem e vídeo
Pode produzir vídeos em vários estilos, como tomadas aéreas ou timelapse, e pode ser ajustado com prompts adicionais
Já está sendo oferecido a alguns criadores para uso na produção de vídeos para o YouTube, e o Google também o apresenta como útil para produção cinematográfica

Integração do Gemini com o Workspace

O Gemini 1.5 Pro, modelo de linguagem de próxima geração, foi integrado à barra lateral do Docs, Sheets, Slides, Drive e Gmail
Deve ser disponibilizado no próximo mês para assinantes pagos e atuará como um assistente geral dentro do Workspace
Pode buscar informações em todo o conteúdo do Drive
Pode executar tarefas como redigir e-mails combinando informações do documento que você está vendo no momento ou lembrar você de responder mais tarde a um e-mail que está lendo

Expansão dos recursos do Google Lens

Agora será possível pesquisar não apenas com imagens, mas também com vídeos
Foi adicionada uma função em que, ao gravar um vídeo e fazer uma pergunta, a IA do Google encontra respostas relevantes na web

Uso do Gemini no Google Photos

O recurso "Ask Photos", previsto para este verão, analisará a biblioteca do Google Photos do usuário para responder perguntas
Vai além de apenas encontrar fotos de cães ou gatos e também pode responder a perguntas complexas, como perguntar o número da placa do próprio carro, como demonstrou o CEO Sundar Pichai

Gems: criação de chatbots personalizados no Gemini

Assim como os GPTs da OpenAI, o Gems permitirá que o usuário dê instruções ao Gemini para personalizar a forma de resposta e a área de especialidade
Por exemplo, em breve será possível ter um treinador de corrida positivo e persistente que ofereça motivação diária e planos de corrida (no caso de assinantes do Gemini Advanced)

Melhoria nas capacidades de conversa do Gemini

O novo recurso Gemini Live tem como objetivo tornar o chat por voz com o Gemini mais natural
A voz do chatbot ganha mais personalidade, e o usuário poderá interromper no meio da fala ou pedir que ele receba informações em tempo real pela câmera do smartphone
O Gemini será integrado ao Google Calendar, Tasks e Keep para atualizar ou buscar informações, além de usar recursos multimodais para adicionar detalhes de um panfleto ao calendário pessoal, por exemplo

Circle to Search com suporte para resolver problemas de matemática

Agora, ao circular um problema de matemática em um celular ou tablet Android, será possível receber ajuda para resolvê-lo
A IA do Google não resolverá diretamente o problema para não incentivar estudantes a colar na lição de casa, mas vai dividi-lo em etapas para facilitar a conclusão

Reformulação da Busca do Google com IA

O "AI Overviews" (antes chamado de "Search Generative Experience") deve ser lançado em todos os Estados Unidos nesta semana
Agora um modelo Gemini "especializado" vai estruturar a página de resultados de busca e preenchê-la com respostas resumidas da web (semelhante ao que se vê em ferramentas de busca com IA como Perplexity ou Arc Search)

Detecção de golpes com IA no Android

O Google afirma que, usando a IA Gemini Nano no dispositivo, celulares Android poderão detectar sinais de alerta, como padrões comuns de conversa de golpistas, e exibir avisos em tempo real para ajudar a evitar chamadas fraudulentas
Mais detalhes sobre esse recurso serão divulgados no fim deste ano

Mais inteligência de IA em dispositivos Android

O Google informou que em breve o Gemini permitirá que o usuário faça perguntas sobre um vídeo exibido na tela e responderá com base nas legendas automáticas
No caso de usuários pagos do Gemini Advanced, ele também poderá absorver PDFs para fornecer informações
Essas atualizações multimodais e outras novidades do Gemini no Android serão disponibilizadas nos próximos meses

Assistente de IA chegando ao Google Chrome

O Google anunciou que adicionará ao Chrome no desktop uma versão leve, o Gemini Nano
O assistente integrado usará IA no dispositivo para ajudar diretamente dentro do Google Chrome na geração de texto para postagens em redes sociais, avaliações de produtos e mais

Upgrade na marca d’água de IA SynthID

O Google informou que ampliará os recursos do SynthID
Ele inserirá marca d’água no conteúdo gerado pelo novo gerador de vídeo Veo, e agora também será capaz de detectar vídeos gerados por IA

6 comentários

pinks 2024-05-16

É suficiente que o chatbot seja oferecido gratuitamente, e como não uso recursos relacionados a imagem, vídeo ou áudio, fico feliz em ver isso sendo integrado aos produtos existentes.

corelyai 2024-05-15

Avanços no Project Astra AI do Google e na geração de vídeo

Os modelos Gemini do Google já são amplamente usados por mais de 1,5 milhão de desenvolvedores para depuração de código, obtenção de insights e criação de aplicações de IA. O Project Astra está introduzindo agentes de IA capazes de processar com eficiência informações de entrada em vídeo e voz, além de um novo modelo avançado de vídeo generativo chamado Vo. O Vo pode produzir vídeos em 1080p de alta qualidade a partir de prompts de texto, imagem e vídeo, oferecendo um nível inédito de controle criativo. Desenvolvida pela DeepMind do Google, essa tecnologia tem como objetivo tornar reais ideias que antes eram impossíveis.

A TPU de 6ª geração do Google e uma reformulação inovadora em IA

O Google planeja lançar no fim de 2024 a Trillium, sua TPU de 6ª geração, com desempenho computacional 4,7 vezes maior por chip, e disponibilizá-la para clientes de nuvem. Além disso, está introduzindo novas CPUs e GPUs, incluindo o processador Axion e as GPUs Blackwell da NVIDIA, para dar suporte a diferentes cargas de trabalho; estas últimas devem estar disponíveis no início de 2025. O Google também está lançando o Gemini, uma experiência de busca totalmente renovada e baseada em IA, com alta satisfação dos usuários, começando pelos Estados Unidos. Esse novo modelo de busca permite consultas mais complexas e pesquisa por fotos, além de fornecer resultados organizados para uma experiência de usuário ainda melhor.

Novos recursos de IA do Google e inovações futuras

O Google está introduzindo uma nova página de resultados de busca organizada por IA, começando com alimentos e receitas e depois se expandindo para outras categorias. A IA pode usar fatores contextuais, como a estação do ano, para fornecer uma visão geral das causas de um problema e das etapas para resolvê-lo. Em breve, a IA do Google, Gemini, também oferecerá experiências ao vivo com especialistas pessoais personalizados chamados "Gems" e será integrada ao Project Astra para recursos de compreensão de vídeo.

Apresentando o Gemini, o novo assistente de IA para Android

O Gemini é o novo assistente de IA para Android, oferecendo experiências de IA no dispositivo com foco em privacidade de dados. Ele foi projetado para fornecer sugestões contextuais, como ajudar nos estudos e oferecer orientações passo a passo para problemas complexos. Além disso, o Gemini pode ajudar em tarefas como encontrar imagens e responder a perguntas específicas, integrando-se de forma fluida ao fluxo de trabalho do usuário.

O impacto do Gemini do Google no uso de smartphones

O Gemini do Google oferece recursos de IA para usuários de smartphones, permitindo acesso fácil a informações contidas em documentos e respostas claras para perguntas específicas. O modelo fundamental executado no dispositivo melhora a experiência no smartphone ao priorizar a privacidade do usuário e fornecer respostas mais rápidas. O futuro modelo Gemini Nano ampliará ainda mais essas possibilidades ao permitir que os celulares compreendam o mundo por meio de texto, visão, som e linguagem falada.

Corely, os principais pontos do YouTube em 10 segundos! - https://corely.ai/content/google-io-2024-everything-revealed

xguru 2024-05-15

Gemini Flash
Google DeepMind Veo

savvykang 2024-05-15

https://killedbygoogle.com
Fico me perguntando quando o Gemini vai entrar nessa lista. Se não der dinheiro, a Google tem o costume de encerrar sem apego, então acabo não conseguindo me afeiçoar.