Zephyrnet Logo

O chefe do Google Cloud está realmente empolgado com essa coisa de IA

Data:

Nuvem seguinte Os negócios de nuvem do Google no último trimestre alcançaram uma taxa de execução anual de US$ 36 bilhões, mais de cinco vezes o que era há cinco anos, anunciou o CEO da Alphabet, Sundar Pichai, na conferência Google Cloud Next 2024 em Las Vegas na terça-feira.

Embora isso represente cerca de um terço da receita anual gerada pela AWS e pelo Microsoft Azure, não é inconsequente.

“Quero destacar apenas alguns motivos pelos quais o Google Cloud está mostrando tanto progresso”, disse Pichai. “Um deles são nossos profundos investimentos em IA. Já sabemos há algum tempo que a IA transformará todos os setores e empresas, incluindo a nossa.”

O software de IA, com sua preferência por infraestrutura de GPU cara, gerará muitos negócios para provedores de serviços em nuvem. Essa é a razão pela qual o Google e seus rivais na nuvem não param de falar sobre isso. Mas também é potencialmente útil.

“Hoje, a IA do Google pode escanear 100,000 linhas de código em dois minutos para detectar e corrigir bugs”, declarou o gigante das buscas em seu vídeo introdutório. Spoiler: ainda existem bugs no software.

“Hoje, a IA impacta vidas para melhor e entende o trabalho da maneira que você faz”, continuou a voz do vídeo, sem fazer menção às maneiras pelas quais a IA piorou as coisas: desinformação, alucinação, uso de recursos como energia e água, capturar o trabalho intelectual de terceiros e reaproveitá-lo para fins lucrativos sem permissão e preconceito, entre outras questões.

Mas não era isso que os executivos do Google queriam falar sobre. Thomas Kurian, CEO do Google Cloud, não veio para enterrar a IA, mas para elogiá-la.

“Hoje, vamos nos concentrar em como o Google está ajudando empresas líderes a transformar suas operações e a se tornarem líderes digitais e de IA, que é o novo caminho para a nuvem”, proclamou Kurian.

Para esse fim, o Google desenvolveu muitos produtos e serviços que oferece por meio do Google Cloud e unidades de negócios adjacentes.

IA generativa de próxima geração

Kurian disse que os maiores anúncios da Fábrica de Chocolate têm a ver com IA generativa. “Os clientes deixaram rapidamente de experimentar IA generativa, ajudando-a a responder perguntas, a fazer previsões de IA, e agora estão construindo agentes de IA generativa”, explicou ele. “Agentes são entidades inteligentes que agem para ajudá-lo a atingir objetivos específicos.”

Como exemplo, ele citou um cenário em que um agente ajuda um comprador online a encontrar o vestido desejado. Essa possibilidade foi posteriormente demonstrada no palco, quando uma caixa de pesquisa de compras de comércio eletrônico foi alimentada com um URL de vídeo do YouTube e uma solicitação para encontrar uma camisa como a usada pelo tecladista no vídeo. Com certeza, o bot de IA provou ser capaz de escanear o vídeo enviado, identificar a camisa do tecladista e pesquisar uma correspondência no inventário do site de compras.

“Os agentes processam informações multimodais simultaneamente, conversando, raciocinando, aprendendo e tomando decisões”, disse Kurian. “Os agentes podem se conectar com outros agentes e com humanos, e transformarão a forma como cada um de vocês interage com os dispositivos de computação e com a própria web.”

Ficou à imaginação quanto custaria a uma empresa fornecer tal serviço.

O CEO da Goldman Sachs, David Sullivan, apareceu em um depoimento em vídeo para destacar como a empresa financeira estava encontrando usos para a IA. “Já estamos vendo sinais promissores em algumas áreas de nossos experimentos e estamos muito otimistas quanto a isso”, disse entusiasmado.

“Há evidências de que ferramentas generativas de IA para codificação assistida podem aumentar a eficiência e a produtividade do desenvolvedor em até 40%”, continuou Sullivan. “E estamos explorando diferentes maneiras de usar a IA, seja para resumir registros públicos, extrair sentimentos e sinais de declarações corporativas ou para coletar e interpretar informações como relatórios de lucros.”

Essa é uma forma de dizer que ainda não temos certeza se podemos confiar totalmente nos conselhos da IA.

Preparando o kit

Em termos de produtos e serviços, Amin Vahdat, vice-presidente da equipe de aprendizado de máquina, sistemas e IA em nuvem em Mountain View, falou sobre o hardware do Google Cloud, incluindo a disponibilidade geral do Cloud TPU v5p, sem mencionar os Mega VMs A3 com Nvidia H100 GPUs Tensor Core.

Vahdat também mencionou o HyperDisk ML, um serviço de visualização de armazenamento em bloco otimizado para inferência de IA e atendimento a cargas de trabalho. “Ele acelera o tempo de carregamento do modelo em até 11.9x em comparação com alternativas comuns e oferece rendimento 100 vezes maior por volume em comparação com os concorrentes”, disse ele.

Além disso, o Cloud Storage FUSE e o Parallelstore do GCP possuem um novo recurso de cache que supostamente acelera o treinamento, armazenando dados mais próximos da TPU ou GPU do cliente.

Vahdat também destacou opções de software aberto como JetStream, um mecanismo de inferência otimizado que oferece melhor desempenho por dólar para modelos de linguagem grandes. Além do mais, o Google Cloud planeja oferecer chips Grace Blackwell da Nvidia no início de 2025: HGX B200 e GB200 NVL72.

Talvez a maior novidade em termos de hardware tenha sido que o Google Cloud agora tem uma CPU baseada em ARM chamada Axion. O Google afirma que oferece desempenho 50% melhor e eficiência energética 60% melhor do que instâncias de computação baseadas em x86 comparáveis. Além disso, existem agora VMs N4 e C4 e máquinas C3 bare-metal.

Vertex AI, a plataforma empresarial de IA do Google, agora oferece acesso a uma variedade maior de modelos, incluindo Gemini 1.5 Pro em visualização pública, modelos de geração de imagens da família Imagen 2.0 e o Código Gemma assistente de software.

Verificando os fatos

O Google também está tentando tornar seus modelos menos propensos a inventar coisas.

“Como a precisão das respostas é crítica para os serviços de geração de IA, estamos expandindo nossos recursos de base no Vertex AI, incluindo a capacidade de basear respostas diretamente com a Pesquisa Google, agora em versão prévia pública. Os usuários da Vertex AI agora têm acesso a informações atualizadas e de alta qualidade que melhoram significativamente a precisão das respostas do modelo”, explica Vahdat em um comunicado acompanhante. afirmação.

Isso mesmo – Pesquisa Google, ímã para spam na web e marketing afiliado [PDF], pode servir como uma verificação da realidade para modelos de IA propensos a alucinações. Que hora para estar vivo.

O Google Workspace não foi poupado do aumento da IA. Há um aplicativo Google Vids chegando ao pacote em junho para permitir que as pessoas façam vídeos assistidos por IA.

“Vids é seu assistente de vídeo, redação, produção e edição, tudo em um”, explica Aparna Pappu, GM e VP do Google Workspace, em um explicador. “Ele pode gerar um storyboard que você pode editar facilmente e, depois de escolher um estilo, reúne seu primeiro rascunho com cenas sugeridas de vídeos, imagens e música de fundo.”

O Google Meet agora tem anotações de IA como uma prévia e em junho também terá tradução de aprendizado de máquina. Ainda este ano, o Google Chat está programado para adicionar tradução e resumo de IA. Isso está disponível por meio do novo complemento AI Meetings and Messaging por US$ 10 por usuário, por mês.

Ah, e se você quiser o complemento AI Security, que permite que as equipes de TI verifiquem, classifiquem e protejam automaticamente arquivos confidenciais no Google Drive, isso custará outros US $ 10 por usuário por mês.

“Estamos em uma espécie de ponto de inflexão em que as empresas estão evoluindo da concepção de IA e IA de geração para a implementação de fábricas de IA do futuro”, disse o vice-presidente da Garter, Chirag Dekate. O registro. “Tudo o que as empresas fazem e todos os que fazem parte destas jornadas de criação de valor serão aumentados com aumentos de produtividade da IA.”

Dekate considera o AI Hypercomputer, o termo do Google para sua pilha de IA, um ponto de diferenciação em relação aos rivais. “Aqui a parte otimizada da carga de trabalho é importante porque partes do fluxo de trabalho se beneficiarão das TPUs e outras das GPUs e CPUs”, explicou.

“O AI Hypercomputer permite acesso otimizado com desempenho aos recursos de computação otimizados para carga de trabalho que são necessários para potencializar experiências de nuvem nativas de IA. A diferenciação do Google aqui é uma inovação de décadas em hardware de IA projetado especificamente.”

Mais acima na pilha, Dekate vê valor no uso pelo Google de vários modelos locais e de terceiros, sua plataforma Vertex AI e sua base AI Ready Data (Big Query, Looker e AlloyDB). 

“Dar vida a tudo isso são as principais estruturas do agente de IA”, disse Dekate. “Os agentes de IA são realmente importantes porque permitem que as empresas baseiem todos os itens acima na verdade empresarial e dêem vida à IA e à geração de IA em dados corporativos e contextos de execução.” ®

local_img

Inteligência mais recente

local_img