Zephyrnet Logo

ChatGPT vs Google Bard: uma comparação das diferenças técnicas

Data:

ChatGPT vs Google Bard: uma comparação das diferenças técnicas
Imagem do autor
 

A maior diferença entre o Google Bard e o ChatGPT é que, no momento em que este livro foi escrito, Bard conhece o ChatGPT, mas o ChatGPT não tem conhecimento de Bard. Mas posso brincar com o ChatGPT, enquanto o Google Bard ainda está fora do alcance da maioria de nós.

 

ChatGPT vs Google Bard: uma comparação das diferenças técnicas
Fonte: Captura de tela de ChatGPT

Tanto o ChatGPT quanto o Google Bard são chatbots de IA. A versão mais simples dessa tecnologia já existe em seu smartphone – você digita “bom” e seu telefone prevê que a próxima palavra que você deseja usar é “manhã”.

O ChatGPT foi originalmente desenvolvido pela OpenAI e depois investido pela Microsoft por US $ 10 bilhões (além de um investimento anterior de US $ 1 bilhão). O Google, um pouco em pânico com a possibilidade de seu monopólio de buscas estar chegando ao fim, respondeu revelando o Bard, sua versão da tecnologia com algumas falhas. Em sua primeira demonstração ao vivo, Bard cometeu vários erros factuais. Embaraçoso para o Google, para dizer o mínimo.

O ChatGPT e o Google Bard são um pouco mais sofisticados do que o texto preditivo do smartphone, mas para entender as diferenças entre os dois chatbots de IA, isso é tudo que você precisa saber para começar.

Vamos dar uma olhada mais profunda nas diferenças técnicas entre esses dois mecanismos de IA.

Você está aqui para obter uma tabela rápida e fácil para obter as diferenças técnicas entre os dois motores. Aqui está exatamente isso. Se você quiser uma aparência mais sutil, fique à vontade para rolar mais.

ChatGPT Bardo
Modelo GPT-3.5 TheMDA, ou Modelo de Linguagem para Aplicações de Diálogo
Arquitetura de rede neural transformador transformador
Dados de treinamento Texto da Web, principalmente um conjunto de dados chamado “rastreamento comum”, interrompido em meados de 2021 1.56 milhões de palavras de dados de diálogo público e texto da web
Propósito Ser um chatbot de geração de texto para todos os fins Especificamente para ajudar a auxiliar a pesquisa
parâmetros 175 bilhões de parâmetros  137 bilhões de parâmetros
Criador OpenAI Google
Vantagens – Aberto a todos agora

– Mais flexível e capaz de texto aberto

– Dados de treinamento cortados em 2021

- Dados de treinamento até os dias atuais

– Treinado especificamente para o diálogo, então soa mais humano quando você o usa para falar

Fraquezas – O diálogo não é tão convincente

– Não tão cuidadosamente ajustado

– Não disponível no momento

– Pode não ser tão adequado para criação de texto geral

Agora que você tem o TL;DR, vamos dar uma olhada mais profunda em todas essas métricas.

O ChatGPT entrou em cena em 30 de novembro de 2022. Em 4 de dezembro de 2022, o serviço havia Acima de um milhão de usuários diários. Em janeiro de 2023, esse número balonizado para mais de 100 milhões de usuários.

Tornou-se instantaneamente popular pelo motivo básico de poder oferecer respostas sólidas sobre vários tópicos de uma forma que soava quase humana e acessível a qualquer pessoa com conexão à Internet.

O ChatGPT foi criado pela OpenAI, um laboratório de IA com sede em São Francisco que se concentra na criação de uma IA amigável. O chatbot se baseia no GPT-3.5, que é um modelo de linguagem grande que, quando recebe texto, pode continuar o prompt.

Além disso, o ChatGPT recebeu um treinamento extra – os treinadores humanos melhoraram o modelo ao interagir com ele e “recompensaram” o modelo por respostas de maior qualidade.

Dados de treinamento

O GPT-3.5 foi treinado em um enorme conjunto de dados de texto da web, incluindo um conjunto de dados popular chamado Common Crawl. Rastreamento comum contém petabytes de dados da web com dados brutos da página da web, extrações de metadados e extrações de texto. Inclui, por exemplo, uma coleção de nossas próprias URLs da StrataScratchGenericName. Não é incrível pensar que o ChatGPT foi treinado usando sites que visitamos todos os dias?

O Common Crawl foi responsável por 60% dos dados de treinamento, mas o GPT-3.5 também obteve dados de outras fontes.

 

ChatGPT vs Google Bard: uma comparação das diferenças técnicas
Fonte: Wikipedia

Bardo é resposta do Google à popularidade do ChatGPT. Ao contrário do ChatGPT, o Bard é desenvolvido pelo Google próprio modelo LaMDA, que é a abreviação de Language Model for Dialogue Applications. E ao contrário do ChatGPT, não é tão empolgante pelo simples motivo de que a maioria das pessoas ainda não consegue acessá-lo. Embora o Google tenha hospedado uma demonstração do Bard repleta de erros no início de fevereiro, agora ela está disponível apenas para alguns poucos.

A principal vantagem do Bard do Google é que ele é aberto à internet. Pergunte ao ChatGPT quem é o presidente e ele não sabe. Isso ocorre porque os dados de treinamento foram cortados em meados de 2021. Bard, enquanto isso, se baseia em informações na internet hoje. Pergunte a Bard e, em teoria, Bard deve ser capaz de extrair dos dados disponíveis na Internet hoje para dizer quem é o presidente.

Embora você ainda não possa dar uma volta, é fácil ver como Bard se destaca do ChatGPT em alguns aspectos importantes.

 

ChatGPT vs Google Bard: uma comparação das diferenças técnicas
Fonte: Google's no blog sobre LaMDA

Dados de treinamento

Primeiro, o LaMDA foi treinado em diálogo, especificamente para falar em conversas, não apenas para produzir texto como os modelos GPT-n. Embora o ChatGPT não esconda seus dados de treinamento, simplesmente não sabemos muito - ainda - sobre os dados com os quais Bard foi treinado.

Podemos extrapolar um pouco olhando para Trabalho de pesquisa do LaMDA. Os pesquisadores do Google disseram que 12.5% dos dados de treinamento vieram do Common Crawl, como os modelos GPT-n. Outros 12.5% vêm da Wikipedia. E de acordo com o trabalho de pesquisa, eles usaram 1.56 trilhão de palavras de “dados de diálogo público e texto da web”.

Aqui está a análise completa:

12.5% de dados baseados em C4 (um derivado dos dados do Common Crawl)
12.5% Wikipédia em inglês
12.5% de documentos de código de sites de perguntas e respostas de programação, tutoriais e outros
6.25% de documentos da web em inglês
6.25% Documentos da Web em idiomas diferentes do inglês
50% de dados de diálogos de fóruns públicos

Conhecemos os dados do Common Crawl e, obviamente, você conhece a Wikipedia. O resto? É intencionalmente escondido, presumivelmente para manter Bard (e LaMDA) a salvo de imitadores.

O LaMDA foi construído ajustando uma família de modelos de linguagem neural baseados em Transformer, que são uma arquitetura de rede neural de código aberto originalmente desenvolvido pelo Google. (Nota divertida – o GPT também é construído no Transformer.)

 

ChatGPT vs Google Bard: uma comparação das diferenças técnicas
Fonte: Postagem no blog do Google sobre Bard
 

O ChatGPT tem algumas proteções para evitar que fique muito desagradável ou diga bobagens completas, mas o Google fez um ponto real de destacar como eles criaram cuidadosamente garantias de qualidade para tornar o Bard um chatbot melhor e mais seguro de usar. A Bard é ajustada para promover “qualidade, fundamentação e segurança”.

Google tem muito a dizer sobre isso, e eu recomendo ler a postagem do blog deles sobre isso, mas se você estiver com pouco tempo, basicamente se resume a isso:

  • Bard deve dar respostas que façam sentido – nada absurdo, sem contradições
  • O bardo deve dar respostas perspicazes, espirituosas ou inesperadas no bom sentido
  • O bardo deve evitar qualquer coisa que arrisque prejudicar o usuário - gore, preconceito, estereótipos odiosos para mencionar alguns
  • Bardo não deveria inventar coisas

Graças a um lançamento defeituoso, já sabemos que o Google ainda não descobriu esse requisito mínimo. Mas é notável que o Google esteja falando tão claramente sobre esses requisitos de design de uma forma que o ChatGPT simplesmente não fez - pelo menos não ainda.

O ChatGPT tem mais parâmetros de modelo do que o Bard – 175 bilhões contra 137 bilhões. Você pode pensar nos parâmetros como botões ou alavancas que o modelo ajusta para ajustar os dados nos quais está sendo treinado. Mais parâmetros geralmente significam que o modelo tem mais capacidade de capturar relacionamentos complexos na linguagem, mas também corre o risco de superajuste.

O Google Bard pode ser menos flexível, mas também pode ser mais robusto para novos casos de uso de idiomas em comparação com o ChatGPT.

Vale ressaltar que tanto Bard quanto ChatGPT estão em modelos (LaMDA e GPT-3.5, respectivamente) que estão em baseado em transformador redes neurais de aprendizagem profunda.

O Transformer pode criar um modelo treinado para ler uma frase ou parágrafo, por exemplo, prestar atenção em como essas palavras se relacionam umas com as outras e então prever quais palavras ele acha que virão a seguir – semelhante ao texto preditivo do seu smartphone, como mencionei anteriormente.

Não vou entrar muito no mato aqui, mas tudo que você precisa saber é que isso significa que, em sua essência, Bard e ChatGPT não são muito diferentes um do outro.

Embora a propriedade não seja exatamente uma diferença técnica, vale a pena ter isso em mente.

O Google Bard é produzido e de propriedade integral do Google, além do LaMDA, que também é criado pelo Google.

O ChatGPT é desenvolvido pela OpenAI, um laboratório de pesquisa de IA com sede em San Francisco. A OpenAI era originalmente sem fins lucrativos, mas criou uma subsidiária com fins lucrativos em 2019. A OpenAI também estava por trás do Dall-E, a geração de texto para imagem de IA com a qual você pode ter brincado.

Embora a Microsoft tenha investido muito dinheiro na OpenAI, ela é, no momento, uma organização de pesquisa independente.

É difícil dar uma resposta justa a essa pergunta porque ambos são muito semelhantes, mas muito diferentes. Por um lado, quase ninguém pode acessar o Google Bard agora. Por outro lado, os dados de treinamento do ChatGPT foram cortados há quase dois anos.

Ambos são geradores de texto - você oferece um prompt e o Google Bard e o ChatGPT podem respondê-lo. Ambos têm bilhões de parâmetros para ajustar o modelo. Ambos têm fontes de dados de treinamento sobrepostas e são construídos no Transformer, o mesmo modelo de rede neural.

Eles também são projetados para propósitos diferentes. Bard irá ajudá-lo a navegar na pesquisa do Google. Ele foi projetado para ser conversacional. ChatGPT pode gerar postagens de blog inteiras. Ele foi projetado para cuspir pedaços de texto que fazem sentido.

Em última análise, as diferenças técnicas entre o ChatGPT e o Google Bard apenas destacam o quão longe a tecnologia de geração de texto com IA chegou. Embora ambos tenham um longo caminho a percorrer e tenham enfrentado controvérsias sobre direitos autorais e ética, ambos os geradores são demonstrações poderosas de modelos modernos de IA.
 
 
Nate Rosidi é cientista de dados e em estratégia de produto. Ele também é professor adjunto ensinando análise e é o fundador da StrataScratchGenericName, uma plataforma que ajuda os cientistas de dados a se prepararem para suas entrevistas com perguntas reais das principais empresas. Conecte-se com ele em Twitter: StrataScratch or LinkedIn.
 

local_img

Inteligência mais recente

local_img