Zephyrnet Logo

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados – KDnuggets

Data:

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados
Imagem do editor
 

ChatGPT se tornou o produto OpenAI que muda a forma como o mundo funciona. Muitos dos leitores aqui já os estão usando ou pelo menos testando. Da forma como isso nos ajuda, não creio que possamos voltar à nossa antiga forma de trabalhar.

Uma das inovações que a OpenAI oferece é a GPT Store, onde as pessoas podem desenvolver seus modelos GPT personalizados e compartilhá-los com o público. Mais de 3 milhões de GPTs personalizados ChatGPT dos construtores estão abertos. Na verdade, algumas delas poderiam ser úteis para melhorar a atividade dos cientistas de dados.

Este artigo discutirá 7 GPTs da GPT Store que podem melhorar seu fluxo de trabalho de ciência de dados. O que são esses GPTs? Vamos entrar no assunto.

Como observação lateral, eu usaria o Conjunto de dados de rotatividade de telecomunicações do Kaggle como um exemplo de conjunto de dados para uso dos GPTs.

Vamos começar com o que as equipes do ChatGPT criaram para nós, o Analista de Dados. Este é o GPT Personalizado, treinado explicitamente para analisar nossos dados e visualizá-los conforme necessário. Ao descartar o arquivo, como arquivos CSV, e fornecer o prompt sobre o que precisamos, o Analista de Dados GPT pode fazer o trabalho automaticamente.

Por exemplo, peço ao analista de dados que desenvolva uma análise de correlação de rotatividade a partir do conjunto de dados que forneço a ele. 

 

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados
Analista de Dados realiza análise de correlação (Imagem do Autor)
 

Você pode solicitar análises adicionais ao Analista de Dados GPT. Você também pode usar o GPT para fornecer todo o código para execução, se necessário.

O próximo GPT que discutiremos é o GPT de aprendizado de máquina. Este GPT personalizado foi projetado como um assistente para qualquer atividade de aprendizado de máquina e ciência de dados. A utilidade inclui discutir, aprender e desenvolver algoritmos adequados para nossos projetos de dados.

Por exemplo, peço ao GPT de aprendizado de máquina que execute o desenvolvimento de modelo a partir de nosso conjunto de dados de exemplo para prever a rotatividade. Aqui está o resultado.

 

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados
Machine Learning realiza experimentos de modelo (imagem do autor)
 

O GPT pode fornecer uma ótima comparação entre os modelos utilizados. Se continuarmos, podemos pedir ao modelo para iterar com mais modelos, realizar o ajuste de hiperparâmetros e pedir ao GPT que forneça os motivos de cada ação.

Semelhante à entrada anterior, o Engenheiro de aprendizado de máquina GPT fornece aos usuários um assistente para desenvolver o modelo de aprendizado de máquina. Você pode colocar seu conjunto de dados e pedir ao GPT que forneça as etapas essenciais e o código completo.

O que diferencia o Machine Learning Engineer é que seu GPT especifica o design de modelos para automatizar tarefas complexas, especialmente para implantação de modelos. O GPT é bom para você discutir como deseja estruturar seu modelo e como deve ser a implantação do modelo em produção.

Falando em estruturação de modelos, o GPT também é adequado para nos ajudar a estruturar nosso código para modelagem de aprendizado de máquina. Um dos melhores assistentes de codificação que encontrei é o AutoExpert. É um GPT projetado para ajudá-lo como um assistente de programador de pares constante.

O GPT foi desenvolvido com capacidade adicional de geração de código, acesso online às APIs mais recentes e comandos personalizados para salvar o estado da sua sessão, que você pode usar na sessão posterior, se necessário.

Usar este GPT ajudaria você a gerar o código complexo para qualquer finalidade necessária durante a atividade de ciência de dados. Ele também fornece a estrutura do código e o script para ajudá-lo a executá-los melhor.

Vamos passar da parte técnica da codificação e passar para a teórica. Como sabemos, os trabalhos de ciência de dados tratam de aprendizagem contínua, especialmente em novos casos de uso. Com a crescente pesquisa em ciência de dados, às vezes é difícil encontrar a pesquisa perfeita que possa ajudar nossos casos de uso. É aqui que AcadêmicoGPT .

Este GPT ajudaria você a encontrar os artigos de pesquisa mais recentes para nossos casos de uso. A partir de um simples prompt, nos daria uma seleção dos artigos mais recentes relacionados ao problema que queremos resolver.

Por exemplo, o texto abaixo é o resultado do ScholarGPT, onde carreguei nosso conjunto de dados e pedi que me fornecessem um artigo de pesquisa relacionado à previsão de rotatividade.

Título: “Transparência na tomada de decisões: o papel da IA ​​explicável (XAI) na análise de rotatividade de clientes”

  • Autores: CÖZKURT
  • Ano: 2024
  • Resumo: Este estudo centra-se na previsão da perda de clientes e na explicação das razões por detrás da perda através da aprendizagem automática, examinando especificamente a rotatividade de clientes no setor das telecomunicações através de uma análise rigorosa.
  • link: Leia o papel?fonte?.

O ScholarGPT oferece muito mais artigos de pesquisa para você escolher, para que você possa selecionar qual se aplica aos seus casos de uso.

O próximo GPT que discutiríamos é o Diagrama lunático. Para muitas atividades de ciência de dados, nem sempre se trata de pesquisa e desenvolvimento de modelos. Muitas vezes precisamos visualizar nosso fluxo de trabalho e explicar como seria nosso trabalho. É aqui que o Whimsical Diagrams GPT pode ajudá-lo.

Este GPT foi projetado para explicar e visualizar conceitos com fluxogramas, mapas mentais e diagramas de sequência. Fornecer o prompt e a fonte de dados que temos pode nos ajudar a fornecer uma visualização que ajudaria em nosso trabalho.

Por exemplo, pedi ao modelo que me fornecesse um diagrama de sugestões do conjunto de dados de rotatividade e ele sugeriu a visualização da rotatividade pelos recursos. Abaixo está o resultado da imagem.

 

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados
Rotação pelos recursos (imagem gerada pelo Whimsical Diagram GPT)
 

Você pode discutir mais com o GPT para encontrar o fluxo de trabalho do diagrama perfeito para os trabalhos de ciência de dados.

O último é o Canva GPT, o que poderia nos ajudar a comunicar nossos resultados. Como sabemos, o Canva é uma plataforma de serviço que ajuda a criar tudo, desde logotipos até fotos de perfil, banners e apresentações. Com o Canva GPT, eles podem nos auxiliar na obtenção do melhor design para nossa análise.

A ciência de dados tem tudo a ver com comunicar nossos resultados a outras pessoas, por isso é essencial ter resultados válidos que sejam apresentados de uma forma que o público possa entender. Com o Canva GPT, podemos pedir sugestões sobre qual design é adequado. Por exemplo, pedi ao modelo que me fornecesse um design perfeito para apresentar as estatísticas de rotatividade.

 

7 GPTs para ajudar a melhorar seu fluxo de trabalho de ciência de dados
Seleção de design de estatística de rotatividade (Canva GPT)
 

O GPT nos daria as opções de design e poderíamos escolher qual preferimos ou fornecer instruções adicionais para obter outros designs.

Este artigo discute sete GPTs personalizados disponíveis no armazenamento de GPTs que podem melhorar nosso fluxo de trabalho de ciência de dados; eles são:

  1. Analista de Dados por ChatGPT
  2. Aprendizado de Máquina por Maryam Eskandari
  3. Engenheiro de aprendizado de máquina da Hustle Playground
  4. AutoExpert (Desenvolvedor) Por llmimagineers.com
  5. ScholarGPT por awesomegpts.ai
  6. Diagramas caprichosos por whimsical.com
  7. Canva por canva.com

Espero que ajude! Você tem alguma sugestão de GPT que deveria estar nesta lista? Dê-los nos comentários também.
 
 

Cornélio Yudha Wijaya é gerente assistente de ciência de dados e redator de dados. Enquanto trabalhava em período integral na Allianz Indonésia, ele adora compartilhar dicas sobre Python e dados nas mídias sociais e na mídia escrita.

local_img

Inteligência mais recente

local_img