Zephyrnet Logo

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise – KDnuggets

Data:

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise

Que tipo de análise de dados a IA pode fazer?

Já conhecemos o ChatGPT como a ferramenta de IA mais versátil, com plugins que permitem fazer praticamente qualquer coisa. Pode gerar código funcional em Python, R e muitas outras linguagens, bem como consultas SQL complexas. Como você pode imaginar, a combinação dessas funcionalidades permitiria usar IA para praticamente todas as partes do seu trabalho de análise de dados.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Os casos de uso incluem:

  • Consultando
  • Limpeza e outros processamentos
  • Visualizando

Quando se trata de trabalhar com dados, ferramentas especializadas como Júlio AI (para arquivos csv) ou BlazeSQL (para bancos de dados SQL) são projetados especificamente para essa finalidade. Ao contrário do ChatGPT, essas ferramentas não exigem que você carregue/conecte e explique seus dados sempre que abri-los.

ChatGPT funciona para análises rápidas em um arquivo csv, mas a maioria das empresas armazena dados em bancos de dados SQL dentro de redes privadas. No entanto, ferramentas especializadas podem se conectar a esses bancos de dados SQL seguros e responder às suas perguntas consultando seu banco de dados e visualizando os resultados.

Como a IA poderia substituir os analistas de dados?

A análise de dados tem tudo a ver com a obtenção de insights de dados. Analistas de dados e cientistas de dados são aqueles com as habilidades técnicas para fornecer às partes interessadas os insights de que precisam. Mas as coisas mudaram e agora as ferramentas de IA podem concluir com êxito algumas das tarefas que antes só podiam ser realizadas por analistas e cientistas de dados.

Em teoria, um interveniente empresarial sem competências técnicas poderia agora ligar os seus dados a uma ferramenta de IA e fazer um pedido como “Obter a receita mensal agrupada por produto, para os 3 principais produtos do ano”. A IA pode então capturar os dados e até mesmo visualizá-los. O usuário só precisaria gastar alguns segundos escrevendo a solicitação. Se tivessem perguntado a um colega humano, talvez demorassem alguns dias ou mais para obter uma resposta.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Ver uma imagem como essa pode ser incrível e preocupante para analistas de dados, mas substituir analistas e cientistas de dados não é tão simples. Simplesmente executar uma consulta SQL e representar graficamente o resultado é apenas uma parte do seu trabalho, e mesmo isso nem sempre pode ser feito de forma confiável pela IA. Pode ter funcionado na captura de tela acima, mas e se o resultado estiver errado, mesmo que pareça bom?

Parece que é hora de falar sobre algumas limitações da IA ​​para trabalhar com dados.

Limitação nº 1: alucinações de IA

A maioria das pessoas que trabalharam com ChatGPT e ferramentas semelhantes já ouviram o termo “alucinação” neste contexto. Quando você pergunta sobre algo que eles não sabem, às vezes eles vão apenas invente coisas.

A razão para essas alucinações é simples: os LLMs são como algoritmos de preenchimento automático muito avançados. Eles devolvem o provavelmente próxima mensagem em uma conversa, com base nos dados em que foram treinados. Graças a conjuntos de dados de alta qualidade e técnicas de treinamento avançadas, esse “preenchimento automático” funciona tão bem que essas ferramentas podem atender solicitações complexas com resultados de qualidade extremamente alta. Infelizmente, quando eles se deparam com situações para as quais seus dados de treinamento não os prepararam, o provavelmente próxima mensagem pode não fazer muito sentido.

E se ele gerar algum código que seja executado, mas o código retornar os dados errados? As partes interessadas do negócio que usam o AI Data Analyst podem não ter ideia de que o resultado está errado, mas não conseguem ver o erro, pois não entendem o código.

Limitação nº 2: informações comerciais.

Normalmente, quando um novo analista de dados começa a trabalhar em uma empresa, ele terá que aprender o que significam algumas colunas e valores. Isso ocorre porque o modelo de dados foi projetado pela empresa. Você não pode simplesmente analisar dados sem entender de onde eles vêm, porque o conhecimento comum não é suficiente para compreender a maioria dos bancos de dados.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Ferramentas de IA como BlazeSQL permitem incluir essas informações para uso da IA, mas será necessário um analista de dados ou cientista de dados para mantê-las atualizadas.

Limitação nº 3: às vezes, a IA simplesmente fica presa. Também conhecido como “pontos cegos”

Você deve ter visto exemplos de ChatGPT travando em uma questão muito básica. Essas perguntas costumam ser muito fáceis de responder, mas exigem que a IA raciocine de uma forma na qual não é muito boa.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Podemos chamar esses casos de “pontos cegos”, e eles também existem para escrever código. Ex. Um ponto cego comum que a IA tem para gerar consultas SQL é o uso de subconsultas. Os modelos de IA geralmente geram consultas que tentam selecionar uma coluna de uma subconsulta, mesmo que essa coluna não exista na subconsulta.

WITH recent_orders AS ( SELECT customer_id, MAX(order_date) AS latest_order_date FROM orders GROUP BY customer_id
)
SELECT customer_id, product_id, -- (This column is not defined in the subquery) latest_order_date
FROM recent_orders

 

Mesmo quando o erro é apontado, muitas vezes eles cometem o mesmo erro ao tentar novamente.

Limitação nº 4: os modelos de IA concordam demais

Os modelos de IA tenderão a concordar com você, mesmo quando você estiver errado. Isso pode ser um grande problema quando o modelo de IA deveria desempenhar o papel de um especialista, já que um especialista deveria ser capaz de corrigi-lo quando você estiver errado.
 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise

Limitação nº 5: comprimento de entrada

Um ser humano pode passar meses aprendendo sobre um projeto e o banco de dados, reunindo muitas informações importantes. Um LLM, por outro lado, normalmente tem um “limite de token”, o que significa que só pode receber uma certa quantidade de entrada.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Este comprimento de entrada (também conhecido como “limite de token”) costuma ser restritivo quando se trata de tarefas complexas. Como você poderia resumir esses meses de aprendizado em algumas páginas e encaixá-los no modelo de IA?

A versão amplamente disponível do GPT-4 é limitada a páginas 12 de entrada + saída. Lembre-se de que um analista de dados participará de horas de reuniões e lerá documentações ou relatórios. Toda a saída (código e explicação do GPT-4) precisa ser subtraída das 12 páginas, pois o limite inclui a saída, não apenas a entrada.

Isso significa que um grande projeto de análise de dados que exija muito aprendizado e exploração simplesmente não é viável.

Limitação nº 6: habilidades interpessoais

Por último, mas não menos importante, ChatGPT e outros chatbots de IA são… apenas chatbots. A interação humana e as habilidades interpessoais são uma grande parte do trabalho em projetos de dados. Seja para ganhar confiança, lidar com a política do escritório ou interpretar a comunicação não-verbal. Esses elementos são cruciais para uma colaboração bem-sucedida com as partes interessadas e a conclusão de um projeto.

Qual é o próximo?

Como você pode ver, a IA tem uma série de limitações que a impedem de ser uma analista de dados totalmente capaz. A lista acima contém apenas algumas das principais limitações, mas existem muitos outros grandes obstáculos quando se trata de substituir um especialista em dados. Em outras palavras, você não precisa se preocupar com a IA substituindo você!

Dito isso, A IA já está tendo um impacto significativo em analistas e cientistas de dados. Pode não ser perfeito, mas já está agregando um valor incrível.

Trabalhando mais rápido com IA

Escrever código, seja Python, SQL ou R, pode consumir muito tempo. Essas ferramentas de IA podem não ser 100% precisas, mas ainda funcionam bem na maior parte do tempo. Muitas vezes é 10 vezes mais rápido revisar rapidamente o que eles geraram do que fazer tudo do zero.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Nos casos em que a IA tem dificuldades ou comete erros frequentemente, pode ser mais rápido fazê-lo do zero. Em outros casos, o enorme aumento na produtividade compensa o esforço ocasional de depuração. O importante é experimentar diferentes ferramentas, aprender seus pontos fortes e fracos e integrá-los adequadamente ao seu fluxo de trabalho.

E o futuro?

As coisas estão progredindo extremamente rápido, então algumas das limitações atuais não serão necessariamente um fator importante por muito tempo. Isto é especialmente verdade agora que as ferramentas de IA estão a ser utilizadas por tantas pessoas, uma vez que aprender com seus usuários. Essas interações são usadas para treinar os modelos e ocorrem milhões de interações todos os dias.

ChatGPT tem a base de usuários que mais cresce de todos os tempos e ele aprende com essa base de usuários.

 

IA versus analistas de dados: as 6 principais limitações que impactam o futuro da análise
 

Com concorrentes como Claude, Bard e outros se juntando à corrida, veremos algumas melhorias enormes em breve.

Estar preparado para essas mudanças é simples, basta ficar atento às novas ferramentas e experimentá-las. Dessa forma, você conhecerá seus pontos fortes e fracos e poderá ter certeza de que está aproveitando a tecnologia mais recente e se adaptando à medida que ela evolui.

Por falar nisso, algumas ferramentas para ficar de olho incluem:

BlazeSQL (para bancos de dados SQL)

Análise avançada de dados ChatGPT (Para csv e outros arquivos)

Pandas IA (adicionando IA generativa à biblioteca do pandas)
 
 

Justus Mulli é cientista de dados e fundador, com experiência em finanças, saúde e comércio eletrônico. Ele aproveita sua experiência em ciência de dados e IA para implementar soluções disruptivas de IA em vários setores e profissões.

local_img

VC Acadêmico

Café VC

Inteligência mais recente

local_img