Logo Zephyrnet

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi – KDnuggets

Data:

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi

Che tipo di analisi dei dati può fare l’intelligenza artificiale?

Conosciamo già ChatGPT come lo strumento AI più versatile, con plugin che gli consentono di fare praticamente qualsiasi cosa. Può generare codice funzionante in Python, R e molti altri linguaggi, nonché query SQL complesse. Come puoi immaginare, la combinazione di queste funzionalità ti consentirebbe di utilizzare l'intelligenza artificiale per quasi ogni parte del tuo lavoro di analisi dei dati.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

I casi d'uso includono:

  • Interrogazione
  • Pulitura e altre lavorazioni
  • Visualizzare

Quando si tratta di lavorare con i dati, strumenti specializzati come Giulio AI (per file CSV) o BlazeSQL (per database SQL) sono progettati specificamente per questo scopo. A differenza di ChatGPT, questi strumenti non richiedono che tu carichi/connetti e spieghi i tuoi dati ogni volta che li apri.

ChatGPT funziona per una rapida analisi su un file CSV, ma la maggior parte delle aziende archivia i dati in database SQL all'interno di reti private. Tuttavia strumenti specializzati possono connettersi a questi database SQL protetti e rispondere alle tue domande interrogando il tuo database e visualizzando i risultati.

In che modo l’intelligenza artificiale potrebbe sostituire gli analisti di dati?

L'analisi dei dati consiste nell'ottenere approfondimenti dai dati, gli analisti di dati e i data scientist sono quelli con le competenze tecniche per fornire alle parti interessate le informazioni di cui hanno bisogno. Ma le cose sono cambiate e ora gli strumenti di intelligenza artificiale possono completare con successo alcune delle attività che in precedenza potevano essere completate solo da analisti e data scientist.

In teoria, un stakeholder aziendale senza competenze tecniche potrebbe ora collegare i propri dati a uno strumento di intelligenza artificiale e fare una richiesta del tipo “Ottieni le entrate mensili raggruppate per prodotto, per i 3 principali prodotti dell’anno”. L’intelligenza artificiale può quindi acquisire i dati e persino visualizzarli. L'utente dovrebbe dedicare solo pochi secondi a scrivere la richiesta. Se avessero chiesto a un collega umano, forse non avrebbero ottenuto una risposta per alcuni giorni, o anche di più.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Vedere un'immagine come questa può essere allo stesso tempo sorprendente e preoccupante per gli analisti di dati, ma sostituire analisti e data scientist non è così semplice. È sufficiente eseguire una query SQL e rappresentare graficamente il risultato solo una parte del loro lavoro, e anche questo non può essere sempre fatto in modo affidabile dall'intelligenza artificiale. Potrebbe aver funzionato nello screenshot qui sopra, ma cosa succede se il risultato è sbagliato anche se sembra ok?

Sembra che sia giunto il momento di parlare di alcune limitazioni dell'intelligenza artificiale per lavorare con i dati.

Limitazione n. 1: allucinazioni dell'intelligenza artificiale

La maggior parte delle persone che hanno lavorato con ChatGPT e strumenti simili hanno sentito il termine “allucinazione” in questo contesto. Quando chiedi loro qualcosa che non sanno, a volte lo faranno basta inventare cose.

Il motivo di queste allucinazioni è semplice: gli LLM sono come algoritmi di completamento automatico molto avanzati. Restituiscono il molto probabilmente il prossimo messaggio in una conversazione, sulla base dei dati su cui sono stati formati. Grazie a set di dati di alta qualità e tecniche di formazione avanzate, questo “completamento automatico” funziona così bene che questi strumenti possono soddisfare richieste complesse con risultati di qualità notevolmente elevata. Sfortunatamente, quando incontrano situazioni per le quali i loro dati di allenamento non li hanno preparati, il molto probabilmente il prossimo messaggio potrebbe non avere molto senso in realtà.

Cosa succede se genera del codice che viene eseguito, ma il codice restituisce i dati errati? Gli stakeholder aziendali che utilizzano AI Data Analyst potrebbero non avere idea che il risultato sia sbagliato, ma non riescono a vedere l'errore poiché non comprendono il codice.

Limitazione n. 2: informazioni commerciali.

Di solito, quando un nuovo analista di dati inizia a lavorare in un'azienda, dovrà imparare il significato di alcune colonne e valori. Questo perché il modello dati è stato progettato dall'azienda. Non puoi semplicemente analizzare i dati senza capire da dove provengono, perché la conoscenza comune non è sufficiente per comprendere la maggior parte dei database.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Gli strumenti di intelligenza artificiale come BlazeSQL ti consentono di includere queste informazioni affinché l'intelligenza artificiale possa utilizzarle, ma sarà richiesto un analista di dati o uno scienziato di dati per mantenerli aggiornati.

Limitazione n. 3: a volte l'IA si blocca. AKA “Punti ciechi”

Potresti aver visto esempi di ChatGPT bloccato su una domanda molto semplice. A queste domande è spesso molto facile rispondere, ma richiedono che l'IA ragioni in un modo in cui non è molto brava.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Possiamo chiamare questi casi “punti ciechi” e esistono anche per scrivere codice. Ex. Un punto cieco comune dell'intelligenza artificiale per la generazione di query SQL è l'utilizzo di sottoquery. I modelli AI spesso generano query che tentano di selezionare una colonna da una sottoquery, anche se tale colonna non esiste nella sottoquery.

WITH recent_orders AS ( SELECT customer_id, MAX(order_date) AS latest_order_date FROM orders GROUP BY customer_id
)
SELECT customer_id, product_id, -- (This column is not defined in the subquery) latest_order_date
FROM recent_orders

 

Anche quando viene segnalato l’errore, spesso commetteranno lo stesso errore riprovando.

Limitazione n. 4: i modelli di intelligenza artificiale concordano troppo

I modelli di intelligenza artificiale tenderanno a essere d'accordo con te, anche quando hai torto. Questo può essere un grosso problema quando si suppone che il modello di intelligenza artificiale svolga il ruolo di un esperto, poiché un esperto dovrebbe essere in grado di correggerti quando sbagli.
 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi

Limitazione n. 5: lunghezza immessa

Un essere umano potrebbe trascorrere mesi imparando a conoscere un progetto e il database, raccogliendo molte informazioni importanti. Un LLM invece ha tipicamente un “limite di token”, il che significa che può richiedere solo una certa quantità di input.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Questa lunghezza di input (nota anche come "limite token") è spesso restrittiva quando si tratta di attività complesse. Come potresti distillare quei mesi di apprendimento in poche pagine e inserirli nel modello di intelligenza artificiale?

La versione ampiamente disponibile di GPT-4 è limitata a pagine 12 di ingresso+uscita. Tieni presente che un analista di dati parteciperà a ore di riunioni e leggerà documentazione o report. Tutto l'output (codice e spiegazione da GPT-4) deve essere sottratto dalle 12 pagine, poiché il limite include l'output, non solo l'input.

Ciò significa che un importante progetto di analisi dei dati che richiede molto apprendimento ed esplorazione semplicemente non è fattibile.

Limitazione n. 6: competenze trasversali

Ultimo ma sicuramente non meno importante, ChatGPT e altri chatbot AI sono... solo chatbot. L'interazione umana e le competenze trasversali sono una parte importante del lavoro su progetti di dati. Che si tratti di guadagnare fiducia, affrontare la politica aziendale o interpretare la comunicazione non verbale. Questi elementi sono cruciali per collaborare con successo con le parti interessate e completare un progetto.

Qual è il prossimo passo?

Come puoi vedere, l’intelligenza artificiale presenta una serie di limitazioni che le impediscono di essere un analista di dati pienamente capace. L'elenco precedente contiene solo alcune delle principali limitazioni, ma ci sono molti altri grossi ostacoli quando si tratta di sostituire effettivamente un esperto di dati. In altre parole, non devi preoccuparti che l'intelligenza artificiale ti sostituisca!

Detto ciò, L’intelligenza artificiale sta già avendo un impatto significativo sugli analisti e sui data scientist. Potrebbe non essere perfetto, ma offre già un valore incredibile.

Lavorare più velocemente con l'intelligenza artificiale

Scrivere codice, sia esso Python, SQL o R, può richiedere molto tempo. Questi strumenti di intelligenza artificiale potrebbero non essere accurati al 100%, ma funzionano comunque bene per la maggior parte del tempo. Spesso è 10 volte più veloce rivedere rapidamente ciò che hanno generato rispetto a fare tutto da zero.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Nei casi in cui l’IA ha difficoltà o commette spesso errori, potrebbe essere più veloce farlo semplicemente da zero. In altri casi, il massiccio aumento della produttività vale lo sforzo occasionale di debug. L'importante è sperimentare diversi strumenti, apprenderne i punti di forza e di debolezza e integrarli di conseguenza nel proprio flusso di lavoro.

E il futuro?

Le cose stanno progredendo in modo estremamente rapido, quindi alcune delle limitazioni attuali non rimarranno necessariamente un fattore a lungo. Ciò è particolarmente vero ora che gli strumenti di intelligenza artificiale vengono utilizzati da così tante persone, come loro imparare dai propri utenti. Queste interazioni vengono utilizzate per addestrare i modelli e ci sono milioni di interazioni ogni giorno.

ChatGPT ha la base utenti in più rapida crescita di tutti i tempi e impara da quella base di utenti.

 

AI vs analisti di dati: i 6 principali limiti che influiscono sul futuro dell'analisi
 

Con concorrenti come Claude, Bard e altri che si uniscono alla gara, siamo destinati a vedere presto enormi miglioramenti.

Essere preparati a questi cambiamenti è semplice, basta tenere gli occhi aperti per i nuovi strumenti e sperimentarli. In questo modo conoscerai i loro punti di forza e di debolezza e potrai assicurarti di sfruttare la tecnologia più recente e di adattarti man mano che si evolve.

A questo proposito, alcuni strumenti da tenere d'occhio includono:

BlazeSQL (per database SQL)

ChatGPT Analisi avanzata dei dati (Per CSV e altri file)

IA dei panda (aggiungendo l'intelligenza artificiale generativa alla libreria panda)
 
 

Giusto Mulli è un data scientist e fondatore, con esperienza nei settori della finanza, della sanità e dell'e-commerce. Sfrutta la sua esperienza nella scienza dei dati e nell'intelligenza artificiale per implementare soluzioni di intelligenza artificiale dirompenti in vari settori e professioni.

spot_img

L'ultima intelligenza

spot_img