Logo Zephyrnet

Pro, contro e limiti dell'IA e dell'apprendimento automatico nel software antivirus

Data:

Quando si tratta di software antivirus, alcuni fornitori considerano l'apprendimento automatico come il proiettile d'argento del malware, ma quanta verità c'è in queste affermazioni?

Nel post di oggi, daremo un'occhiata a come viene utilizzato l'apprendimento automatico nei software antivirus e se è davvero la soluzione di sicurezza perfetta.

Come funziona l'apprendimento automatico?

Nel settore antivirus, l'apprendimento automatico viene in genere utilizzato per migliorare le capacità di rilevamento di un prodotto. Mentre la tecnologia di rilevamento convenzionale si basa su regole di codifica per rilevare modelli dannosi, gli algoritmi di apprendimento automatico costruiscono un modello matematico basato su dati di esempio per prevedere se un file è "buono" o "cattivo".

In termini semplici, ciò implica l'uso di un algoritmo per analizzare i punti di dati osservabili di due set di dati creati manualmente: uno che include solo file dannosi e uno che include solo file non dannosi.

L'algoritmo sviluppa quindi regole che gli consentono di distinguere i file buoni da quelli cattivi, senza che venga data alcuna direzione su quali tipi di pattern o punti dati cercare. Un punto dati è qualsiasi unità di informazione relativa a un file, inclusa la struttura interna di un file, il compilatore utilizzato, le risorse di testo compilate nel file e molto altro.

L'algoritmo continua a calcolare e ottimizzare il suo modello fino a quando non finisce con un preciso sistema di rilevamento che (idealmente) non classifica i programmi buoni come cattivi e quelli cattivi come buoni. Sviluppa il suo modello modificando il peso o l'importanza di ciascun punto dati. Con ogni iterazione, il modello migliora leggermente nel rilevare con precisione file dannosi e non dannosi.

Scarica ora: versione di prova gratuita di Emsisoft Anti-Malware.

Software antivirus dei maggiori esperti di ransomware al mondo. Ottieni la tua prova gratuita oggi.
Provalo ora

L'apprendimento automatico può aiutare a rilevare nuovi malware

L'apprendimento automatico consente al software antivirus di rilevare nuove minacce senza fare affidamento sulle firme. In passato, il software antivirus si basava in gran parte sull'impronta digitale, che funziona facendo riferimento a file incrociati contro un enorme database di malware noto.

Il principale difetto qui è che i controllori di firma possono rilevare solo malware che è stato visto in precedenza. Questo è un punto cieco piuttosto grande, dato che centinaia di migliaia di nuove varianti di malware vengono create ogni giorno.

L'apprendimento automatico, d'altra parte, può essere addestrato per riconoscere i segni di file buoni e cattivi, consentendogli di identificare schemi dannosi e rilevare malware - indipendentemente dal fatto che sia stato visto prima o meno.

I limiti dell'apprendimento automatico

Mentre l'apprendimento automatico può essere uno strumento molto efficace, la tecnologia ha i suoi limiti.

Potenziale di sfruttamento

Uno dei punti deboli chiave dell'apprendimento automatico è che non comprende le implicazioni del modello che crea, ma semplicemente lo fa. Utilizza semplicemente il metodo più efficiente e provato matematicamente per elaborare i dati e prendere decisioni.

Come notato in precedenza, l'algoritmo è alimentato con milioni di punti dati, ma senza che nessuno gli dica specificamente quali punti dati sono indicatori di malware. Questo dipende dal modello di apprendimento automatico da scoprire da solo.

Il risultato è che nessun essere umano può mai veramente sapere quali punti dati potrebbero - secondo il modello di apprendimento automatico - indicare una minaccia. Potrebbe essere un singolo punto dati o una combinazione specifica di 20 punti dati. Un utente malintenzionato motivato potrebbe potenzialmente scoprire come il modello utilizza questi parametri per identificare una minaccia e utilizzarla a proprio vantaggio. La modifica di un punto dati specifico e apparentemente non pertinente in un file dannoso potrebbe essere sufficiente per ingannare il modello nella classificazione del malware come sicuro e compromettere l'intero modello.

Per risolvere il problema, il fornitore dovrebbe aggiungere il file manipolato al set di dati e ricalcolare l'intero modello, il che potrebbe richiedere giorni o settimane. Sfortunatamente, ciò non risolveva ancora il problema di fondo: anche dopo la ricostruzione del modello, sarebbe solo questione di tempo prima che l'attaccante trovasse un altro punto dati o una combinazione di punti dati che potesse essere utilizzato per ingannare il sistema di apprendimento automatico.

Questo è esattamente quello che è successo a luglio 2019, quando i ricercatori di Skylight Cyber ​​hanno scoperto che un popolare prodotto di sicurezza basato sull'intelligenza artificiale aveva ha autorizzato alcuni file per evitare l'attivazione di falsi positivi. Le stringhe di codice in questi file nella whitelist hanno avuto molto peso nel sistema di calcolo del punteggio dell'algoritmo, il che significa che erano quasi garantiti per ignorare il naturale processo decisionale dell'algoritmo. Quando il modello ha rilevato il codice contenuto nei file della whitelist, ha contrassegnato il file come sicuro, anche se è stato incorporato in un file altrimenti dannoso. Di conseguenza, i ricercatori sono stati in grado di minare l'algoritmo semplicemente prendendo stringhe di codice da un file di gioco autorizzato non dannoso e allegandole a un file dannoso.

Come notato dai ricercatori, questo tipo di attacco non sarebbe stato possibile se il prodotto avesse utilizzato tecnologie di protezione aggiuntive come uno scanner di firme, che non si basa su algoritmi o euristiche, che rilevano minacce basate sul comportamento piuttosto che sui parametri di un file.

Richiede un set di dati ampio e ben etichettato

I sistemi di apprendimento automatico sono validi solo come i dati forniti. La formazione di un modello efficace richiede un numero enorme di input di dati, ognuno dei quali deve essere correttamente etichettato. Queste etichette aiutano il modello a comprendere alcune caratteristiche dei dati (ad esempio se un file è pulito, dannoso o potenzialmente indesiderato).

Tuttavia, la capacità del modello di apprendere in modo efficace dipende dal set di dati perfettamente etichettato, che può essere difficile e dispendioso in termini di risorse. Un singolo input etichettato erroneamente tra milioni di punti dati perfettamente etichettati potrebbe non sembrare un grosso problema, ma se il modello utilizza l'input etichettato erroneamente per prendere una decisione, può causare errori che vengono quindi utilizzati come base per l'apprendimento futuro. Questo crea un effetto a palla di neve che può avere ripercussioni significative più in basso.

Un approccio stratificato alla sicurezza informatica

L'apprendimento automatico è una tecnologia potente che potrebbe svolgere un ruolo sempre più importante nel mondo della sicurezza informatica negli anni a venire. Tuttavia, come menzionato sopra, ha i suoi difetti e limiti. Affidarsi a un software antivirus basato esclusivamente sull'intelligenza artificiale o sull'apprendimento automatico può renderti vulnerabile a malware e altre minacce.

Le soluzioni che utilizzano una combinazione di tecnologie di protezione forniranno probabilmente una sicurezza migliore rispetto a un prodotto interamente basato sull'IA. Per esempio, Emsisoft sfrutta il potere dell'intelligenza artificiale e dell'apprendimento automatico, nonché di altre tecnologie di protezione come l'analisi comportamentale e i controlli delle firme. Questi sistemi lavorano in sinergia per raddoppiare e triplicare il controllo reciproco dei risultati al fine di offrire la migliore protezione da malware possibile.

Adottare un approccio a più livelli di sicurezza ti consente di evitare di mettere tutte le uova nello stesso paniere e massimizza le tue possibilità di bloccare il malware prima che possa infettare il tuo sistema.

Scarica ora: versione di prova gratuita di Emsisoft Anti-Malware.

Software antivirus dei maggiori esperti di ransomware al mondo. Ottieni la tua prova gratuita oggi.
Provalo ora

Scarica ora: versione di prova gratuita di Emsisoft Anti-Malware.

*** Questo è un blog sindacato di Security Bloggers Network di Emsisoft | Blog sulla sicurezza scritto da Jareth. Leggi il post originale su: https://blog.emsisoft.com/en/35668/the-pros-cons-and-limitations-of-ai-and-machine-learning-in-antivirus-software/

Fonte: https://securityboulevard.com/2020/03/the-pros-cons-and-limitations-of-ai-and-machine-learning-in-antivirus-software/

spot_img

L'ultima intelligenza

spot_img

Parla con noi

Ciao! Come posso aiutarla?