Logo Zephyrnet

MLOps è un'altra terminologia ridondante?

Data:

Questo articolo è stato pubblicato come parte di Blogathon sulla scienza dei dati.

Introduzione

MLOp? Molte persone hanno appena finito di digerire il significato di DevOps, ed ecco che arriva un nuovo termine, MLOps. Ma coloro che capiscono il MLOps mhat, ma conosci il significato dell'apprendimento automatico e DevOps, quindi unisci i due significati insieme e sei a posto. Le persone che avranno problemi a comprendere il termine MLOps saranno quelle che inizialmente non afferrano il concetto di DevOps. Qui in questo articolo, illustrerò l'idea di MLOps in modo che non avrai necessariamente bisogno della conoscenza di DevOps.

Sinceramente, a volte, penso che le terminologie in tecnologia stiano diventando eccessive. Forse è perché la sfera della tecnologia è artificiale, quindi le cose si moltiplicano facilmente e diventano complesse rispetto al mondo naturale, dove anche una piccola mutazione deve richiedere miliardi di anni. A volte penso che forse se tutte le terminologie sono raccolte e organizzate, alcune non saranno necessarie in quanto saranno ridondanti. La tecnologia è un mercato, quindi ogni marchio sta cercando di essere unico, causando una palude di terminologie.

Cos'è MLOps?

MLOps è un breve termine per le operazioni di apprendimento automatico. Basta vederlo letteralmente. Sono semplicemente le attività (operazioni) coinvolte nell'apprendimento automatico, tranne per il fatto che è accuratamente progettato per soddisfare gli standard del settore in modo più efficiente. Crea un metodo standard per lo sviluppo di modelli ML dall'inizio alla fine fino alla distribuzione e alla manutenzione. Il motivo principale di MLOps è l'integrazione. Non solo costruire modelli, ma avere una collaborazione tra i professionisti del ML e il mondo della tecnologia in generale.

Questa unione tra la pratica del machine learning e il mondo esterno diventa un approccio molto utile per creare soluzioni di machine learning e intelligenza artificiale. Ora consente inoltre ai data scientist e agli ingegneri dell'apprendimento automatico di collaborare e migliorare il modo in cui vengono sviluppati nuovi modelli e vengono mantenuti quelli vecchi.

modello di riqualificazione
Azure ML + Azure DevOps gestisce i set di dati, gli esperimenti, i modelli e le applicazioni basate su ML.

Le linee guida e le migliori pratiche presentate in MLOps aiutano a fornire un'atmosfera che migliora sistematicamente il normale ciclo di vita dell'apprendimento automatico. Dal momento che il ML è fatto per migliorare la vita umana, ci deve essere un modo per introdurlo in varie opere della vita. È qui che gli ingegneri ML stringono la mano con l'IT e vari altri campi tecnologici. È solo una fusione di DevOps e ML.

Possiamo anche vedere MLOps come una divisione del lavoro. Invece di preoccuparsi della creazione di modelli dall'inizio all'implementazione e persino della manutenzione e delle esigenze del settore, l'ingegnere del ML si concentra solo sul ML. Si unisce a "Ops" o al solito sistema DevOps.

Perché MLOp?

Possiamo vedere i sistemi di Machine Learning nelle attività di gruppo, tra cui raccolta dati, elaborazione, progettazione di funzionalità, etichettatura, progettazione di modelli, formazione e ottimizzazione, distribuzione e manutenzione. Solo le ultime due fasi sono quelle in cui il modello lascia finalmente l'ambiente sperimentale e tocca lo scopo per cui era stato avviato. Invece di consentire all'ingegnere ML di farlo da solo, MLOps aiuta da qui a fornire una transizione e una manutenzione più fluide. Immagina che l'ingegnere ML si preoccupi anche del controllo della versione? MLOps semplifica tutto e riduce i tempi di sviluppo.

MLOps copre varie discipline di conseguenza, aiutando le aziende ad avere un flusso di lavoro efficiente ed evitando molte sfide legate allo sviluppo. Secondo la ricerca, solo poche aziende di ML lo hanno utilizzato in modo efficace.

Sfide MLOps

I modelli di apprendimento automatico si stanno impegnando in uno spazio molto dinamico. Le variabili assumono molte possibilità e forme. I dati in entrata sono continui e richiedono più attenzione rispetto alle operazioni di hard coding. Nonostante ciò, è stata data relativamente poca attenzione alla pratica dei MLOps. La maggior parte dei principianti deve ancora iniziare ad apprendere i concetti e gli esperti stanno ancora cercando di adattarsi, il che rende difficile rafforzare questo nuovo standard.

Vantaggi di MLOps

I principali vantaggi degli MLOps sono semplicemente lo sviluppo di sistemi ML più efficienti, scalabili e controllati. Le promesse di ML diventano facilmente realistiche in questa operazione standardizzata. Ha creato una pipeline che incoraggia i data team a risparmiare tempo di sviluppo ottenendo al contempo sistemi ad alte prestazioni. I test continui, ad esempio, anche i sistemi distribuiti possono essere ridimensionati per soddisfare automaticamente le nuove esigenze. Proviamo a individuare alcuni vantaggi in più di MLOps.

Controllo di Versione

Il controllo della versione è un'attività normale nei sistemi software. Anche in quest'area i dati ei modelli sviluppati richiederanno il controllo delle versioni. L'introduzione di nuovi dati nel sistema dopo la distribuzione di un modello potrebbe anche essere modificata in modo eccellente in quanto viene utilizzata come nuovi dati o unita alla cronologia. Questo può essere fatto tramite metadati e altri mezzi. Per alcuni sistemi l'unione dei vecchi dati può avere senso e in altri potrebbe non esserlo. In entrambi i casi, MLOps fornirà una via d'uscita.

Lavorare in squadra

Invece di consentire all'ingegnere ML di lavorare separatamente e all'altro spazio di integrazione di lavorare separatamente, i due possono lavorare in modo più organizzato. Ciò previene molti problemi e migliora l'efficienza.

Convalida di dati e modelli

Lo scienziato ora ha un team più grande per verificare e convalidare i risultati dei modelli prima che vengano implementati, quando vengono distribuiti e dopo che sono stati distribuiti. La convalida non solo scopre la verità. Può anche offrire nuove possibilità. Anche i dati presentati agli ingegneri ML possono essere adeguatamente convalidati dagli MLOps.

Condutture ML

Vediamo la pipeline di machine learning da questo punto e come entra in gioco MLOps. MLOps vede più ML dall'utente come può essere utilizzato al meglio in produzione.

Raccolta dei dati e portata del problema

Ciò comporta il primo passaggio di ML. I dati devono essere accuratamente riconosciuti, non solo come dati, ma anche in base all'ambito o al dominio del problema. A parte il solito vantaggio di questo passaggio in ML, questo può essere ulteriormente migliorato per salvare altri problemi come evitare le paludi di dati. Sebbene siano necessari molti dati per il ML, ora gestiamo questa esigenza con attenzione ed evitiamo altre sfide.

Verifica e convalida dei dati

Nella verifica, controlliamo se i dati sono completi, in un buon formato, organizzati, puliti, ecc.; in validazione, confermiamo comunque se soddisfa le esigenze del mondo esterno. Questi sono decisamente importanti per evitare perdite di tempo.

Specificazione ed estrazione delle caratteristiche

Invece di limitarci a consumare, possiamo selezionare le funzionalità che meglio si adattano agli obiettivi. Potrebbe non essere necessario tutto per la previsione, il clustering o l'ottimizzazione finali. Qui potresti scoprire la necessità di pulire ulteriormente i dati.

Configurazione interna

Un sistema robusto, che è l'obiettivo di MLOps, dovrebbe avere una comunicazione efficiente tra i suoi sottosistemi e i sistemi esterni.

codifica

I codici dovrebbero anche seguire le migliori pratiche. Invece di codificare semplicemente come un modello ML naturale, consideriamo altre arti che supporteranno anche l'obiettivo MLOps. Il modo di codificare dovrebbe facilitare una buona documentazione e test e integrazione automatici.

Gestione dei progetti

qui seguiamo un processo per garantire che la pipeline ML raggiunga tutti gli obiettivi del progetto entro i vincoli indicati. Ciò avviene attraverso la documentazione del progetto e tutti gli altri scritti di report creati all'inizio del processo di sviluppo e durante tutto il ciclo di vita del progetto.

Controllo

Infine la fase di monitoraggio. Il modello è collegato a un sottosistema per il monitoraggio per garantire che sia impostata una piattaforma sufficiente per supervisionare il modello distribuito e il dominio che serve. Di seguito è riportata un'istanza di un monitor di set di dati chiamato Shapash.

Monitor Shapash

Conclusione

Siamo stati in grado di vedere i concetti di MLOps da una prospettiva chiara. Con tutti i vantaggi presentati sopra, pensi che MLOps sia solo un'altra terminologia tecnologica ridondante? Anche se è importante, a prima vista potrebbe non entrare rapidamente nella tua mente, ma ormai dovresti essere in grado di vedere che MLOps è arrivato e molto probabilmente diventerà più avanzato dell'idea iniziale di DevOps. C'è un'affermazione che ModelOps è la categoria principale mentre MLOps è un sottoinsieme. MLOps si concentra sull'operazionalizzazione dei modelli ML, mentre ModelOps copre l'operazionalizzazione di tutti i tipi di modelli di intelligenza artificiale. AIOps è anche un altro cosiddetto caso "Ops" di sistemi in Operations. Di recente sono sorte così tante operazioni e molte altre ne verranno ancora.

Le prelibatezze chiave:

  • MLOps è un breve termine per le operazioni di apprendimento automatico. Basta vederlo letteralmente. Sono semplicemente le attività (operazioni) coinvolte nell'apprendimento automatico, tranne per il fatto che è accuratamente progettato per soddisfare gli standard del settore in modo più efficiente.
  • MLOps copre varie discipline di conseguenza, aiutando le aziende ad avere un flusso di lavoro efficiente ed evitando molte sfide legate allo sviluppo. Secondo la ricerca, solo poche aziende di ML lo hanno utilizzato in modo efficace.
  • I modelli di apprendimento automatico si stanno impegnando in uno spazio molto dinamico. Le variabili assumono molte possibilità e forme. I dati sono continui e richiedono più attenzione rispetto alle operazioni di hard coding.
  • I principali vantaggi degli MLOps sono semplicemente lo sviluppo di sistemi ML più efficienti, scalabili e controllati.

I media mostrati in questo articolo non sono di proprietà di Analytics Vidhya e vengono utilizzati a discrezione dell'autore.

spot_img

L'ultima intelligenza

spot_img

Parla con noi

Ciao! Come posso aiutarla?