Λογότυπο Zephyrnet

The Promise of Edge AI και Approaches for Effective Adoption – KDnuggets

Ημερομηνία:

The Promise of Edge AI και Approaches for Effective Adoption
Εικόνα από Editor
 

Το τρέχον τεχνολογικό τοπίο βιώνει μια κομβική στροφή προς τον υπολογισμό αιχμής, που υποκινείται από τις γρήγορες εξελίξεις στη γενετική τεχνητή νοημοσύνη (GenAI) και στον παραδοσιακό φόρτο εργασίας της τεχνητής νοημοσύνης. Ιστορικά εξαρτημένοι από το cloud computing, αυτοί οι φόρτοι εργασίας τεχνητής νοημοσύνης αντιμετωπίζουν τώρα τα όρια της τεχνητής νοημοσύνης που βασίζεται σε σύννεφο, συμπεριλαμβανομένων ανησυχιών σχετικά με την ασφάλεια των δεδομένων, την κυριαρχία και τη συνδεσιμότητα δικτύου.

Δουλεύοντας γύρω από αυτούς τους περιορισμούς της τεχνητής νοημοσύνης που βασίζεται σε σύννεφο, οι οργανισμοί προσπαθούν να αγκαλιάσουν τον υπολογισμό αιχμής. Η ικανότητα του Edge computing να επιτρέπει την ανάλυση και τις απαντήσεις σε πραγματικό χρόνο στο σημείο όπου δημιουργούνται και καταναλώνονται δεδομένα είναι ο λόγος για τον οποίο οι οργανισμοί το θεωρούν κρίσιμο για την καινοτομία AI και την επιχειρηματική ανάπτυξη.

Με την υπόσχεσή του για ταχύτερη επεξεργασία με μηδενικό έως ελάχιστο λανθάνον χρόνο, το edge AI μπορεί να μεταμορφώσει δραματικά τις αναδυόμενες εφαρμογές. Ενώ οι δυνατότητες υπολογιστικών συσκευών αιχμής βελτιώνονται ολοένα και περισσότερο, εξακολουθούν να υπάρχουν περιορισμοί που μπορούν να κάνουν δύσκολη την εφαρμογή μοντέλων τεχνητής νοημοσύνης υψηλής ακρίβειας. Τεχνολογίες και προσεγγίσεις όπως η κβαντοποίηση μοντέλων, η εκμάθηση μίμησης, η κατανεμημένη εξαγωγή συμπερασμάτων και η διαχείριση κατανεμημένων δεδομένων μπορούν να βοηθήσουν στην άρση των φραγμών σε πιο αποτελεσματικές και οικονομικά αποδοτικές αναπτύξεις τεχνητής νοημοσύνης, ώστε οι οργανισμοί να αξιοποιήσουν τις πραγματικές τους δυνατότητες. 

Το συμπέρασμα της τεχνητής νοημοσύνης στο cloud συχνά επηρεάζεται από ζητήματα λανθάνοντος χρόνου, προκαλώντας καθυστερήσεις στη μετακίνηση δεδομένων μεταξύ συσκευών και περιβαλλόντων cloud. Οι οργανισμοί συνειδητοποιούν το κόστος της μετακίνησης δεδομένων μεταξύ των περιοχών, στο σύννεφο και εμπρός και πίσω από το νέφος στην άκρη. Μπορεί να εμποδίσει εφαρμογές που απαιτούν εξαιρετικά γρήγορες αποκρίσεις σε πραγματικό χρόνο, όπως οικονομικές συναλλαγές ή συστήματα βιομηχανικής ασφάλειας. Επιπλέον, όταν οι οργανισμοί πρέπει να εκτελούν εφαρμογές που τροφοδοτούνται με AI σε απομακρυσμένες τοποθεσίες όπου η συνδεσιμότητα δικτύου είναι αναξιόπιστη, το cloud δεν είναι πάντα προσβάσιμο. 

Οι περιορισμοί μιας στρατηγικής τεχνητής νοημοσύνης «μόνο στο σύννεφο» γίνονται ολοένα και πιο εμφανείς, ειδικά για εφαρμογές επόμενης γενιάς με τεχνητή νοημοσύνη που απαιτούν γρήγορες αποκρίσεις σε πραγματικό χρόνο. Ζητήματα όπως ο λανθάνοντας χρόνος δικτύου μπορεί να επιβραδύνουν τις πληροφορίες και τους συλλογισμούς που μπορούν να παραδοθούν στην εφαρμογή στο cloud, οδηγώντας σε καθυστερήσεις και αυξημένο κόστος που σχετίζεται με τη μετάδοση δεδομένων μεταξύ των περιβαλλόντων cloud και edge. Αυτό είναι ιδιαίτερα προβληματικό για εφαρμογές σε πραγματικό χρόνο, ειδικά σε απομακρυσμένες περιοχές με διακοπτόμενη συνδεσιμότητα δικτύου. Καθώς η τεχνητή νοημοσύνη βρίσκεται στο επίκεντρο της λήψης αποφάσεων και του συλλογισμού, η φυσική της μετακίνησης δεδομένων μπορεί να είναι εξαιρετικά δαπανηρή με αρνητικό αντίκτυπο στα επιχειρηματικά αποτελέσματα. 

Gartner προβλέπει ότι περισσότερο από το 55% όλων των αναλύσεων δεδομένων από βαθιά νευρωνικά δίκτυα θα πραγματοποιηθεί στο σημείο σύλληψης σε ένα σύστημα αιχμής έως το 2025, από λιγότερο από 10% το 2021. Ο υπολογισμός άκρων συμβάλλει στην άμβλυνση της καθυστέρησης, της επεκτασιμότητας, της ασφάλειας δεδομένων, της συνδεσιμότητας και περισσότερες προκλήσεις, αναδιαμορφώνοντας τον τρόπο χειρισμού της επεξεργασίας δεδομένων και, με τη σειρά του, επιταχύνοντας την υιοθέτηση της τεχνητής νοημοσύνης. Η ανάπτυξη εφαρμογών με προσέγγιση εκτός σύνδεσης θα είναι κρίσιμη για την επιτυχία των ευέλικτων εφαρμογών.

Με μια αποτελεσματική στρατηγική αιχμής, οι οργανισμοί μπορούν να αποκτήσουν μεγαλύτερη αξία από τις εφαρμογές τους και να λαμβάνουν επιχειρηματικές αποφάσεις πιο γρήγορα.

Καθώς τα μοντέλα τεχνητής νοημοσύνης γίνονται όλο και πιο εξελιγμένα και οι αρχιτεκτονικές εφαρμογών γίνονται πιο περίπλοκες, η πρόκληση της ανάπτυξης αυτών των μοντέλων σε συσκευές αιχμής με υπολογιστικούς περιορισμούς γίνεται πιο έντονη. Ωστόσο, οι εξελίξεις στην τεχνολογία και οι εξελισσόμενες μεθοδολογίες ανοίγουν το δρόμο για την αποτελεσματική ενσωμάτωση ισχυρών μοντέλων τεχνητής νοημοσύνης εντός του πλαισίου υπολογιστών αιχμής που κυμαίνονται από: 

Συμπίεση και κβαντοποίηση μοντέλου

Τεχνικές όπως το κλάδεμα μοντέλων και η κβαντοποίηση είναι ζωτικής σημασίας για τη μείωση του μεγέθους των μοντέλων τεχνητής νοημοσύνης χωρίς να διακυβεύεται σημαντικά η ακρίβειά τους. Το κλάδεμα μοντέλων εξαλείφει περιττές ή μη κρίσιμες πληροφορίες από το μοντέλο, ενώ η κβαντοποίηση μειώνει την ακρίβεια των αριθμών που χρησιμοποιούνται στις παραμέτρους του μοντέλου, καθιστώντας τα μοντέλα ελαφρύτερα και ταχύτερα στην εκτέλεση σε συσκευές με περιορισμένους πόρους. Η κβαντοποίηση μοντέλων είναι μια τεχνική που περιλαμβάνει τη συμπίεση μεγάλων μοντέλων τεχνητής νοημοσύνης για τη βελτίωση της φορητότητας και τη μείωση του μεγέθους του μοντέλου, καθιστώντας τα μοντέλα πιο ελαφριά και κατάλληλα για ανάπτυξη ακμών. Χρησιμοποιώντας τεχνικές λεπτομέρειας, συμπεριλαμβανομένης της Γενικευμένης Κβαντοποίησης μετά την Εκπαίδευση (GPTQ), της Προσαρμογής Χαμηλής Κατάταξης (LoRA) και της Κβαντισμένης LoRA (QLoRA), η κβαντοποίηση μοντέλων μειώνει την αριθμητική ακρίβεια των παραμέτρων του μοντέλου, καθιστώντας τα μοντέλα πιο αποτελεσματικά και προσβάσιμα για συσκευές άκρων όπως tablet, edge gateway και κινητά τηλέφωνα. 

Πλαίσια τεχνητής νοημοσύνης ειδικά για τις άκρες

Η ανάπτυξη πλαισίων τεχνητής νοημοσύνης και βιβλιοθηκών ειδικά σχεδιασμένων για υπολογιστές αιχμής μπορεί να απλοποιήσει τη διαδικασία ανάπτυξης φόρτου εργασίας τεχνητής νοημοσύνης αιχμής. Αυτά τα πλαίσια είναι βελτιστοποιημένα για τους υπολογιστικούς περιορισμούς του υλικού άκρων και υποστηρίζουν αποτελεσματική εκτέλεση μοντέλων με ελάχιστη επιβάρυνση απόδοσης.

Βάσεις δεδομένων με διαχείριση κατανεμημένων δεδομένων

Με δυνατότητες όπως διανυσματική αναζήτηση και αναλύσεις σε πραγματικό χρόνο, συμβάλλουν στην κάλυψη των λειτουργικών απαιτήσεων του edge και υποστηρίζουν τοπική επεξεργασία δεδομένων, χειρισμό διαφόρων τύπων δεδομένων, όπως ήχο, εικόνες και δεδομένα αισθητήρων. Αυτό είναι ιδιαίτερα σημαντικό σε εφαρμογές σε πραγματικό χρόνο, όπως το λογισμικό αυτόνομων οχημάτων, όπου συλλέγονται συνεχώς διαφορετικοί τύποι δεδομένων και πρέπει να αναλύονται σε πραγματικό χρόνο.

Κατανεμημένη συμπερασματοποίηση

Η τοποθέτηση μοντέλων ή φόρτου εργασίας σε συσκευές πολλαπλών άκρων με τοπικά δείγματα δεδομένων χωρίς πραγματική ανταλλαγή δεδομένων μπορεί να μετριάσει πιθανά ζητήματα συμμόρφωσης και απορρήτου δεδομένων. Για εφαρμογές, όπως οι έξυπνες πόλεις και το βιομηχανικό IoT, που περιλαμβάνουν πολλές συσκευές αιχμής και IoT, είναι σημαντικό να λαμβάνεται υπόψη η διανομή συμπερασμάτων. 

Ενώ η τεχνητή νοημοσύνη έχει υποβληθεί κυρίως σε επεξεργασία στο cloud, η εύρεση ισορροπίας με το πλεονέκτημα θα είναι κρίσιμη για την επιτάχυνση των πρωτοβουλιών τεχνητής νοημοσύνης. Οι περισσότερες, αν όχι όλες, οι βιομηχανίες έχουν αναγνωρίσει την τεχνητή νοημοσύνη και το GenAI ως ανταγωνιστικό πλεονέκτημα, γι' αυτό η συγκέντρωση, η ανάλυση και η γρήγορη απόκτηση γνώσεων στην αιχμή θα είναι όλο και πιο σημαντική. Καθώς οι οργανισμοί εξελίσσουν τη χρήση της τεχνητής νοημοσύνης τους, η εφαρμογή κβαντοποίησης μοντέλων, πολυτροπικών δυνατοτήτων, πλατφορμών δεδομένων και άλλων στρατηγικών αιχμής θα συμβάλει στην επίτευξη ουσιαστικών επιχειρηματικών αποτελεσμάτων σε πραγματικό χρόνο.
 
 

Ραχούλ Πραντάν είναι Αντιπρόεδρος Προϊόντος και Στρατηγικής στην Couchbase (NASDAQ: BASE), πάροχος μιας κορυφαίας σύγχρονης βάσης δεδομένων για εταιρικές εφαρμογές από τις οποίες εξαρτάται το 30% του Fortune 100. Η Rahul έχει πάνω από 20 χρόνια εμπειρίας στην ηγεσία και τη διαχείριση ομάδων μηχανικών και προϊόντων που εστιάζουν σε βάσεις δεδομένων, αποθήκευση, δικτύωση και τεχνολογίες ασφάλειας στο cloud. Πριν από την Couchbase, ηγήθηκε της ομάδας Διαχείρισης Προϊόντων και Επιχειρηματικής Στρατηγικής για τα τμήματα Emerging Technologies και Midrange Storage της Dell EMC για να φέρει στην αγορά όλα τα προϊόντα flash NVMe, Cloud και SDS.

spot_img

Τελευταία Νοημοσύνη

spot_img