Logotip Zephyrnet

Obljuba Edge AI in pristopi za učinkovito sprejemanje – KDnuggets

Datum:

Obljuba Edge AI in pristopi za učinkovito sprejemanje
Slika urednika
 

Trenutna tehnološka pokrajina doživlja ključni premik k robnemu računalništvu, ki ga spodbuja hiter napredek generativnega umetne inteligence (GenAI) in tradicionalnih delovnih obremenitev umetne inteligence. Te delovne obremenitve umetne inteligence, ki so bile v preteklosti odvisne od računalništva v oblaku, se zdaj srečujejo z mejami umetne inteligence v oblaku, vključno s pomisleki glede varnosti podatkov, suverenosti in omrežne povezljivosti.

Če organizacije zaobidejo te omejitve umetne inteligence v oblaku, si želijo sprejeti robno računalništvo. Zmožnost robnega računalništva, da omogoči analizo in odzive v realnem času na točki, kjer so podatki ustvarjeni in porabljeni, je razlog, zakaj ga organizacije vidijo kot ključnega pomena za inovacije AI in rast poslovanja.

S svojo obljubo hitrejše obdelave z ničelno do minimalno zakasnitvijo lahko robna umetna inteligenca dramatično spremeni nastajajoče aplikacije. Medtem ko se računalniške zmogljivosti robnih naprav vse bolj izboljšujejo, še vedno obstajajo omejitve, ki lahko otežijo izvajanje zelo natančnih modelov AI. Tehnologije in pristopi, kot so kvantizacija modela, učenje imitacije, porazdeljeno sklepanje in upravljanje porazdeljenih podatkov, lahko pomagajo odstraniti ovire za učinkovitejše in stroškovno učinkovite uvedbe robne umetne inteligence, tako da lahko organizacije izkoristijo svoj pravi potencial. 

Na sklepanje AI v oblaku pogosto vplivajo težave z zakasnitvijo, ki povzročajo zamude pri prenosu podatkov med napravami in oblačnimi okolji. Organizacije se zavedajo stroškov premikanja podatkov med regijami v oblak ter naprej in nazaj iz oblaka na rob. Lahko ovira aplikacije, ki zahtevajo izjemno hitre odzive v realnem času, kot so finančne transakcije ali industrijski varnostni sistemi. Poleg tega, ko morajo organizacije izvajati aplikacije, ki jih poganja AI, na oddaljenih lokacijah, kjer je omrežna povezljivost nezanesljiva, oblak ni vedno dosegljiv. 

Omejitve strategije umetne inteligence »samo v oblaku« postajajo vse bolj očitne, zlasti za aplikacije naslednje generacije, ki jih poganja AI, ki zahtevajo hitre odzive v realnem času. Težave, kot je omrežna zakasnitev, lahko upočasnijo vpoglede in razmišljanje, ki jih je mogoče dostaviti aplikaciji v oblaku, kar povzroči zamude in povečane stroške, povezane s prenosom podatkov med oblakom in robnimi okolji. To je še posebej problematično za aplikacije v realnem času, zlasti na oddaljenih območjih z občasno omrežno povezljivostjo. Ker ima umetna inteligenca osrednjo vlogo pri odločanju in razmišljanju, je fizika premikanja podatkov lahko izjemno draga in negativno vpliva na poslovne rezultate. 

Gartner napoveduje, da se bo do leta 55 več kot 2025 % vseh analiz podatkov z globokimi nevronskimi mrežami zgodilo na točki zajema v robnem sistemu, medtem ko je leta 10 znašal manj kot 2021 %. Robno računalništvo pomaga zmanjšati zakasnitev, razširljivost, varnost podatkov, povezljivost in več izzivov, preoblikovanje načina obdelave podatkov in posledično pospeševanje sprejemanja umetne inteligence. Za uspeh agilnih aplikacij bo ključnega pomena razvoj aplikacij s pristopom, ki temelji na prvi brez povezave.

Z učinkovito robno strategijo lahko organizacije pridobijo več vrednosti iz svojih aplikacij in hitreje sprejemajo poslovne odločitve.

Ker postajajo modeli umetne inteligence vse bolj izpopolnjeni in arhitektura aplikacij postaja vse bolj zapletena, postaja izziv uvajanja teh modelov na robne naprave z računalniškimi omejitvami vse bolj izrazit. Vendar pa napredek v tehnologiji in razvijajoče se metodologije utirajo pot za učinkovito integracijo zmogljivih modelov umetne inteligence v okviru robnega računalništva, ki segajo od: 

Kompresija in kvantizacija modela

Tehnike, kot sta obrezovanje in kvantizacija modela, so ključne za zmanjšanje velikosti modelov AI, ne da bi bistveno ogrozili njihovo natančnost. Obrezovanje modela odstrani odvečne ali nekritične informacije iz modela, medtem ko kvantizacija zmanjša natančnost števil, uporabljenih v parametrih modela, zaradi česar so modeli lažji in hitrejši za izvajanje na napravah z omejenimi viri. Kvantizacija modela je tehnika, ki vključuje stiskanje velikih modelov umetne inteligence za izboljšanje prenosljivosti in zmanjšanje velikosti modela, zaradi česar so modeli lažji in primernejši za uporabo na robu. Z uporabo tehnik natančnega uravnavanja, vključno s splošno kvantizacijo po usposabljanju (GPTQ), prilagoditvijo nizkega ranga (LoRA) in kvantizirano LoRA (QLoRA), kvantizacija modela zmanjša numerično natančnost parametrov modela, zaradi česar so modeli učinkovitejši in dostopnejši za robne naprave, kot je tablice, robni prehodi in mobilni telefoni. 

Ogrodja umetne inteligence, specifična za robove

Razvoj ogrodij in knjižnic umetne inteligence, posebej zasnovanih za robno računalništvo, lahko poenostavi postopek uvajanja delovnih obremenitev robne umetne inteligence. Ta ogrodja so optimizirana za računalniške omejitve robne strojne opreme in podpirajo učinkovito izvajanje modela z minimalnimi stroški delovanja.

Baze podatkov s porazdeljenim upravljanjem podatkov

Z zmožnostmi, kot sta vektorsko iskanje in analitika v realnem času, pomagajo izpolniti operativne zahteve Edge in podpirajo lokalno obdelavo podatkov, obravnavanje različnih vrst podatkov, kot so zvok, slike in podatki senzorjev. To je še posebej pomembno pri aplikacijah v realnem času, kot je programska oprema za avtonomna vozila, kjer se nenehno zbirajo različni tipi podatkov in jih je treba analizirati v realnem času.

Porazdeljeno sklepanje

Ki postavlja modele ali delovne obremenitve v več robnih naprav z lokalnimi vzorci podatkov brez dejanske izmenjave podatkov, lahko ublaži morebitne težave s skladnostjo in zasebnostjo podatkov. Za aplikacije, kot so pametna mesta in industrijski internet stvari, ki vključujejo veliko robnih naprav in naprav interneta stvari, je distribucijsko sklepanje ključnega pomena, ki ga je treba upoštevati. 

Medtem ko se umetna inteligenca večinoma obdeluje v oblaku, bo iskanje ravnotežja z robom ključnega pomena za pospeševanje pobud za umetno inteligenco. Večina, če ne kar vse, industrije je prepoznala AI in GenAI kot konkurenčno prednost, zato bo zbiranje, analiziranje in hitro pridobivanje vpogledov na robu vedno bolj pomembno. Ko bodo organizacije razvijale svojo uporabo umetne inteligence, bo uvedba kvantizacije modela, večmodalnih zmogljivosti, podatkovnih platform in drugih robnih strategij pomagala doseči pomembne poslovne rezultate v realnem času.
 
 

Rahul Pradhan je podpredsednik produkta in strategije pri Couchbase (NASDAQ: BASE), ponudniku vodilne sodobne baze podatkov za poslovne aplikacije, od katere je odvisnih 30 % Fortune 100. Rahul ima več kot 20 let izkušenj z vodenjem in upravljanjem inženirskih in produktnih skupin, ki se osredotočajo na baze podatkov, shranjevanje, mreženje in varnostne tehnologije v oblaku. Pred Couchbaseom je vodil skupino za upravljanje izdelkov in poslovno strategijo za oddelke za nastajajoče tehnologije in pomnilnik srednjega razreda družbe Dell EMC, da bi na trg predstavil vse izdelke flash NVMe, Cloud in SDS.

spot_img

Najnovejša inteligenca

spot_img