Logotip Zephyrnet

Simulacija napak za varnost z umetno inteligenco. Inovacije pri preverjanju – Semiwiki

Datum:

Več avtomobilske vsebine 😀

V sodobnih avtomobilih varnost urejajo tako funkcije, ki temeljijo na AI, kot tradicionalna logika in programska oprema. Kako je mogoče te funkcije oceniti glede na napake za analizo FMEDA? Paul Cunningham (GM, Verification at Cadence), Raúl Camposano (Silicon Catalyst, podjetnik, nekdanji tehnični direktor Synopsysa in zdaj Silvaco CTO) in jaz nadaljujemo našo serijo raziskovalnih idej. Kot vedno so povratne informacije dobrodošle.

Simulacija napak za ocenjevanje varnosti z umetno inteligenco

Inovacije

Izbira tega meseca je SiFI-AI: hitro in prilagodljivo ogrodje za simulacijo napak RTL, prilagojeno za modele in pospeševalnike AI. Ta članek je bil objavljen leta 2023 na simpoziju Velikih jezer o VLSI. Avtorji so iz Karlsruhe Institute of Technology, Nemčija.

ISO 26262 zahteva varnostno analizo, ki temelji na metodah FMEDA z uporabo simulacije napak za oceno občutljivosti kritičnih funkcij na prehodne in sistematične napake ter učinkovitosti logike ublažitve za zaščito pred napakami. Analiza se začne z razumevanjem strokovnjakov za načrtovanje, katera vedenja na visoki ravni morajo biti zagotovljena skupaj s tem, katere realne napake bi lahko povzročile napake v teh vedenjih.

To strokovno znanje in izkušnje je že razumljivo za običajno logiko in programsko opremo, vendar še ne za modele AI (nevronske mreže) in pospeševalnike, na katerih delujejo. Varnostni inženirji potrebujejo pomoč pri raziskovanju načinov okvar in učinkov v komponentah umetne inteligence, da vedo, kje in kako poškodovati modele in strojno opremo. Poleg tega mora ta analiza potekati s praktično hitrostjo na velikih modelih, ki so običajni za DNN. Avtorji predlagajo novo tehniko, za katero pravijo, da deluje veliko hitreje od trenutnih metod.

Pavlov pogled

Zanimiv in zanimiv dokument, ki spodbuja razmišljanje: kako ocenjujete tveganje naključnih napak strojne opreme v pospeševalniku AI, ki se uporablja za pomoč vozniku ali avtonomno vožnjo? Sklepanje z umetno inteligenco je samo po sebi statistična metoda, zato določanje razmerja med naključnim bitnim preobratom nekje v pospeševalniku in nepravilnim sklepanjem ni trivialno.

Ta članek predlaga gradnjo sistema, ki lahko "zamenja" pravo RTL simulacijo ene plasti nevronske mreže, sicer čistega programskega sklepanja tega omrežja v PyTorchu. Napako je mogoče vnesti v plast, ki se simulira RTL, da se oceni vpliv te napake na celotno operacijo sklepanja.

Avtorji prikazujejo svojo metodo na odprtokodnem pospeševalniku umetne inteligence Gemmini, ki poganja omrežja za klasifikacijo slik ResNet-18 in GoogLeNet. Opazujejo, da ima vsak element polja pospeševalnika Gemmini 3 registre (aktivacija vnosa, utež in delna vsota) in signal za izbiro uteži, skupaj 4 možne vrste napak, ki jih je treba vnesti. Izvajajo 1.5 milijona poskusov sklepanja, pri čemer v vsakega vnesejo naključno napako, pri čemer preverjajo, ali je prva prva razvrstitev iz omrežja napačna. Njihov čas delovanja je impresivnih 1-krat hitrejši od prejšnjega dela, njihovi grafikoni pa potrjujejo intuitivno pričakovanje, da so napake v prejšnjih slojih omrežja bolj vplivne kot tiste v globljih slojih.

Prav tako je iz njihovih podatkov jasno, da je določena oblika varnostnega mehanizma strojne opreme (npr. trojno glasovanje) upravičena, saj je absolutna verjetnost napake pri klasifikaciji top-1 2–8 % za napake v prvih 10 slojih omrežja. To je previsoko za izkušnjo varne vožnje!

Raúlov pogled

Glavni prispevek SiFI-AI je simulacija prehodnih napak v pospeševalnikih DNN, ki združuje hitro sklepanje AI s ciklično natančno simulacijo RTL in vbrizgavanjem napak na podlagi stanja. To je 7-krat hitreje od najsodobnejšega stanja tehnike (referenca 2, Condia et al, Združevanje arhitekturne simulacije in vbrizgavanja napak programske opreme za hitro in natančno oceno zanesljivosti CNN na grafičnih procesorjih). Trik je v tem, da simuliramo samo tisto, kar je potrebno v počasnem ciklično natančnem RTL. Modelirane napake so motnje pri enem dogodku (SEU), tj. prehodni bitni preobrati, ki jih povzročijo zunanji učinki, kot so sevanje in nabiti delci, ki trajajo do naslednje operacije pisanja. Ugotoviti, ali bo ena napaka povzročila napako, je v tem primeru še posebej težko; visoka stopnja ponovne uporabe podatkov bi lahko povzročila znatno širjenje napak, simulacija napak pa mora upoštevati tako arhitekturo strojne opreme kot topologijo modela DNN.

SiFI-AI integrira simulacijo strojne opreme v okvir ML (PyTorch). Za strojno simulacijo uporablja Verilator, brezplačen in odprtokodni simulator Verilog, za ustvarjanje ciklično natančnih modelov RTL. Krmilnik napak upravlja vnašanje napak po navodilih uporabnika z uporabo pristopa, ki temelji na pogojih, tj. seznama pogojev, ki preprečujejo, da bi bila napaka prikrita. Če želite izbrati, kateri del je simuliran v RTL, razgradi plasti v manjše ploščice na podlagi "lastnosti plasti, strategijo polaganja zank, postavitev pospeševalnika in ustrezno napako” in izbere ploščico.

Naprava, preizkušena v eksperimentalnem delu, je Gemmini, pospeševalnik sistoličnega niza DNN, ustvarjen na UC Berkeley v projektu Chipyard, v konfiguraciji 16×16 procesorskih elementov (PE). SiFI-AI izvaja študijo odpornosti z 1.5 milijona poskusi vstavljanja napak na dveh tipičnih delovnih obremenitvah DNN, ResNet-18 in GoogLeNet. Napake se vnesejo v tri podatkovne registre PE in en krmilni signal, kot ga določi uporabnik. Rezultati kažejo majhno verjetnost napake, kar potrjuje odpornost DNN-jev. Prav tako kažejo, da imajo napake krmilnega signala veliko večji vpliv kot napake podatkovnega signala in da so široke in plitke plasti bolj dovzetne kot ozke in globoke plasti.

To je dober dokument, ki napreduje na področju vrednotenja zanesljivosti DNN. Prispevek je dobro napisan in jasen ter vsebuje dovolj podrobnosti in referenc, ki podpirajo trditve in rezultate. Čeprav je osnovna ideja združevanja simulacije na različnih ravneh stara, jo avtorji uporabljajo zelo učinkovito. Ogrodja, kot je SciFI-AI, lahko pomagajo oblikovalcem in raziskovalcem optimizirati njihove arhitekture in jih narediti bolj odporne. Všeč mi je tudi analiza vpliva napake na različne plasti in signale, ki razkrije nekaj zanimivih spoznanj. Prispevek bi lahko izboljšali z zagotavljanjem več informacij o strategiji vnosa napak in izbiri ploščic. Kljub temu, da je tema precej specifična, je na splošno zelo prijeten članek!

Delite to objavo prek:

spot_img

Najnovejša inteligenca

spot_img