Zephyrnet-logo

Feilsimulering for AI-sikkerhet. Innovasjon i verifikasjon – Semiwiki

Dato:

Mer bilinnhold 😀

I moderne biler styres sikkerheten like mye av AI-baserte funksjoner som av tradisjonell logikk og programvare. Hvordan kan disse funksjonene feilgraderes for FMEDA-analyse? Paul Cunningham (GM, Verification at Cadence), Raúl Camposano (Silicon Catalyst, gründer, tidligere Synopsys CTO og nå Silvaco CTO) og jeg fortsetter serien vår om forskningsideer. Som alltid, tilbakemeldinger velkommen.

Feilsimulering for AI-sikkerhetsgradering

Innovasjonen

Denne månedens valg er SiFI-AI: Et raskt og fleksibelt RTL-feilsimuleringsrammeverk skreddersydd for AI-modeller og akseleratorer. Denne artikkelen ble publisert i 2023 Great Lakes Symposium on VLSI. Forfatterne er fra Karlsruhe Institute of Technology, Tyskland.

ISO 26262 krever sikkerhetsanalyse basert på FMEDA-metoder som bruker feilsimulering for å vurdere følsomheten til kritiske funksjoner for forbigående og systematiske feil, og effektiviteten til avbøtende logikk for å beskytte mot feil. Analyse starter med at designeksperter forstår hvilken adferd på høyt nivå som må garanteres sammen med hvilke realistiske feil som kan spre feil i denne atferden.

Denne ekspertkunnskapen er allerede kjent for konvensjonell logikk og programvare, men ennå ikke for AI-modeller (nevrale nett) og akseleratorene de kjører på. Sikkerhetsingeniører trenger hjelp til å utforske feilmoduser og effekter i AI-komponenter for å vite hvor og hvordan de skal feile modeller og maskinvare. Videre må analysen kjøre i praktiske hastigheter på de store modellene som er felles for DNN-er. Forfatterne foreslår en ny teknikk som de sier går mye raskere enn dagens metoder.

Paulus syn

En tankevekkende og spennende artikkel: hvordan vurderer du risikoen for tilfeldige maskinvarefeil i en AI-akselerator som brukes til førerassistanse eller autonom kjøring? AI-inferens er i seg selv en statistisk metode, så det er ikke-trivielt å bestemme forholdet mellom en tilfeldig bitflip et sted i akseleratoren og en feilaktig slutning.

Denne artikkelen foreslår å bygge et system som kan "bytte inn" en ekte RTL-simulering av et enkelt lag av et nevralt nettverk, en ellers ren programvarebasert slutning av det nettverket i PyTorch. En feil kan injiseres inn i laget som RTL-simuleres for å vurdere virkningen av denne feilen på den totale slutningsoperasjonen.

Forfatterne demonstrerer metoden deres på Gemmini åpen kildekode AI-akselerator som kjører ResNet-18 og GoogLeNet bildeklassifiseringsnettverk. De observerer at hvert element i Gemmini-akselerator-arrayet har 3 registre (inngangsaktivering, vekt og delsum) og et vektvalgsignal, sammen 4 mulige feiltyper å injisere. De kjører 1.5 millioner slutningseksperimenter, hver med en tilfeldig feil injisert, og sjekker om topp-1-klassifiseringen ut av nettverket er feil. Kjøretiden deres er imponerende 7 ganger raskere enn tidligere arbeid, og diagrammene deres bekrefter den intuitive forventningen om at feil i tidligere lag av nettverket er mer virkningsfulle enn de i dypere lag.

Det er også klart fra dataene deres at en eller annen form for maskinvaresikkerhetsmekanisme (f.eks. trippelstemmegivning) er berettiget siden den absolutte sannsynligheten for en topp-1 klassifiseringsfeil er 2-8 % for feil i de første 10 lagene av nettverket. Det er alt for høyt for en trygg kjøreopplevelse!

Raúl syn

Hovedbidraget til SiFI-AI er å simulere forbigående feil i DNN-akseleratorer som kombinerer rask AI-inferens med syklusnøyaktig RTL-simulering og tilstandsbasert feilinjeksjon. Dette er 7 ganger raskere enn den nyeste teknologien (referanse 2, Condia et al, Kombinerer arkitektonisk simulering og programvarefeilinjeksjon for en rask og nøyaktig CNN-pålitelighetsevaluering på GPUer). Trikset er å simulere bare det som er nødvendig i sakte syklus-nøyaktig RTL. De modellerte feilene er single-event upset (SEU), dvs. forbigående bit-flips indusert av eksterne effekter som stråling og ladede partikler, som vedvarer til neste skriveoperasjon. Å finne ut om en enkelt feil vil forårsake en feil er spesielt vanskelig i dette tilfellet; den høye graden av gjenbruk av data kan føre til betydelig feilutbredelse, og feilsimulering må ta hensyn til både maskinvarearkitekturen og DNN-modelltopologien.

SiFI-AI integrerer maskinvaresimuleringen i ML-rammeverket (PyTorch). For HW-simulering bruker den Verilator, en gratis og åpen kildekode Verilog-simulator, for å generere syklusnøyaktige RTL-modeller. En feilkontroller administrerer feilinjeksjon som instruert av brukeren, ved å bruke en tilstandsbasert tilnærming, dvs. en liste over forhold som unngår at en feil maskeres. For å velge hvilken del som skal simuleres i RTL, dekomponerer den lag til mindre fliser basert på "lagegenskapene, løkkeflisstrategi, akseleratoroppsett og den respektive feilen” og velger en flis.

Enheten som ble testet i den eksperimentelle delen er Gemmini, en systolisk array DNN-akselerator laget ved UC Berkeley i Chipyard-prosjektet, i en konfigurasjon av 16×16 prosesseringselementer (PE). SiFI-AI utfører en resiliensstudie med 1.5 M feilinjeksjonseksperimenter på to typiske DNN-arbeidsbelastninger, ResNet-18 og GoogLeNet. Feil injiseres i tre PE-dataregistre og ett styresignal, som spesifisert av brukeren. Resultatene viser en lav feilsannsynlighet, og bekrefter motstandsdyktigheten til DNN. De viser også at kontrollsignalfeil har mye mer påvirkning enn datasignalfeil, og at brede og grunne lag er mer utsatt enn smale og dype lag.

Dette er et godt papir som fremmer feltet for DNN-pålitelighetsevaluering. Oppgaven er velskrevet og tydelig og gir tilstrekkelige detaljer og referanser til å støtte påstandene og resultatene. Selv om kjerneideen med å kombinere simulering på ulike nivåer er gammel, bruker forfatterne den veldig effektivt. Rammer som SciFI-AI kan hjelpe designere og forskere med å optimalisere arkitekturene sine og gjøre dem mer robuste. Jeg liker også analysen av feilpåvirkningen på forskjellige lag og signaler, som avslører noen interessante innsikter. Papiret kan forbedres ved å gi mer informasjon om feilinjeksjonsstrategien og valget av flisene. Til tross for at emnet er ganske spesifikt, totalt sett en veldig hyggelig artikkel!

Del dette innlegget via:

spot_img

Siste etterretning

spot_img