जेफिरनेट लोगो

एमएल-आधारित कवरेज त्वरण। सत्यापन में नवाचार

दिनांक:

हमने अप्रैल 2022 में एमएल-आधारित कवरेज त्वरण पर एक और पेपर देखा। यहां आईबीएम से एक अलग कोण है। पॉल कनिंघम (सीनियर वीपी/जीएम, वेरिफिकेशन एट कैडेंस), राउल कैंपोसानो (सिलिकॉन कैटलिस्ट, उद्यमी, पूर्व सिनोप्सिस सीटीओ और अब सिल्वाको सीटीओ) और मैं शोध विचारों पर हमारी श्रृंखला जारी रखते हैं। हमेशा की तरह, प्रतिक्रिया का स्वागत है। और 8 मार्च को डीवीकॉन के पहले पैनल (सुबह 1 बजे) पर हमसे मिलना न भूलेंst 2023 सैन जोस में!

एमएल-आधारित कवरेज त्वरण

द इनोवेशन

इस महीने की पसंद है कवरेज क्लोजर एक्सेलेरेशन के लिए डीएनएन और स्मार्ट सैंपलिंग का उपयोग करना. लेखकों ने 2020 एमएलसीएडी कार्यशाला में पेपर प्रस्तुत किया और वे हाइफ़ा में आईबीएम रिसर्च और कनाडा में बीसी विश्वविद्यालय से हैं।

लेखक का इरादा उन घटनाओं पर कवरेज में सुधार करना है जो कभी-कभार ही प्रभावित हुई हैं। वे आईएस सिम्युलेटर के लिए रिफाइनिंग इंस्ट्रक्शन सेट (आईएस) टेस्ट टेम्प्लेट के आधार पर सीपीयू डिजाइन के लिए अपनी पद्धति का प्रदर्शन करते हैं। इस पेपर में विशेष रूप से दिलचस्प यह है कि वे बहुत शोर वाले कम सांख्यिकी डेटा में अनुकूलन का प्रबंधन कैसे करते हैं जहां पारंपरिक ग्रेडिएंट-आधारित तुलनाएं समस्याग्रस्त हैं। वे इस चुनौती से निपटने के लिए कई तरीके सुझाते हैं।

पॉल की राय

सीपीयू सत्यापन में यादृच्छिक निर्देश जनरेटर को बेहतर बनाने के लिए डीएनएन का उपयोग करने पर यहां एक और पेपर है, जो आर्म-आधारित सर्वर और आरआईएससी-वी के उदय को देखते हुए, हमारे उद्योग में तेजी से गर्म विषय बनता जा रहा है।

यह पेपर यादृच्छिक अनुदेश कवरेज को बेहतर बनाने के लिए एक आधारभूत गैर-डीएनएन विधि का दस्तावेजीकरण करके शुरू होता है। यह विधि अनुदेश जनरेटर मापदंडों में बेतरतीब ढंग से बदलाव करके और कवरेज में सुधार होने पर बदलावों को बैंकिंग करके काम करती है। ट्विकिंग प्रक्रिया एक ग्रेडिएंट-मुक्त संख्यात्मक विधि पर आधारित है जिसे अंतर्निहित फ़िल्टरिंग कहा जाता है (देखें)। यहाँ उत्पन्न करें एक अच्छे सारांश के लिए), जो ज़ूम आउट-दैन-इन सर्च की तरह काम करता है: बड़े पैरामीटर बदलावों के साथ शुरू करें और यदि बड़े बदलाव कवरेज में सुधार नहीं करते हैं तो छोटे पैरामीटर बदलावों पर ज़ूम इन करें।

फिर लेखक कवरेज को सटीक रूप से मापने के लिए महंगे वास्तविक सिमुलेशन के साथ आगे बढ़ने से पहले यह आकलन करने के लिए डीएनएन का उपयोग करके अपनी बेसलाइन विधि को तेज करते हैं कि पैरामीटर में बदलाव से कवरेज में सुधार होगा या नहीं। वास्तविक सिमुलेशन के प्रत्येक बैच के बाद डीएनएन को फिर से प्रशिक्षित किया जाता है, इसलिए इसमें लगातार सुधार हो रहा है।

पेपर अच्छी तरह से लिखा गया है, और उनकी पद्धति का औपचारिक औचित्य स्पष्ट रूप से समझाया गया है। परिणाम आईबीएम नॉर्थस्टार प्रोसेसर (5 निर्देश और 8 रजिस्टर) के दो अंकगणितीय पाइप पर प्रस्तुत किए जाते हैं। यह एक साधारण टेस्टकेस है और सिम केवल 100 कवर पॉइंट मापने वाले 185 क्लॉक चक्रों के लिए चलाए जाते हैं। फिर भी, नतीजे बताते हैं कि डीएनएन-आधारित विधि बेसलाइन अंतर्निहित फ़िल्टरिंग विधि के मुकाबले आधे सिम के साथ सभी कवर बिंदुओं को हिट करने में सक्षम है। अच्छा परिणाम.

राउल की राय

जैसा कि पॉल कहते हैं, हम उस विषय पर दोबारा विचार कर रहे हैं जिसे हमने पहले कवर किया है। अप्रैल 2022 में हमने Google के एक पेपर की समीक्षा की जिसमें एक नियंत्रण-डेटा-प्रवाह-ग्राफ़ को एक तंत्रिका नेटवर्क में शामिल किया गया था। दिसंबर 2021 में हमने कठिन पहुंच वाली शाखाओं को कवर करने के लिए कॉनकोलिक (कंक्रीट-प्रतीकात्मक) परीक्षण का उपयोग करते हुए यू. गेन्सविले के एक पेपर की समीक्षा की। इस महीने का पेपर एक गहरे तंत्रिका नेटवर्क (डीएनएन) मॉडल के साथ परीक्षण टेम्पलेट्स, यादृच्छिक नमूनाकरण और अंतर्निहित फ़िल्टरिंग (आईएफ) के संयोजन से कवरेज-निर्देशित परीक्षण पीढ़ी के लिए एक नया एल्गोरिदम पेश करता है। विचार अग्रांकित है:

जैसा कि कवरेज निर्देशित पीढ़ी में आम है, दृष्टिकोण परीक्षण टेम्पलेट्स, परीक्षण मापदंडों के एक सेट पर वजन के वैक्टर का उपयोग करता है जो यादृच्छिक परीक्षण पीढ़ी का मार्गदर्शन करते हैं। इंप्लिसिट फ़िल्टरिंग (आईएफ) एक अनुकूलन एल्गोरिदम है जो किसी विशेष घटना को हिट करने की संभावनाओं को अधिकतम करने के लिए प्रारंभिक अनुमान के आसपास ग्रिड खोज तकनीकों पर आधारित है। कई घटनाओं को कवर करने के लिए, प्रत्येक घटना के लिए IF प्रक्रिया को दोहराया जाता है, जिसे पैरामीटर-आफ्टर-पैरामीटर दृष्टिकोण (पीपी) कहा जाता है। IF प्रक्रिया को तेज़ करने के लिए, IF प्रक्रिया के दौरान एकत्र किए गए डेटा का उपयोग DNN को प्रशिक्षित करने के लिए किया जाता है, जो सिम्युलेटर का अनुमान लगाता है और प्रत्येक परीक्षण वेक्टर को अनुकरण करने की तुलना में बहुत तेज़ है।

एल्गोरिदम की प्रभावशीलता का मूल्यांकन नॉर्थस्टार प्रोसेसर के हिस्से के एक अमूर्त उच्च-स्तरीय सिम्युलेटर को नियोजित करके किया जाता है। चार एल्गोरिदम की तुलना की जाती है: रैंडम सैंपलिंग, पीपी, डीएनएन और आईएफ और डीएनएन का संयोजन। तीन प्रयोगों के परिणाम बताए गए हैं:

  1. 400 रन तक, निश्चित संख्या में परीक्षण टेम्पलेट्स के साथ एल्गोरिदम चलाना। IF और DNN का संयोजन बेहतर है, इसमें हार्ड-टू-हिट इवेंट का केवल 1/3 हिस्सा गायब है
  2. एल्गोरिदम को तब तक चलाना जब तक कि सभी कठिन घटनाओं को कवर न कर लिया जाए। IF और DNN परीक्षण टेम्पलेट्स की आधी संख्या के साथ अभिसरण करते हैं
  3. अंतिम एल्गोरिदम (आईएफ और डीएनएन) को 5 बार चलाना। सभी रन समान संख्या में परीक्षण टेम्पलेट्स के साथ एकत्रित होते हैं, यहां तक ​​कि सबसे खराब भी अन्य एल्गोरिदम की तुलना में ~30% कम परीक्षण टेम्पलेट्स का उपयोग करते हैं

यह क्षेत्र की प्रासंगिक समस्या पर एक अच्छी तरह से लिखा गया पेपर है। यह (लगभग) स्व-निहित है, इसका पालन करना आसान है, और नियोजित एल्गोरिदम प्रतिलिपि प्रस्तुत करने योग्य हैं। परिणाम "की कमी दर्शाते हैं2 या उससे अधिक के कारक द्वारा सिमुलेशन की संख्याअंतर्निहित फ़िल्टरिंग पर। ये परिणाम एक अपेक्षाकृत सरल प्रयोग, नॉर्थस्टार पर आधारित हैं। मैं अतिरिक्त प्रयोग और परिणाम देखना पसंद करूंगा; कुछ अन्य में पाया जा सकता है प्रकाशनों लेखकों द्वारा.

इस पोस्ट को इसके माध्यम से साझा करें:

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी