इंजीनियरों को अपटाइम के बारे में चिंता होती है, चाहे वह कॉर्पोरेट सर्वर फ़ार्म पर हो या घर पर हमारे अपने छोटे शौक वाले सर्वर हों। समय-समय पर, कुछ गलत हो जाएगा और बॉक्स ऑफ़लाइन हो जाएगा, जिसे ठीक करने के लिए थोड़े से मानवीय हस्तक्षेप की आवश्यकता होगी। आदर्श रूप से, आपके पास अभी भी एक कमांड लिंक होगा जो चालू रहेगा ताकि आप समस्या को ठीक कर सकें। हालाँकि, उसे खो दें, और आप पूरी तरह से मुसीबत में पड़ जाएंगे।
इस महीने की शुरुआत में ऑस्ट्रेलिया के दूसरे सबसे बड़े दूरसंचार प्रदाता के साथ ठीक यही हुआ। सिस्टम ख़राब हो गए, लाखों लोगों ने कनेक्टिविटी खो दी, और कंपनी के तकनीशियनों को टुकड़ों को वापस जोड़ने के लिए संघर्ष करना पड़ा। आइए गहराई से देखें और जानें कि ऑप्टस पर क्या हुआ हाल की स्मृति में सबसे शर्मनाक दिन।
कहाँ जाना है?
यह सब 8 नवंबर की सुबह लगभग 4:05 बजे बंद हो गया, जब एक नियमित सॉफ़्टवेयर अपग्रेड निर्धारित किया गया था। अपग्रेड के हिस्से के रूप में, एक अंतरराष्ट्रीय पीयरिंग नेटवर्क से ऑप्टस के नेटवर्क के लिए बॉर्डर गेटवे प्रोटोकॉल (बीजीपी) के लिए रूटिंग जानकारी में बदलाव हुआ था। घटना के बाद कंपनी के विश्लेषण के अनुसार, “ये रूटिंग जानकारी परिवर्तन हमारे नेटवर्क में कई परतों के माध्यम से प्रचारित हुए और प्रमुख राउटर्स पर पूर्व निर्धारित सुरक्षा स्तरों को पार कर गए जो इन्हें संभाल नहीं सके। इसके परिणामस्वरूप उन राउटर्स को खुद को बचाने के लिए ऑप्टस आईपी कोर नेटवर्क से डिस्कनेक्ट करना पड़ा।
यह सब थोड़ा गड़बड़ है, तो इसका क्या मतलब है? खैर, मूल रूप से, बीजीपी रूटिंग जानकारी ऑप्टस के राउटर्स को बताती है कि इंटरनेट पर अन्य मशीनें कहां खोजें। रूटिंग सूचना अपडेट सिंगटेल इंटरनेट एक्सचेंज, एसटीआईएक्स से आए, जिसका उपयोग ऑप्टस वैश्विक इंटरनेट तक पहुंचने के लिए करता है। क्या हुआ कि अपडेट ने ऑप्टस के अपने राउटर्स को अभिभूत कर दिया, जो रूट अपडेट के एक निश्चित डिफ़ॉल्ट सीमा स्तर तक पहुंचने के जवाब में बंद हो गए। ये सीमाएँ फ़ैक्टरी से राउटर उपकरण में पूर्व-कॉन्फ़िगर की गई हैं। चूंकि यह ऑप्टस के कोर नेटवर्क पर राउटर्स में हुआ, जैसे ही वे ऑफ़लाइन हो गए, उन्होंने टेल्को के पूरे राष्ट्रीय नेटवर्क को बंद कर दिया, जिससे आवाज, मोबाइल और इंटरनेट ग्राहक प्रभावित हुए।
इंजीनियरों ने पहले छह घंटे घटना के विभिन्न कारणों की जांच में बिताए, जबकि लाखों लोग खराब इंटरनेट कनेक्शन और बिना सिग्नल वाले फोन के कारण जाग रहे थे। क्रू ने ऑप्टस द्वारा हाल ही में किए गए परिवर्तनों को वापस ले लिया और देखा कि क्या वे किसी प्रकार के DDoS हमले के अधीन थे। अंत में, इंजीनियरों ने नेटवर्क के माध्यम से प्रचारित होने वाले रूटिंग सूचना अपडेट के बोझ से बचने के लिए राउटर्स को स्वयं-पृथक करने के मुद्दे को निर्धारित किया। रूटिंग को वापस सामान्य पर रीसेट करना नेटवर्क को ऑनलाइन वापस लाने के लिए पर्याप्त था, इंजीनियरों ने प्रक्रिया के दौरान किसी भी अप्रत्याशित आश्चर्य से बचने के लिए ऑप्टस की रीढ़ की हड्डी में ट्रैफ़िक को सावधानीपूर्वक फिर से शुरू किया। अंततः ऑप्टस ने स्वचालित सुरक्षा तंत्र पर दोष मढ़ दिया, "अब यह समझा जाता है कि आईपी रूटिंग जानकारी के अधिभार से खुद को बचाने के लिए लगभग 90 पीई राउटर स्वचालित रूप से स्वयं-पृथक होने के कारण आउटेज हुआ। ये आत्म-सुरक्षा सीमाएँ प्रासंगिक वैश्विक उपकरण विक्रेता (सिस्को) द्वारा प्रदान की गई डिफ़ॉल्ट सेटिंग्स हैं। शायद इसका तात्पर्य यह है कि आत्म-सुरक्षा की सीमाएँ अनावश्यक रूप से सतर्क हैं और नेटवर्क को ऑफ़लाइन कर दिया गया है जबकि ऐसा करना वास्तव में आवश्यक नहीं था।
ऑप्टस के अनुसार, 150 इंजीनियर सीधे तौर पर समस्या की जांच करने और सेवा बहाल करने में शामिल थे, अन्य 250 कर्मचारी और 5 विक्रेता समर्थन में काम कर रहे थे। इस बीच, ऑनलाइन वापस आने के प्रयास इस तथ्य से निराश हो गए कि, ऑप्टस का नेटवर्क डाउन होने के कारण, तकनीशियनों के लिए समस्या को ठीक करने के लिए वास्तव में नेटवर्क पर मशीनों तक पहुंचना मुश्किल हो गया था। अंततः, ऑप्टस को अपने सिस्टम को पूरी तरह से ऑनलाइन वापस लाने में पूरे चौदह घंटे लगेंगे, तकनीशियनों को इसे ऑनलाइन वापस लाने के लिए कुछ उपकरणों को व्यक्तिगत रूप से देखना होगा।
ऑप्टस एकमात्र ऐसी कंपनी नहीं है जिसे बीजीपी में बड़ी गिरावट की समस्या का सामना करना पड़ा है। फ़ेसबुक 2021 में कुछ घंटों के लिए इंटरनेट से गायब हो गया जब उसकी सेटिंग्स गलत हो गईं इसके कुछ स्वयं के बैकबोन राउटर्स।
आफ्टरमाथ
इस अभूतपूर्व रुकावट का परिणाम यह हुआ कि ऑप्टस अस्थायी रूप से ऑस्ट्रेलियाई मीडिया में सार्वजनिक दुश्मन #1 बन गया। देश भर में लाखों लोगों ने बिना इंटरनेट कनेक्शन, बिना मोबाइल कनेक्टिविटी और वास्तव में क्या चल रहा था, इसके बारे में ऑप्टस से बहुत कम अपडेट के साथ दिन बिताया था। ग्राहकों को समाचार पत्रों, रेडियो और टेलीविज़न जैसे पारंपरिक मीडिया के माध्यम से अपने अपडेट प्राप्त करने पड़ते थे - क्योंकि उनके पास इंटरनेट तक पहुंचने या अपने स्वयं के उपकरणों के माध्यम से कॉल प्राप्त करने का कोई तरीका नहीं था। शुक्र है, सेल्युलर उपयोगकर्ता वैकल्पिक सेल्युलर नेटवर्क के माध्यम से कम से कम आपातकालीन सेवाओं से संपर्क करने में सक्षम थे, लेकिन लैंडलाइन उपयोगकर्ता कट गए थे।
ऑप्टस सिम कार्ड के साथ ईएफटीपीओएस भुगतान टर्मिनलों पर निर्भर व्यवसाय भुगतान लेने में असमर्थ थे, जबकि बैंक, अस्पताल और यहां तक कि कुछ ट्रेन सेवाएं भी प्रभावित हुईं। मेलबर्न ट्रेन नेटवर्क को एक घंटे के लिए बंद कर दिया गया क्योंकि ड्राइवर नियंत्रण केंद्र के साथ संचार नहीं कर सके, पूरे दिन सैकड़ों ट्रेनें रद्द कर दी गईं। जहां तक ऑप्टस का सवाल है, जैसे-जैसे दिन चढ़ता गया, शेयर बाजार में इसका मूल्य 2 बिलियन डॉलर कम हो गया, सीईओ केली बायर रोसमारिन ने आउटेज के कारण कुछ सप्ताह बाद इस्तीफा दे दिया। अब तक, कंपनी ने ग्राहकों को आउटेज की भरपाई के रूप में 200 जीबी मुफ्त डेटा की पेशकश की है। यह कई लोगों के लिए राहत देने वाला साबित हुआ है, खासकर छोटे व्यवसायों के लिए, जिन्हें इस अवधि के दौरान व्यापार में सैकड़ों या हजारों डॉलर का नुकसान हुआ।
परिदृश्य में एकमात्र विजेता ऑप्टस के मुख्य प्रतिस्पर्धी, टेल्स्ट्रा और वोडाफोन थे। दोनों कंपनियां प्रतिस्पर्धी सेलुलर नेटवर्क चलाने के साथ-साथ पूरे देश में घरेलू इंटरनेट कनेक्शन भी प्रदान करती हैं। यह आपदा ऑप्टस में एक बड़े डेटा उल्लंघन के केवल एक साल बाद हुई है जिसमें ग्राहकों ने सामूहिक रूप से समझौता किया है, जब अपने प्रतिद्वंद्वियों के ग्राहक आधार को चुराने की बात आएगी तो दोनों कंपनियों को डॉलर के संकेत दिखाई देंगे।
अंततः, ऑप्टस के पतन से एक सबक सीखा जा सकता है। महत्वपूर्ण सिस्टम को सामूहिक रूप से ध्वस्त हुए बिना नियमित अपडेट को संभालने में सक्षम होना चाहिए, भले ही कुछ गलत हो जाए। 2023 में, ग्राहक 14 घंटों के लिए कनेक्टिविटी खोना स्वीकार नहीं करेंगे, खासकर अगर यह कुछ खराब-कॉन्फ़िगर किए गए उपकरणों के कारण हो। कनेक्टिविटी अब लोगों के लिए लगभग उतनी ही महत्वपूर्ण है जितनी वह हवा जिसमें वे सांस लेते हैं और जो पानी वे पीते हैं। उसे हटा दो और वे बहुत परेशान हो जाते हैं, सचमुच बहुत जल्दी।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://hackaday.com/2023/11/22/australias-second-largest-telco-went-dark-and-chaos-reigned/