पर्यावरण से जुड़े प्रोजेक्ट

मशीन लर्निंग ने हमारे डेटा केंद्र के लिए ऐसे नए रास्ते तलाशे जिनकी मदद से ऊर्जा की होगी बचत

दिसंबर 2016
एक टेक्नीशियन डेटा केंद्र की दीवार के सामने खड़ा है.

वर्चुअल दुनिया का निर्माण स्थायी बुनियादी ढांचे पर होता है. सबमिट की जाने वाली हर एक खोज, भेजा गया ईमेल, लोड किया गया पेज, पोस्ट की गई टिप्पणी, और लोड किया गया वीडियो उन डेटा सेंटर से होकर गुज़रता है, जो फ़ुटबॉल के मैदान से भी बड़े हो सकते हैं. भिनभिनाने जैसी आवाज़ करने वाले सर्वर के वे हज़ारों रैक बड़ी मात्रा में ऊर्जा का इस्तेमाल करते हैं. सभी मौजूदा डेटा केंद्र एक साथ मिलकर तकरीबन दुनिया की दो प्रतिशत बिजली का इस्तेमाल करते हैं. अगर इसे नज़रअंदाज़ किया गया, तो ऊर्जा की मांग इंटरनेट के इस्तेमाल जितनी तेज़ी से बढ़ सकती है. इसलिए डेटा केंद्रों को जितना संभव हो, कम से कम ऊर्जा का इस्तेमाल करके चलाने की कोशिश करना बहुत ज़रूरी है.

शुक्र है कि कंप्यूटिंग की आसमान छूने वाली मांग के बावजूद, डेटा केंद्र में बिजली के इस्तेमाल में पिछले कुछ सालों में कमी आई है. इसकी एक बड़ी वजह इन सुविधाओं के बढ़ने के साथ-साथ ऊर्जा के समझदारी से इस्तेमाल में सुधार करने के अवसरों में बढ़ोतरी होना है.1 लेकिन इन अवसरों का फ़ायदा उठाना कठिन काम हो सकता है. डेटा केंद्रों में ऊर्जा के सही इस्तेमाल का मानक तरीका — ऊर्जा के असरदार इस्तेमाल की जांच (पीयूई) दर्जनों चीज़ों पर निर्भर कर सकती है. किसी परिसर में कई तरह के उपकरण होते हैं, जैसे चिलर, कूलिंग टावर, वॉटर पंप, हीट एक्सचेंजर और कंट्रोल सिस्टम. हर एक की अपनी एक सेटिंग होती है और सभी एक-दूसरे के साथ पेचीदा और अक्सर ऐसे तरीकों से काम करते हैं, जिनका अंदाज़ा लगाना मुश्किल है. हवा का तापमान और पंखे की गति भी इसमें शामिल हो जाएं तो इनका सिस्टम समझना और भी मुश्किल हो जाता है. एक आसान स्थिति देखें: सिर्फ़ 10 उपकरण और हर एक की 10 सेटिंग होने से ही, 10 की घात 10 या 10 अरब कॉन्फ़िगरेशन होने की संभावना बन जाती है. इतनी सारी संभावनाओं को आज़माकर देखना असलियत में किसी के लिए भी संभव नहीं है — लेकिन यह भी असली डेटा केंद्र के संभावित कॉन्फ़िगरेशन की तुलना में बहुत कम है.

बेल्जियम के एक डेटा केंद्र में कूलिंग टावर
बेल्जियम के एक डेटा केंद्र में कूलिंग टावर

Google जब से डेटा केंद्रों के बारे में सोच रहा है, तब से वह डेटा केंद्रों में कम ऊर्जा का इस्तेमाल करने के तरीके भी ढूंढ रहा है. शुरुआत में हमने नई कूलिंग तकनीकों और संचालन रणनीतियों को लगातार चलाने में सक्षम बनाने के लिए ज़मीनी स्तर से अपनी खुद की सुविधाओं का डिज़ाइन बनाने और उनका निर्माण करने का फ़ैसला किया. हमारे डेटा सेंटर बढ़िया कूलिंग तकनीकों का इस्तेमाल करते हैं, इसके लिए जब भी संभव हो मैकेनिकल चिलर के बजाय बहुत कम ऊर्जा इस्तेमाल करने वाली वाष्पीकरण कूलिंग या खुली हवा का इस्तेमाल किया जाता है. हमने ऊर्जा के नुकसान को कम से कम करने के लिए नए तापमान और प्रकाश को कंट्रोल करने के तरीकों का इस्तेमाल किया. साथ ही बिजली वितरण के तरीके को फिर से डिज़ाइन किया है. हमारे बेहतरीन प्रदर्शन करने वाले सर्वर कस्टम तरीके से डिज़ाइन किए गए हैं, ताकि जितना संभव हो उतनी कम बिजली का इस्तेमाल कर सकें, वीडियो कार्ड जैसे गैर ज़रूरी घटकों को निकाल दिया गया है और उन्हें जितना संभव हो उतना व्यस्त रखा जाता है, ताकि हम कम सर्वर के साथ बहुत ज़्यादा काम कर सकें. और ऐसा ही बहुत कुछ.

इन कोशिशों का नतीजा यह निकला कि: 2014 में बसंत का मौसम आने तक, Google डेटा केंद्रों ने औद्योगिक औसत की तुलना में 50% कम बिजली खर्च की. इसके बाद, स्वाभाविक तौर पर अगला सवाल यही था कि क्या वे और कम बिजली पर भी चल सकते थे. जिम गाओ नाम के बिजली खपत विभाग के इंजीनियर ने मशीन लर्निंग पर एक ऑनलाइन क्लास ली, जिसके बाद उनकी दिलचस्पी इसमें बढ़ गई और उन्होंने इसके बारे में और जानकारी पाने का फ़ैसला किया.

मशीन लर्निंग, कंप्यूटर को खास तौर से प्रोग्राम किए बिना चीज़ें सीखने के लिए सक्षम बनाती है, जिसमें वे दोहराई गई चीज़ों के ज़रिए खुद से बड़ी मात्रा में डेटा को समझने का तरीका सीखते हैं. Google पहले से ही इसका इस्तेमाल, अनुवाद और फ़ोटो की पहचान करने जैसी सुविधाओं को बेहतर बनाने के लिए करता है. जब आप Google Photos से उन लोगों की फ़ोटो मांगते हैं, जो एक-दूसरे को गले लगा रहे हैं, तो मशीन लर्निंग ऐसी फ़ोटो ढूंढकर आपके सामने लाती है.

डेटा केंद्र पर पानी के कई वॉल्व और प्रेशर सेंसर
डेटा केंद्र पर पानी के कई वॉल्व और प्रेशर सेंसर

गाओ को उम्मीद थी कि “डेटा में छिपी कहानी का पता लगाकर,” उन्हें डेटा केंद्र की ढेर सारी जानकारी को बेहतर तरीके से समझने में मदद मिलेगी. गाओ ने "छह महीने के जोखिम और मशक्कत के बाद," सिद्धांत के प्रमाण का एक ऐसा मॉडल तैयार किया जिसमें उन्होंने एक ही डेटा केंद्र में सभी कॉम्पोनेंट को शामिल किया. उन्होंने कहा, “यह एक पुराने तरीके का कोड था, काफ़ी हद तक एक प्रोटोटाइप की तरह, जिसका मकसद यह साबित करना था कि यह आइडिया सही है और आगे ले जाने लायक है.”

शुरुआत में इसके नतीजे उम्मीदों पर खरे नहीं उतरे. गाओ ने माना कि “इसके शुरुआती नतीजे सही नहीं थे." “इन मॉडल ने पीयूई (ऊर्जा के असरदार इस्तेमाल की जांच) का अनुमान ठीक तरीके से नहीं लगाया. इसके अलावा, हमारी कार्रवाइयों का नतीजा भी सामने नहीं आया.” असल में, ऊर्जा की ज़्यादा से ज़्यादा बचत करने के लिए, इस मॉडल का पहला सुझाव था कि पूरी सुविधा को ही बंद कर दिया जाए. यह सुझाव, पूरी तरह से गलत नहीं था, लेकिन कहीं न कहीं मददगार भी नहीं था. गाओ कहते हैं, “हमें अपने एआई (AI) को एक ज़िम्मेदार वयस्क की तरह व्यवहार करने और सही ढंग से काम करने के लिए, पूरी तरह से तैयार करना पड़ा. उन्होंने वैरिएबल बदल दिए और सिमुलेशन की प्रक्रिया को फिर से चलाया. समय के साथ मॉडल में भी सुधार किए, ताकि कॉन्फ़िगरेशन ज़्यादा सटीक नतीजे दिखाए — ऐसा करने की वजह से ही वे डेटा केंद्र के प्रदर्शन में सुधार ला सके. जब उन्हें लगा कि उनका प्रोटोटाइप ज़रूरत के मुताबिक है, तो उन्होंने एक श्वेत पत्र प्रकाशित किया और सचमुच के डेटा केंद्र में मॉडल के सुझाव लागू करने के लिए, साइट ऑपरेशन टीम के साथ काम करने लगे.

सिर्फ़ 10 उपकरण और हर एक की 10 सेटिंग होने से ही, 10 की घात 10 या 10 अरब कॉन्फ़िगरेशन होने की संभावना बन जाती है. इतनी सारी संभावनाओं को आज़माकर देखना असलियत में किसी के लिए भी संभव नहीं है.

वहीं दूसरी ओर, Google के प्रमुख आर्टिफ़िशियल इंटेलिजेंस रिसर्च ग्रुप, DeepMind ने एक शोधपत्र से तहलका मचा दिया. इसमें एक कंप्यूटर एजेंट 'डीक्यूएन' के बारे में बताया गया था जो Atari गेम बहुत अच्छी तरह खेलता था. सभी Atari गेम. यह प्रोग्राम न सिर्फ़ एक गेम अच्छी तरह खेल सकता था, बल्कि समय के साथ खुद सीखकर इस तरह के कई खेल अच्छी तरह खेलना सीख सकता था. यह बिल्कुल नई चीज़ थी. मशीन लर्निंग समुदाय में, यह उथल-पुथल मचा देने वाली जानकारी थी और जब गाओ ने इसके बारे में सुना, तो उन्होंने फ़ौरन DeepMind के प्रमुख मुस्तफ़ा सुलेमान को एक मेल भेजा. उस मेल का विषय इस प्रकार था: मशीन लर्निंग + डेटा सेंटर = बेहतरीन?

सुलेमान मान गए कि गाओ असल में कुछ बेहतरीन करने जा रहे थे, और DeepMind ने गाओ और उनकी डेटा सेंटर इंटेलिजेंस (डीसीआईक्यू) टीम के साथ, और ज़्यादा “मज़बूत और सामान्य” काम करने वाले मॉडलों पर काम करना शुरू कर दिया. बिल्कुल वैसे ही, जैसे आप यह नहीं चाहेंगे कि आपके पास बहुत ज़्यादा ध्यान केंद्रित रखने वाला सिर्फ़ एक एजेंट हो, जो सिर्फ़ एक ही Atari गेम खेल सकता हो. इसकी जगह, आप सामान्य इंटेलिजेंस रखने वाला एक ऐसा एजेंट चाहेंगे जो सभी Atari गेम सीख सकता हो, क्योंकि जब बात डेटा सेंटर मशीन लर्निंग की हो तो सामान्य, खास से बेहतर होता है. यह एक ऐसा कस्टम प्रोग्राम बनाने के मुकाबले आसान होगा जो हर डेटा सेंटर को तैयार करता हो, लेकिन गाओ कहते हैं “ये और भी बेहतर होता अगर हमने एक सामान्य इंटेलिजेंस प्रोग्राम बनाया होता, जिसका फ़ायदा सभी उठा सकते.”

डेटा सेंटर के अंदर मौजूद हार्डवेयर का क्लोज़अप

फिर उन्होंने ऐसा किया. 18 महीने बाद, इस मॉडल का इस्तेमाल कई डेटा सेंटर में किया गया और इनसे कूलिंग में इस्तेमाल होने वाली ऊर्जा में 40% और कुल ऊर्जा ओवरहेड में 15% की कमी आई. हालांकि पहली बार आज़माए गए इन मॉडल में से एक ने, Google के परीक्षण डेटा सेंटर में एक नया काम करने के लिए पहले से ही पीयूई (ऊर्जा के असरदार इस्तेमाल की जांच) लाने में सफलता हासिल कर ली थी, लेकिन प्रगतिशील DCIQ टीम का मानना है कि इसने मशीन लर्निंग के सामान्य इस्तेमालों को सिर्फ़ सतही तौर पर ही छुआ है. Google की पर्यावरण टीम हमारे डेटा सेंटर में कार्बन का उत्सर्जन कम करना चाहती है. हार्डवेयर का संचालन करने वाली टीम कॉम्पोनेंट की कम विफलताओं की इच्छा रखते हैं. इस प्लैटफ़ॉर्म पर मौजूद लोगों को सर्वर को चलाने में खर्च होने वाली ऊर्जा की परवाह है. मशीन लर्निंग से उन्हें अपने ऊर्जा खपत में कमी लाने के सपनों को पूरा करने में मदद मिल सकती है.

वह दुनिया भर में ऊर्जा का किफ़ायती इस्तेमाल लागू करना चाहते हैं. गाओ कहते हैं, “हम इसके लिए सभी के सुझाव पाने की कोशिश कर रहे हैं." “हमें पूरा भरोसा है कि हमारे इस काम से दूसरों को भी फ़ायदा मिलेगा.” हम जल्द ही एक दूसरा श्वेत पत्र निकालने वाले हैं, जिसमें DCIQ के काम के बारे में ज़्यादा जानकारी होगी. इस श्वेत पत्र से दूसरे डेटा केंद्र को अपनी ऊर्जा खपत कम करने में मदद मिल सकती है. साथ ही, कई दूसरी तरह के संगठनों, जैसे कि पावर प्लांट, फ़ैक्ट्रियों को उनके इंफ़्रास्ट्रक्चर की वजह से ऊर्जा खपत कम करने में मदद मिलेगी. हमें उम्मीद है कि जो काम DCIQ ने किया है और जो आगे करने वाला है उससे दूसरी कंपनियों और उद्योगों को आगे बढ़ने में और पर्यावरण को बचाने में मदद मिलेगी.

1“संयुक्त राज्य अमेरिका के डेटा सेंटर की ऊर्जा के इस्तेमाल की रिपोर्ट,” यूएस डिपार्टमेंट ऑफ़ एनर्जी, लॉरेंस बर्कले नैशनल लेबोरेट्री, 2016

इसके बारे में और पढ़ें