वास्तविक समय सेंसर नेटवर्क सत्यापन के लिए सांख्यिकीय दूरियों का उपयोग करना
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
शेयर करना: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/hi/
Overlapping kernel densities,
(credits)

2008 में, जब विश्व वायु गुणवत्ता परियोजना शुरू हुई, सभी मौजूदा वायु गुणवत्ता निगरानी स्टेशन अत्यधिक पेशेवर और महंगी BAM और TOEM तकनीक पर आधारित थे। इस प्रकार के स्टेशनों का रखरखाव हमेशा पेशेवर और उच्च योग्य ऑपरेटरों द्वारा किया जाता है - और यह सुनिश्चित करता है कि इस स्टेशन के आउटपुट पर भरोसा किया जा सकता है।

12 साल बाद, BAM और TOEM स्टेशन अभी भी मौजूद हैं। लेकिन लेजर स्कैटरिंग तकनीक और कम लागत वाले धूल सेंसर के विकास के साथ, बीएएम और टीओईएम स्टेशनों की संख्या अब विशाल और घने कम लागत वाले सेंसर नेटवर्क से अधिक हो गई है। आजकल, उनमें से बहुत सारे नेटवर्क हैं - कुछ के नाम बताएं: उड़द, लूफ़्ट-डेटन, एयरको, एयरबीजी, ओपनसेंस, यक्कॉ, ईकोनेट, एयरकाज़, सीसीडीसी, एम्बेंटे, ग्रीन एयर, आदि।

कम लागत वाले सेंसर नेटवर्क के साथ मूलभूत मुद्दों में से एक उनकी विश्वसनीयता है: चूंकि उनमें से कई सेंसर ठीक से बनाए नहीं रखे गए हैं (या बिल्कुल भी बनाए नहीं रखे गए हैं), पूरी तरह से गलत माप उत्पन्न करने वाले सेंसर की मात्रा नगण्य नहीं है। इसके अलावा, अधिकांश नेटवर्क प्रतिकृति सेंसर वाले स्टेशनों का उपयोग नहीं करते हैं (हमारे गैया स्टेशन के विपरीत, जो 3 प्रतिकृति सेंसर का उपयोग करता है), जिससे यह जानना और भी मुश्किल हो जाता है कि एक भी सेंसर कब विफल हो रहा है।

इस लेख में, ग्रीस के अद्भुत शहर वोलोस में तैनात सेंसर नेटवर्क को देखा जाएगा, और वास्तविक समय में स्टेशन की विश्वसनीयता को अर्हता प्राप्त करने और मापने का अध्ययन किया जाएगा।


--

ग्रीस में वोलोस का अद्भुत शहर

वोलोस (ग्रीक: Βόλος) एक तटीय बंदरगाह शहर है। 144,449 (2011) की जनसंख्या के साथ, यह ग्रीस का छठा सबसे अधिक आबादी वाला शहर भी है। यह एक महत्वपूर्ण औद्योगिक केंद्र है, जबकि इसका बंदरगाह यूरोप और एशिया के बीच एक पुल प्रदान करता है। वोलोस में वर्तमान में 5 स्टेशन हैं: एक ग्रीक ईपीए से, एक पेशेवर बीएएम स्टेशन से प्रति घंटा डेटा प्रदान करता है, और लुटफ-डेटन नेटवर्क से 4 कम लागत वाले वास्तविक समय स्टेशन:



वोलोस ईपीए स्टेशन थिसली और सेंट्रल ग्रीस के विकेंद्रीकृत प्रशासन की इमारत में स्थित है। आर्गोनाफ्टन को छोड़कर, जो बंदरगाह के बगल में स्थित है, अन्य सभी स्टेशन भी आवासीय क्षेत्रों में स्थित हैं।

बंदरगाह में यातायात नगण्य नहीं है, प्रतिदिन औसतन लगभग 8 जहाजों का आगमन/प्रस्थान होता है , लेखन के समय 80% जहाज कार्गो होते हैं।

कार्गो के साथ ज्ञात समस्याओं में से एक निम्न गुणवत्ता वाले ईंधन के कारण निकास पाइप से कण प्रदूषण हो सकता है। लेकिन जहां आर्गोनाफ्टन स्टेशन स्थित है, वहां से पैनोरमा को देखते हुए, कार्गो की दूरी लगातार वायु प्रदूषण स्रोत को उचित ठहराने के लिए पर्याप्त नहीं है। कोई ऐसा कुछ समय देखने की उम्मीद कर सकता है जब आर्गोनाफ्टन में हवा अधिक प्रदूषित हो, खासकर जब बड़ी नावें चल रही हों, लेकिन हर समय नहीं। आख़िरकार, एक दिन में केवल 8 जहाज ही युद्धाभ्यास करते हैं।


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

पिछले 30 दिनों का समय-श्रृंखला डेटा

स्टेशनों के स्थान से मिली जानकारी के आधार पर, कोई उम्मीद कर सकता है कि अर्गोनैफ्टन के लिए छिटपुट उच्च प्रदूषण घटनाओं को छोड़कर, सभी स्टेशन वायु प्रदूषण के समान स्तर पर सहमत हैं। लेकिन, दुर्भाग्य से, यह वास्तव में मामला नहीं है, जैसा कि नीचे दिए गए समय-श्रृंखला ग्राफ प्लॉट से पुष्टि की गई है:

समय-श्रृंखला कथानक स्पष्ट रूप से इंगित करता है कि आर्गोनाफ्टन का डेटा अन्य स्टेशनों की तुलना में अधिक अनुमानित लगता है। इसी तरह, डिमार्क्सोउ का डेटा अनुमान से कम लगता है।

इस मुद्दे को उजागर करने का एक बेहतर तरीका दैनिक 75वें AQI प्रतिशत की कल्पना करना है, जिसे संबंधित AQI रंग रेंज का उपयोग करके प्लॉट किया गया है। आर्गोनाफ्टन से विचलन स्पष्ट है। इसके अलावा, रीगा-फेराइउ+कस्थानाईस और वोलोस ईपीए+डिमार्क्सोउ के आसपास केंद्रित दो समूहों को अलग करना संभव है।


--

समय श्रृंखला के अंतरों को परिमाणित करना

जब सहसंबंधित समय-श्रृंखला की तुलना करने की बात आती है, तो उनके संभाव्य वितरण की तुलना करना सबसे अच्छा है। नीचे दिए गए 3 ग्राफ़ घनत्व वितरण, सीडीएफ (संचयी वितरण फ़ंक्शन) और क्यूक्यू (संदर्भ सीडीएफ के रूप में वोलोस ईपीए का उपयोग करके) का प्रतिनिधित्व करते हैं। वे सभी 3 ग्राफ़ पिछले 30 दिनों की समय-श्रृंखला डेटा पर आधारित हैं, लेकिन आप पहली समय-श्रृंखला ग्राफ़ में एक विशिष्ट समय सीमा भी चुन सकते हैं, और उन 3 ग्राफ़ को दी गई समय सीमा के मानों का उपयोग करके अपडेट किया जाएगा।

Looking at the probabilistic distribution with a naked eye, it is obvious that there is a big difference between Argonafton, Dimarxou and the reference Volos EPA station. It is worth noticing that there is a "bump" around AQI 150: The reason is that the distribution plot is based on the AQI rather than the raw concentration, and the more compact [150,200] AQI range (compared to [100,150]) make the AQI denser for >150 compared to <150.

जब इस अंतर को मापने की बात आती है, तो "फिट-ऑफ-फिट" को मापने के लिए सांख्यिकीय दूरी की अवधारणा का उपयोग करना संभव है। सबसे प्रसिद्ध दूरियाँ कोलमोगोरोव-स्मिरनोव, वासेरस्टीन और क्रैमर-वॉन मिज़ दूरियाँ हैं (उन दूरियों के बारे में अच्छे परिचय के लिए, इस उत्कृष्ट स्पष्टीकरण को देखें)। नीचे दी गई तालिका 30 दिनों के डेटा के आधार पर दूरियां दिखाती है (यदि आप मुख्य समय-श्रृंखला ग्राफ़ से समय सीमा चुनते हैं तो मान अपडेट किए जाएंगे)।

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

जबकि कोलमोगोरोव-स्मिरनोव दूरी सापेक्ष दूरियों को सही ढंग से कैप्चर नहीं करती है (डिमार्क्सौ को आर्गोनाफ्टन तक उजागर करती है), वासेरस्टीन और क्रैमर-वॉन मिज़ दोनों दूरियां आर्गोनाफ्टन के लिए एक स्पष्ट बड़ी दूरी को उजागर करती हैं। उपरोक्त तालिका में मान 30 दिनों के डेटा पर आधारित हैं। नीचे दिए गए 3 ग्राफ़ पिछले 30 दिनों के 7 दिनों के मूविंग औसत पर आधारित हैं।

वे ग्राफ़ इस बात की पुष्टि करते हैं कि वासेरस्टीन या क्रैमर-वॉन दूरी का उपयोग करते हुए, आर्गोनाफ्टन स्टेशन और वोलोस ईपीए से दूरी अन्य स्टेशनों की तुलना में लगातार कम से कम दोगुनी है।

मौसम संबंधी डेटा का सहसंबंध

इस परिकल्पना की पुष्टि करने के लिए कि आर्गोनाफ्टन स्टेशन असामान्य और अति-अनुमानित सांद्रता रीडिंग उत्पन्न कर रहा है, हमें मौसम संबंधी आंकड़ों को देखने की जरूरत है: जिस स्थिति में आर्गोनाफ्टन स्टेशन उच्च सांद्रता देख सकता है वह तब है जब हवा दक्षिण से चल रही हो, यानी जहां हवा कार्गो निकास पाइप के धुएं को स्टेशन की ओर ले जाएगी।

पहला कदम पिछले 30 दिनों के दौरान हवा की औसत दिशा और गति की जांच करना है। पवन डेटा वोलोस एयरपोर्ट METAR स्टेशन, साथ ही नेटाटमो टीथिसियोस मौसम स्टेशन दोनों से प्राप्त किया जाता है। दो पवन गुलाब यह दर्शाते हैं कि हवा प्रत्येक दिशा में कितनी बार बह रही है।

पवन गुलाब के दोनों प्लॉट दर्शाते हैं कि हवा मुख्य रूप से पश्चिम या पूर्व से और बहुत कम दक्षिण से बह रही है। चूंकि वोलोस के उत्तरी भाग पर पहाड़ हैं, इसलिए नीचे उत्तर से हवा काफी नहीं आती है।

इस अनुभवजन्य पुष्टि के आधार पर कि हवा अन्य दिशाओं की तुलना में दक्षिण से कम बह रही है, यह कटौती करना संभव नहीं है कि कार्गो निकास पाइप आर्गोनाफ्टन स्टेशन के लिए उच्च पीएम 2.5 सांद्रता का कारण हैं। यह परिकल्पना 3 स्टेशनों और हवाई अड्डे की हवा की दिशा के बीच सहसंबंध कथानक द्वारा भी अमान्य है, जो दर्शाता है कि कोई स्पष्ट सबूत नहीं है (किसी भी स्टेशन के लिए) कि दक्षिणी हवा उच्च सांद्रता का संकेत देती है।

अंत में, हमें यह भी जांचना होगा कि क्या आर्गोनैफ्टन के साथ समस्या सापेक्षिक आर्द्रता से संबंधित हो सकती है। उदाहरण के लिए, समस्या यह हो सकती है कि उच्च आर्द्रता के कारण कण का आकार बड़ा हो जाता है और इस प्रकार उच्च सांद्रता उत्पन्न होती है। नीचे दिया गया सहसंबंध कथानक इस बात की पुष्टि करता है कि यह सही नहीं है, क्योंकि इस बात का कोई स्पष्ट प्रमाण नहीं है कि सांद्रता आर्द्रता के समानुपाती होती है।

निष्कर्ष

इस लेख में, हम वास्तविक समय स्टेशनों के लिए डेटा गुणवत्ता को मापने और योग्य बनाने के तरीकों पर गौर कर रहे हैं। यह मानते हुए कि एक संदर्भ विश्वसनीय स्टेशन है, हमने दिखाया है कि क्रैमर-वॉन मिज़ या वासेरस्टीन दूरी का उपयोग करके मात्रा निर्धारित करना किसी भी स्टेशन डेटा के साथ समस्याओं का संकेत दे सकता है।

हमने यह भी दिखाया है कि दूरी अपने आप में पर्याप्त नहीं है, और अधिक सटीक होने के लिए, स्टेशन के संदर्भ को समझा जाना चाहिए। जैसे कि इसका स्थान और मौसम संबंधी स्थितियाँ। हालाँकि, चूँकि संदर्भ कुछ ऐसा नहीं है जिसे स्वचालित किया जा सके, WAQI परियोजना के लिए उपयोग किया जाने वाला अंतिम समाधान क्वालीफाइंग स्टेशन में शामिल होता है, जिसकी संदर्भ स्टेशन से सांख्यिकीय दूरी 1/4 से कम होती है। इसे आने वाले हफ्तों के दौरान प्रभावी किया जाएगा (वास्तविक समय स्टेशनों के मानचित्र के लिए aqicn.org/station/ देखें)।

यह लेख श्रृंखला का हिस्सा है, और अगले लेख में, हम क्वालीफाइंग स्टेशन के साधनों पर गौर करेंगे जहां कोई संदर्भ स्टेशन उपलब्ध नहीं है।


--

Volos promenade by night
सभी FAQ प्रविष्टियाँ देखने के लिए यहां क्लिक करें
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • वायु गुणवत्ता और प्रदूषण मापन के बारे में:

    वायु गुणवत्ता स्तर के बारे में

    -वायु गुणवत्ता सूचकांक (एक्यूआई) मानस्वास्थ्य संबंधी चिंता का स्तर
    0 - 50अच्छावायु गुणवत्ता को संतोषजनक माना जाता है, और वायु प्रदूषण कम या कोई जोखिम नहीं बनता है
    51 -100मध्यमवायु गुणवत्ता स्वीकार्य है; हालांकि, कुछ प्रदूषकों के लिए बहुत कम संख्या में लोगों के लिए एक मामूली स्वास्थ्य चिंता हो सकती है जो वायु प्रदूषण के लिए असामान्य रूप से संवेदनशील हैं।
    101-150अस्वास्थ्यकर संवेदनशील समूहों के लिएसंवेदनशील समूहों के सदस्यों को स्वास्थ्य प्रभाव का अनुभव हो सकता है। आम जनता को प्रभावित होने की संभावना नहीं है।
    151-200अस्वस्थहर किसी को स्वास्थ्य प्रभाव का अनुभव करना शुरू हो सकता है; संवेदनशील समूहों के सदस्यों को अधिक गंभीर स्वास्थ्य प्रभाव का अनुभव हो सकता है
    201-300बहुत अस्वस्थआपातकालीन स्थितियों की स्वास्थ्य चेतावनियां। पूरी आबादी प्रभावित होने की अधिक संभावना है।
    300+खतरनाकस्वास्थ्य चेतावनी: हर किसी को अधिक गंभीर स्वास्थ्य प्रभाव का अनुभव हो सकता है

    वायु गुणवत्ता और प्रदूषण के बारे में अधिक जानने के लिए, विकिपीडिया वायु गुणवत्ता विषय या वायु गुणवत्ता और आपके स्वास्थ्य के लिए एयरनाउ गाइड देखें।

    बीजिंग डॉक्टर रिचर्ड सेंट साइर एमडी की बहुत उपयोगी स्वास्थ्य सलाह के लिए, www.myhealthbeijing.com ब्लॉग देखें।


    उपयोग नोटिस: सभी वायु गुणवत्ता डेटा प्रकाशन के समय अनियमित हैं, और गुणवत्ता आश्वासन के कारण इन आंकड़ों को बिना किसी सूचना के संशोधित किया जा सकता है। विश्व वायु गुणवत्ता सूचकांक प्रोजेक्ट ने इस जानकारी की सामग्री को संकलित करने में सभी उचित कौशल और देखभाल का उपयोग किया है और किसी भी परिस्थिति में विश्व वायु गुणवत्ता सूचकांक परियोजना दल या उसके एजेंट इस डेटा की आपूर्ति से सीधे या परोक्ष रूप से उत्पन्न होने वाली किसी भी हानि, चोट या क्षति के लिए अनुबंध, टोर्ट या अन्यथा उत्तरदायी होंगे।



    Settings


    Language Settings:


    Temperature unit:
    Celcius