استفاده از فاصله‌های آماری برای اعتبارسنجی شبکه‌های حسگر بی‌درنگ
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
اشتراک گذاری: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/fa/
Overlapping kernel densities,
(credits)

در سال 2008، زمانی که پروژه جهانی کیفیت هوا آغاز شد، تمام ایستگاه های پایش کیفیت هوا بر اساس فناوری بسیار حرفه ای و گران قیمت BAM و TOEM بودند. این نوع ایستگاه ها همیشه توسط اپراتورهای حرفه ای و بسیار ماهر نگهداری می شوند - و این تضمین می کند که خروجی این ایستگاه قابل اعتماد است.

12 سال بعد، ایستگاه های BAM و TOEM هنوز وجود دارند. اما با توسعه فناوری پراکندگی لیزری و حسگر غبار کم‌هزینه، تعداد ایستگاه‌های BAM و TOEM اکنون از نظر شبکه‌های حسگر کم‌هزینه عظیم و متراکم بیشتر است. امروزه، تعداد زیادی از این شبکه ها وجود دارد - به نام چند مورد: urad، luft-daten، airqo، airbg، opensense، yakkaw، econet، airkaz، ccdc، ambente، green air و غیره.

یکی از مسائل اساسی در مورد شبکه های حسگر ارزان قیمت، قابلیت اطمینان آنها است: از آنجایی که بسیاری از آن سنسورها به درستی نگهداری نمی شوند (یا اصلاً نگهداری نمی شوند)، میزان سنسوری که اندازه گیری کاملاً اشتباه تولید می کند ناچیز نیست. علاوه بر این، بیشتر شبکه از ایستگاه‌هایی با حسگرهای تکثیر شده استفاده نمی‌کند (برخلاف ایستگاه Gaia ما که از 3 حسگر تکراری استفاده می‌کند)، که تشخیص اینکه چه زمانی یک حسگر منفرد از کار می‌افتد را دشوارتر می‌کند.

در این مقاله، شبکه حسگر مستقر در شهر شگفت‌انگیز ولوس در یونان را بررسی خواهیم کرد و ابزارهایی را برای ارزیابی و کمیت قابلیت اطمینان ایستگاه در زمان واقعی مطالعه خواهیم کرد.


--

شهر شگفت انگیز ولوس در یونان

ولوس (به یونانی: Βόλος) یک شهر بندری ساحلی است. این شهر با جمعیت 144449 نفر (2011) ششمین شهر پرجمعیت یونان نیز هست. این یک مرکز صنعتی مهم است، در حالی که بندر آن پلی بین اروپا و آسیا است. در حال حاضر 5 ایستگاه در Volos وجود دارد: یکی از EPA یونان ، داده‌های ساعتی را از یک ایستگاه حرفه‌ای BAM ارائه می‌کند، و 4 ایستگاه کم‌هزینه زمان واقعی از شبکه lutf-daten :



ایستگاه EPA Volos در ساختمان اداره غیرمتمرکز تسالی و یونان مرکزی واقع شده است. تمام ایستگاه های دیگر نیز در مناطق مسکونی قرار دارند، به استثنای آرگونافتون که در کنار بندر قرار دارد.

ترافیک در بندر ناچیز نیست، به طور متوسط حدود 8 کشتی در روز وارد / خروج می شود ، که 80٪ کشتی ها محموله هستند - در زمان نوشتن.

یکی از مشکلات شناخته شده محموله ها می تواند آلودگی ذرات لوله های اگزوز به دلیل سوخت کم کیفیت باشد. اما با نگاهی به چشم‌اندازی که ایستگاه آرگونافتون در آن قرار دارد، فاصله تا محموله‌ها به اندازه‌ای است که منبع آلودگی هوا ثابت نباشد. می توان انتظار داشت که چند بار شاهد آلودگی هوا در آرگونافتون باشیم، به خصوص زمانی که قایق های بزرگ در حال مانور هستند، اما نه همیشه. به هر حال، این تنها 8 کشتی در روز مانور می دهند.


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

داده‌های سری زمانی 30 روز گذشته

بر اساس اطلاعات به دست آمده از مکان ایستگاه ها، می توان انتظار داشت که همه ایستگاه ها در مورد سطوح مشابه آلودگی هوا به استثنای رویدادهای پراکنده آلودگی بالاتر برای آرگونافتون توافق داشته باشند. اما خب، متأسفانه، این واقعاً چنین نیست، همانطور که از نمودار نمودار سری زمانی زیر تأیید شده است:

نمودار سری زمانی به وضوح نشان می دهد که داده های Argonafton در مقایسه با ایستگاه های دیگر بیش از حد تخمین زده شده است. به طور مشابه، به نظر می‌رسد که داده‌های Dimarxou کمتر برآورد شده است.

برای برجسته کردن این موضوع بهتر است که صدک 75 AQI روزانه را تجسم کنید که با استفاده از محدوده رنگی AQI مربوطه ترسیم شده است. انحراف از آرگونافتون آشکار است. علاوه بر این، می توان دو خوشه را در اطراف Riga-Feraiou+Kasthanaías و Volos EPA+Dimarxou متمایز کرد.


--

کمی سازی تفاوت سری های زمانی

وقتی صحبت از مقایسه سری های زمانی همبسته می شود، بهترین کار این است که توزیع های احتمالی آنها را مقایسه کنید. 3 نمودار زیر توزیع چگالی، CDF (تابع توزیع تجمعی) و QQ (با استفاده از Volos EPA به عنوان CDF مرجع) را نشان می دهد. همه آن 3 نمودار بر اساس داده های سری زمانی 30 روز گذشته هستند، اما شما همچنین می توانید یک محدوده زمانی خاص را در اولین نمودارهای سری زمانی انتخاب کنید و آن 3 نمودار با استفاده از مقادیر محدوده زمانی داده شده به روز می شوند.

با نگاهی به توزیع احتمالی با چشم غیرمسلح، بدیهی است که تفاوت زیادی بین Argonafton، Dimarxou و ایستگاه EPA مرجع Volos وجود دارد. شایان ذکر است که یک "برآمدگی" در اطراف AQI 150 وجود دارد: دلیل آن این است که نمودار توزیع به جای غلظت خام بر اساس AQI است و محدوده AQI فشرده تر [150,200] (در مقایسه با [100,150]) متراکم AQI برای > 150 در مقایسه با <150.

وقتی نوبت به کمی کردن این تفاوت می‌رسد، می‌توان از مفهوم فاصله آماری برای تعیین کمیت «خوبی برازش» استفاده کرد. شناخته شده ترین فاصله ها عبارتند از فواصل کولموگروف-اسمیرنوف، واسرشتاین و کرامر-فون میزس (برای معرفی خوب در مورد این فواصل، به این توضیحات عالی مراجعه کنید). جدول زیر فواصل را بر اساس داده های 30 روزه نشان می دهد (اگر محدوده زمانی را از نمودار سری زمانی اصلی انتخاب کنید، مقادیر به روز می شوند).

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

در حالی که فاصله کولموگروف-اسمیرنوف به درستی فواصل نسبی را نشان نمی دهد (با برجسته کردن دیمارکسو تا آرگونافتون)، هر دو فاصله Wasserstein و Cramér-Von Mises فاصله آشکار بزرگتری را برای Argonafton مشخص می کنند. مقادیر جدول فوق بر اساس داده های 30 روزه است. 3 نمودار زیر بر اساس میانگین متحرک 7 روزه در 30 روز گذشته است.

این نمودارها تأیید می‌کنند که با استفاده از فاصله Wasserstein یا Cramér-Von، فاصله از ایستگاه Argonafton و Volos EPA حداقل دو برابر بیشتر از فاصله ایستگاه‌های دیگر است.

همبستگی داده های هواشناسی

برای تایید این فرضیه که ایستگاه ارگونافتون خوانش غلظت غیرعادی و بیش از حد تخمین زده شده را تولید می کند، باید به داده های هواشناسی نگاه کنیم: شرایطی که در آن ایستگاه آرگونافتون می تواند غلظت بالاتری را مشاهده کند، زمانی است که باد از سمت جنوب می وزد. یعنی جایی که باد دود لوله های اگزوز محموله را به سمت ایستگاه می برد.

اولین قدم بررسی میانگین جهت و سرعت باد در 30 روز گذشته است. داده های باد از هر دو ایستگاه METAR فرودگاه Volos و همچنین ایستگاه هواشناسی Netatmo Tthiseos به دست آمده است. دو گل رز باد نشان دهنده تعداد دفعاتی است که باد در هر جهت می وزد.

هر دو طرح گل رز باد نشان می دهد که باد عمدتاً از غرب یا شرق و بسیار کمتر از جنوب می وزد. از آنجایی که در قسمت شمالی ولوس کوه هایی وجود دارد، اساساً هیچ بادی از سمت شمال وجود ندارد.

بر اساس این تایید تجربی که باد کمتر از سمت جنوب می وزد، نمی توان نتیجه گرفت که لوله های اگزوز محموله علت غلظت بالای PM 2.5 برای ایستگاه آرگونافتون هستند. این فرضیه همچنین با نمودار همبستگی بین 3 ایستگاه و جهت باد فرودگاه باطل می شود، که نشان می دهد هیچ شواهد روشنی (برای هیچ یک از ایستگاه ها) وجود ندارد که باد جنوبی دلالت بر غلظت بالایی دارد.

در آخر، ما همچنین باید بررسی کنیم که آیا مشکل آرگونافتون می تواند مربوط به رطوبت نسبی باشد یا خیر. به عنوان مثال، مشکل می تواند به دلیل رطوبت بیشتر باشد که اندازه ذرات را بزرگتر می کند و در نتیجه غلظت بالاتر را نشان می دهد. نمودار همبستگی زیر تأیید می کند که این درست نیست، زیرا هیچ شواهد واضحی مبنی بر متناسب بودن غلظت با رطوبت وجود ندارد.

نتیجه

در این مقاله، ما به بررسی ابزارهای کمی و کیفی داده‌ها برای ایستگاه‌های بلادرنگ پرداخته‌ایم. با فرض وجود یک ایستگاه قابل اعتماد مرجع، نشان داده‌ایم که کمی‌سازی با استفاده از فاصله Cramér-von Mises یا Wasserstein می‌تواند مشکلات مربوط به هر داده ایستگاه را نشان دهد.

ما همچنین نشان دادیم که فاصله به خودی خود کافی نیست و برای دقیق تر، باید زمینه ایستگاه را درک کرد. مانند موقعیت مکانی و شرایط هواشناسی. با این حال، از آنجایی که زمینه چیزی نیست که بتوان آن را خودکار کرد، راه حل نهایی مورد استفاده برای پروژه WAQI عبارت است از تعیین ایستگاهی که فاصله آماری آن تا ایستگاه مرجع کمتر از 1/4 است. این در هفته‌های آینده اعمال خواهد شد (برای نقشه ایستگاه‌های بی‌درنگ به aqicn.org/station/ مراجعه کنید.

این مقاله بخشی از این مجموعه است و در مقاله بعدی به بررسی ابزارهای ایستگاه صلاحیت که در آن هیچ ایستگاه مرجعی وجود ندارد خواهیم پرداخت.


--

Volos promenade by night
برای مشاهده تمام ورودی های پرسش و پاسخ اینجا را کلیک کنید
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • درباره اندازه گیری کیفیت و آلودگی هوا:

    درباره سطوح کیفیت هوا

    -مقادیر شاخص کیفیت هوا (AQI).سطوح نگرانی سلامت
    0 - 50خوبکیفیت هوا رضایتبخش است و آلودگی هوا کم یا بدون خطر است
    51 -100در حد متوسطکیفیت هوا قابل قبول است با این حال، برای بعضی از آلاینده ها ممکن است نگرانی سلامت متوسط برای تعداد بسیار کمی از افرادی که به طور غیر منتظره ای نسبت به آلودگی هوا حساس هستند، وجود داشته باشد.
    101-150ناسالم برای گروه های حساسسلامتی گروه های حساس ممکن است تحت تاثیر قرار بگیرد.عموم مردم احتمالا تحت تاثیر قرار نخواهند گرفت.
    151-200ناسالمهمه ممکن است اثرات آلودگی بر سلامتیشان را احساس کنند؛ اعضای گروه های حساس ممکن است اثرات منفی جدی تری بر سلامتی شان احساس کنند.
    201-300خیلی ناسالمهشدارهای بهداشتی در شرایط اضطراری. کل جمعیت بیشتر احتمال دارد تحت تأثیر قرار گیرد.
    300+خطرناکهشدار سلامت: هرکس ممکن است اثرات جدی سلامتی را تجربه کند

    برای اطلاعات بیشتر در مورد کیفیت هوا و آلودگی، موضوع کیفیت هوا در ویکی‌پدیا یا راهنمای airnow برای کیفیت هوا و سلامت شما را بررسی کنید.

    برای توصیه های بهداشتی بسیار مفید دکتر پکن ریچارد سنت سیر، وبلاگ www.myhealthbeijing.com را بررسی کنید.


    اطلاعیه درمورد شرایط استفاده: تمام اطلاعات کیفیت هوا در زمان انتشار تایید نشده است و با توجه به عدم اطمینان از کیفیت این اطلاعات ممکن است بدون اطلاع قبلی در هر زمانی اصلاح شود. پروژه شاخص کیفیت جهانی هوا با استفاده از تمام مهارت ها و مراقبت های معقول در انتشار محتویات این اطلاعات، تحت هیچ شرایطی شاخص کیفیت جهانی هوا تیم پروژه یا نمایندگان آن برای هر گونه از دست دادن، آسیب یا آسیب ناشی از عرضه اطلاعات مسئولیتی را قبول نمی‌کنند.



    Settings


    Language Settings:


    Temperature unit:
    Celcius