استخدام المسافات الإحصائية للتحقق من صحة شبكات الاستشعار في الوقت الحقيقي
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
يشارك: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/ar/
Overlapping kernel densities,
(credits)

في عام 2008، عندما بدأ مشروع جودة الهواء العالمية، كانت جميع محطات مراقبة جودة الهواء الحالية تعتمد على تقنية BAM وTOEM الاحترافية والمكلفة للغاية. تتم صيانة هذا النوع من المحطات دائمًا بواسطة مشغلين محترفين ومؤهلين تأهيلاً عاليًا - وهذا يضمن إمكانية الثقة في مخرجات هذه المحطة.

وبعد مرور 12 عامًا، لا تزال محطتا BAM وTOEM موجودتين. ولكن مع تطور تقنية نثر الليزر وأجهزة استشعار الغبار منخفضة التكلفة، أصبح عدد محطات BAM وTOEM الآن يفوق عدد شبكات الاستشعار الضخمة والكثيفة ومنخفضة التكلفة. في الوقت الحاضر، هناك الكثير من هذه الشبكات - على سبيل المثال لا الحصر: urad، وluft-daten، وairqo، وairbg، وopensense، وyakkaw، وeconet، وairkaz، وccdc، وambente، وGreen air، وما إلى ذلك.

إحدى المشكلات الأساسية المتعلقة بشبكات الاستشعار منخفضة التكلفة هي موثوقيتها: نظرًا لأن العديد من أجهزة الاستشعار هذه لا تتم صيانتها بشكل صحيح (أو لا تتم صيانتها على الإطلاق)، فإن كمية أجهزة الاستشعار التي تنتج قياسًا خاطئًا تمامًا لا يمكن إهمالها. علاوة على ذلك، فإن معظم الشبكات لا تستخدم محطات مزودة بأجهزة استشعار مكررة (على عكس محطة Gaia الخاصة بنا، والتي تستخدم 3 أجهزة استشعار مكررة)، مما يزيد من صعوبة معرفة متى يتعطل جهاز استشعار واحد.

في هذه المقالة، سيتم النظر في شبكة الاستشعار المنتشرة في مدينة فولوس الرائعة في اليونان، ودراسة وسائل تأهيل وقياس موثوقية المحطة في الوقت الحقيقي.


--

مدينة فولوس الرائعة في اليونان

فولوس (باليونانية: Βόлος) هي مدينة ساحلية ساحلية. يبلغ عدد سكانها 144,449 نسمة (2011)، وهي أيضًا سادس أكبر مدينة في اليونان من حيث عدد السكان. وهي مركز صناعي مهم، في حين يوفر ميناؤها جسرا بين أوروبا وآسيا. يوجد حاليًا 5 محطات في فولوس: واحدة من وكالة حماية البيئة اليونانية ، توفر بيانات كل ساعة من محطة BAM احترافية، و4 محطات في الوقت الفعلي منخفضة التكلفة من شبكة lutf-daten :



تقع محطة فولوس EPA في مبنى الإدارة اللامركزية في ثيساليا ووسط اليونان . وتقع جميع المحطات الأخرى أيضًا في المناطق السكنية، باستثناء أرجونافتون التي تقع بجوار الميناء.

حركة المرور في الميناء ليست ضئيلة، حيث يبلغ متوسط وصول/مغادرة 8 سفن يوميًا ، و80% من السفن عبارة عن بضائع - في وقت كتابة هذا التقرير.

يمكن أن تكون إحدى المشاكل المعروفة المتعلقة بالبضائع هي التلوث الجزيئي الناتج عن أنابيب العادم، بسبب الوقود منخفض الجودة . ولكن بالنظر إلى المنظر البانورامي من حيث تقع محطة أرجونافتون، فإن المسافة إلى الشحنات بعيدة بما يكفي بحيث لا تبرر مصدرًا ثابتًا لتلوث الهواء. يمكن للمرء أن يتوقع أن يرى عدة مرات عندما يكون الهواء أكثر تلوثًا في أرجونافتون، خاصة عندما تقوم القوارب الكبيرة بالمناورة، ولكن ليس طوال الوقت. بعد كل شيء، هذا فقط 8 سفن تناور في اليوم.


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

بيانات السلاسل الزمنية للـ 30 يومًا الماضية

بناءً على المعلومات الواردة من موقع المحطات، يمكن للمرء أن يتوقع أن جميع المحطات تتفق على مستويات مماثلة من تلوث الهواء، باستثناء أحداث تلوث أعلى متفرقة لأرجونافتون. ولكن حسنًا، لسوء الحظ، هذا ليس هو الحال حقًا، كما تم تأكيده من الرسم البياني للسلسلة الزمنية أدناه:

تشير مخططات السلاسل الزمنية بوضوح إلى أن البيانات الخاصة بأرجونافتون تبدو مبالغة في التقدير مقارنة بالمحطات الأخرى. وبالمثل، تبدو البيانات الخاصة بـ Dimarxou أقل من التقديرات.

من الأفضل تسليط الضوء على المشكلة من خلال تصور النسبة المئوية الـ 75 اليومية لـ AQI، والتي تم رسمها باستخدام نطاق ألوان AQI المقابل. الانحراف عن أرجونافتون واضح. علاوة على ذلك، من الممكن التمييز بين مجموعتين تتمركزان حول ريجا فيرايو + كاستانياس وفولوس إي بي إيه + ديماركسو.


--

قياس فروق السلاسل الزمنية

عندما يتعلق الأمر بمقارنة السلاسل الزمنية المترابطة، فإن الأفضل هو مقارنة توزيعاتها الاحتمالية. تمثل الرسوم البيانية الثلاثة أدناه توزيع الكثافة، وCDF (وظيفة التوزيع التراكمي) وQQ (باستخدام Volos EPA كمرجع CDF). تعتمد جميع هذه الرسوم البيانية الثلاثة على بيانات السلاسل الزمنية للـ 30 يومًا الماضية، ولكن يمكنك أيضًا تحديد نطاق زمني محدد في الرسوم البيانية للسلاسل الزمنية الأولى، وسيتم تحديث تلك الرسوم البيانية الثلاثة باستخدام القيم من النطاق الزمني المحدد.

وبالنظر إلى التوزيع الاحتمالي بالعين المجردة، فمن الواضح أن هناك فرقًا كبيرًا بين محطة Argonafton وDimarxou ومحطة Volos EPA المرجعية. تجدر الإشارة إلى أن هناك "عثرة" حول AQI 150: والسبب هو أن مخطط التوزيع يعتمد على AQI بدلاً من التركيز الخام، كما أن نطاق AQI الأكثر إحكاما [150,200] (مقارنة بـ [100,150]) يجعل كثافة AQI أكبر من 150 مقارنة بـ <150.

عندما يتعلق الأمر بقياس هذا الاختلاف، فمن الممكن استخدام مفهوم المسافة الإحصائية لتحديد "مدى الملاءمة". المسافات الأكثر شهرة هي مسافات كولموجوروف-سميرنوف، فاسرشتاين وكرامر-فون ميسس (لمقدمة جيدة عن تلك المسافات، راجع هذه الشروحات الممتازة). يوضح الجدول أدناه المسافات بناءً على بيانات 30 يومًا (سيتم تحديث القيم إذا قمت بتحديد نطاق زمني من الرسم البياني الرئيسي للسلسلة الزمنية).

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

في حين أن مسافة Kolmogorov-Smirnov لا تلتقط المسافات النسبية بشكل صحيح (تسليط الضوء على Dimarxou حتى Argonafton)، فإن مسافات Wasserstein وCramér-von Mises تسلط الضوء على مسافة أكبر واضحة لأرجونافتون. تستند القيم الواردة في الجدول أعلاه إلى بيانات 30 يومًا. تعتمد الرسوم البيانية الثلاثة أدناه على المتوسط المتحرك لمدة 7 أيام خلال الثلاثين يومًا الماضية.

تؤكد هذه الرسوم البيانية أنه باستخدام مسافة Wasserstein أو Cramér-von، تكون المسافة من محطة Argonafton وVolos EPA دائمًا أكبر بمرتين على الأقل من المسافة بين المحطات الأخرى.

ربط بيانات الأرصاد الجوية

من أجل تأكيد الفرضية القائلة بأن محطة أرجونافتون تنتج قراءات تركيز غير طبيعية ومبالغ فيها، نحتاج إلى إلقاء نظرة على بيانات الأرصاد الجوية: الحالة التي يمكن أن تشهد فيها محطة أرجونافتون تركيزات أعلى هي عندما تهب الرياح من الجنوب، أي حيث ستحمل الرياح أبخرة أنابيب عادم البضائع نحو المحطة.

الخطوة الأولى هي التحقق من متوسط اتجاه الرياح وسرعتها خلال الثلاثين يومًا الماضية. يتم الحصول على بيانات الرياح من محطة Volos Airport METAR ، بالإضافة إلى محطة الأرصاد الجوية Netatmo Tthiseos . تمثل وردتا الريح عدد المرات التي تهب فيها الرياح في كل اتجاه.

يُظهر كلا المخططين أن الرياح تهب بشكل رئيسي من الغرب أو الشرق وأقل بكثير من الجنوب. نظرًا لوجود جبال في الجزء الشمالي من فولوس، فلا توجد رياح بالأسفل من الشمال.

بناءً على هذا التأكيد التجريبي بأن الرياح تهب من الجنوب بشكل أقل من الاتجاه الآخر، لا يمكن استنتاج أن أنابيب عادم البضائع هي السبب في ارتفاع تركيزات PM2.5 في محطة أرجونافتون. تم إبطال هذه الفرضية أيضًا من خلال مخطط الارتباط بين 3 محطات واتجاه رياح المطار، مما يوضح أنه لا يوجد دليل واضح (لأي من المحطات) على أن الرياح الجنوبية تنطوي على تركيزات عالية.

وأخيرًا، نحتاج أيضًا إلى التحقق مما إذا كانت مشكلة Argonafton مرتبطة بالرطوبة النسبية. يمكن أن تكون المشكلة، على سبيل المثال، بسبب ارتفاع نسبة الرطوبة مما يجعل حجم الجسيمات أكبر وبالتالي يعني تركيزًا أعلى. ويؤكد مخطط الارتباط أدناه أن هذا غير صحيح، حيث لا يوجد دليل واضح على أن التركيز يتناسب مع الرطوبة.

خاتمة

في هذه المقالة، كنا نبحث في وسائل القياس الكمي وتأهيل جودة البيانات لمحطات الوقت الحقيقي. بافتراض وجود محطة مرجعية موثوقة، فقد أظهرنا أن القياس الكمي باستخدام مسافة Cramér-von Mises أو مسافة Wasserstein يمكن أن يشير إلى مشكلات تتعلق بأي بيانات للمحطة.

لقد أظهرنا أيضًا أن المسافة في حد ذاتها ليست كافية، ولكي نكون أكثر دقة، ينبغي فهم سياق المحطة. مثل موقعها وظروف الأرصاد الجوية. ومع ذلك، نظرًا لأن السياق ليس شيئًا يمكن تشغيله آليًا، فإن الحل النهائي المستخدم لمشروع WAQI يتمثل في تأهيل محطة تكون المسافات الإحصائية إلى المحطة المرجعية فيها أقل من 1/4. سيتم تفعيل ذلك خلال الأسابيع المقبلة (راجع aqicn.org/station/ للاطلاع على خريطة المحطات في الوقت الفعلي.

هذه المقالة جزء من السلسلة، وفي المقالة التالية سننظر في وسائل تأهيل المحطة التي لا تتوفر فيها محطة مرجعية.


--

Volos promenade by night
انقر هنا لرؤية كافة إدخالات الأسئلة الشائعة
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • حول جودة الهواء وقياس التلوث:

    حول مستويات جودة الهواء

    -قيم مؤشر جودة الهواء (AQI).مستويات الاهتمام بالصحة
    0 - 50جيدوتعتبر جودة الهواء مرضية ، كما أن تلوث الهواء لا يشكل خطراً يُذكر
    51 -100معتدلجودة الهواء مقبولة. ومع ذلك ، فبالنسبة لبعض الملوثات قد يكون هناك قلق صحي معتدل لعدد قليل جداً من الأشخاص الذين لديهم حساسية غير عادية لتلوث الهواء.
    101-150غير صحي للمجموعات الحساسةقد يواجه أعضاء المجموعات الحساسة آثارًا صحية. من غير المحتمل أن يتأثر عامة الناس.
    151-200غير صحيقد يعاني معظم الناس من الآثار الجانبية التي تؤثر على الصحة؛ أما الأفراد الذين لديهم وضع صحي حساس فقد يعانون من مشاكل صحية خطيرة
    201-300غير صحي للغايةتحذيرات صحية لظروف الطوارئ. من المرجح أن يتأثر جميع السكان.
    300+خطيرتنبيه صحي: قد يعاني الجميع من آثار صحية أكثر خطورة

    لمعرفة المزيد عن جودة الهواء والتلوث، راجع موضوع جودة الهواء في ويكيبيديا أو دليل airnow لجودة الهواء وصحتك .

    للحصول على نصائح صحية مفيدة للغاية من طبيب بكين ريتشارد سانت سير، قم بزيارة مدونة www.myhealthbeijing.com .


    إشعار الاستخدام: جميع بيانات جودة الهواء غير مضمونة في وقت النشر ، وبسبب ضمان الجودة ، يمكن تعديل هذه البيانات ، دون سابق إنذار ، في أي وقت. لقد مارس مشروع مؤشر جودة الهواء العالمي جميع المهارات والحلول المعقولة في تجميع محتويات هذه المعلومات ولن يكون تحت أي ظرف من الظروف فريق مشروع جودة الهواء العالمي أو وكلائه مسؤولين في العقد أو الضرر أو غير ذلك عن أي خسارة أو ضرر أو ضرر ناشئ بشكل مباشر أو غير مباشر عن توريد هذه البيانات.



    Settings


    Language Settings:


    Temperature unit:
    Celcius