Коришћење статистичких удаљености за валидацију сензорских мрежа у реалном времену
Using Statistical Distances for Real-time Sensor Networks Validation

Posted on April 28th 2020
Објави: aqicn.org/faq/using-statistical-distances-for-real-time-sensor-networks-validation/sr/
Overlapping kernel densities,
(credits)

Још 2008. године, када је започео пројекат Свјетског квалитета ваздуха, све постојеће станице за праћење квалитета ваздуха биле су базиране на високопрофесионалној и скупој БАМ и ТОЕМ технологији. Овакве станице увек одржавају професионални и високо квалификовани оператери - и то осигурава да се излазу ове станице може веровати.

12 година касније, БАМ и ТОЕМ станице и даље постоје. Али са развојем технологије ласерског расејања и јефтиног сензора прашине, БАМ и ТОЕМ станице су сада бројчано надмашене огромним и густим нискобуџетним сензорским мрежама. Данас постоји толико много тих мрежа - да споменемо само неке: урад, луфт-датен, аирко, аирбг, опенсенсе, иаккав, ецонет, аирказ, ццдц, амбенте, греен аир, итд.

Једно од фундаменталних проблема са јефтином сензорском мрежом је њихова поузданост: пошто многи од тих сензора нису правилно одржавани (или се уопште не одржавају), количина сензора који производи потпуно погрешно мерење није занемарљива. Штавише, већина мреже не користи станице са реплицираним сензорима (за разлику од наше Гаиа станице, која користи 3 реплицирана сензора), што додатно отежава откривање када један сензор поквари.

У овом чланку ћемо погледати сензорску мрежу распоређену у чудесном граду Волосу у Грчкој и проучавати средства за квалификовање и квантификацију поузданости станице у реалном времену.


--

Предиван град Волос у Грчкој

Волос (грч. Βολος) је приморски лучки град. Са популацијом од 144.449 (2011), то је такође шести град по броју становника у Грчкој. Важан је индустријски центар, док његова лука представља мост између Европе и Азије. Тренутно постоји 5 станица у Волосу: једна из грчке ЕПА , која пружа податке по сату са професионалне БАМ станице, и 4 јефтине станице у реалном времену из лутф-датен мреже:



Волос ЕПА станица се налази у згради Децентрализоване управе Тесалије и Централне Грчке . Све остале станице се такође налазе у стамбеним зонама, са изузетком Аргонафтона који се налази поред луке.

Промет у луци није занемарљив, са просеком од око 8 бродова у доласку/испловљавању дневно , при чему су 80% бродова били теретни – у време писања.

Један од познатих проблема са теретом може бити загађење честицама из издувних цеви, услед неквалитетног горива . Али гледајући панораму одакле се налази станица Аргонафтон, растојање до терета је довољно далеко да не оправда стални извор загађења ваздуха. Могло би се очекивати да се неколико пута види када је ваздух загађенији у Аргонафтону, посебно када маневришу велики чамци, али не све време. На крају крајева, то је само 8 бродова који маневришу дневно.


A view of the waterfrond of the town of Volos, Greece
(attribution: wikipedia)


--

Подаци временске серије за последњих 30 дана

На основу информација са локација станица, могло би се очекивати да се све станице слажу о сличним нивоима загађености ваздуха, са изузетком спорадичних догађаја већег загађења за Аргонафтон. Али добро, нажалост, ово није баш тако, као што је потврђено из графикона временске серије испод:

Графикон временске серије јасно показује да подаци за Аргонафтон изгледају претерано процењени у поређењу са другим станицама. Слично томе, подаци за Димарксоу изгледају недовољно процењени.

Боље да се истакне проблем је да се визуализује дневни 75. АКИ перцентил, уцртан коришћењем одговарајућег АКИ опсега боја. Одступање од Аргонафтона је очигледно. Штавише, могуће је разликовати два кластера усредсређена око Рига-Фераиоу+Кастханаиас и Волос ЕПА+Димарксу.


--

Квантификовање разлика у временским серијама

Када је у питању поређење корелираних временских серија, најбоље је упоредити њихове вјероватноће дистрибуције. 3 графикона испод представљају расподелу густине, ЦДФ (функција кумулативног расподеле) и КК (користећи Волос ЕПА као референтни ЦДФ). Сва та 3 графикона су заснована на подацима временске серије за последњих 30 дана, али такође можете да изаберете одређени временски опсег у првим графиконима временске серије, а та 3 графикона ће бити ажурирана коришћењем вредности из датог временског опсега.

Гледајући дистрибуцију вероватноће голим оком, очигледно је да постоји велика разлика између Аргонафтона, Димаркоуа и референтне Волос ЕПА станице. Вреди приметити да постоји „избочина“ око АКИ 150: Разлог је тај што је дијаграм дистрибуције заснован на АКИ, а не на сировој концентрацији, а компактнији [150,200] АКИ опсег (у поређењу са [100,150]) чини АКИ је гушћи за >150 у поређењу са <150.

Када је у питању квантификовање ове разлике, могуће је користити концепт статистичке удаљености да се квантификује „добро уклапања“. Најпознатије удаљености су Колмогоров-Смирнов, Вассерстеин и Црамер-вон Мисес удаљености (за добар увод о тим удаљеностима, погледајте ово одлично објашњење ). Табела испод приказује раздаљине на основу података за 30 дана (вредности ће бити ажуриране ако изаберете временски опсег са главног графикона временских серија).

Station
Kolmogorov-Smirnov
Wasserstein
Cramér-von Mises

Док раздаљина Колмогоров-Смирнов не обухвата тачно релативне удаљености (истакнувши Димарксуа све до Аргонафтона), и удаљености Васерштајна и Крамер-вон Мизеса истичу очигледно већу удаљеност за Аргонафтон. Вредности у горњој табели су засноване на подацима за 30 дана. 3 графикона у наставку су заснована на покретном просеку за 7 дана за последњих 30 дана.

Ови графикони потврђују да је коришћењем Вассерстеин или Црамер-вон удаљености удаљеност од станице Аргонафтон и Волос ЕПА константно најмање двоструко већа од удаљености од других станица.

Корелација метеоролошких података

Да бисмо потврдили хипотезу да станица Аргонафтон даје абнормална и прецењена очитавања концентрације, потребно је да погледамо метеоролошке податке: Услов под којим би станица Аргонафтон могла да види већу концентрацију је када ветар дува са југа, односно где би ветар носио гасове издувних цеви терета ка станици.

Први корак је провера просечног смера и брзине ветра у последњих 30 дана. Подаци о ветру се добијају и са МЕТАР станице на аеродрому Волос, као и са метеоролошке станице Нетатмо Ттхисеос . Две руже ветрова представљају колико пута ветар дува у сваком смеру.

Обе графике руже ветрова показују да ветар углавном дува са запада или истока, а знатно мање са југа. С обзиром да се на северном делу Волоса налазе планине, доле са севера углавном нема ветра.

На основу ове емпиријске потврде да ветар дува мање са југа него из другог правца, не може се закључити да су издувне цеви терета узрок веће концентрације ПМ 2,5 за станицу Аргонафтон. Ову хипотезу такође поништава корелациони дијаграм између 3 станице и правца ветра на аеродрому, који показују да не постоје јасни докази (за било коју од станица) да јужни ветар имплицира високе концентрације.

На крају, такође морамо да проверимо да ли би проблем са Аргонафтоном могао бити повезан са релативном влажношћу. Проблем би могао бити, на пример, због веће влажности која чини величину честица већом и тиме имплицира већу концентрацију. Графикон корелације у наставку потврђује да ово није тачно, јер нема јасних доказа да је концентрација пропорционална влажности.

Закључак

У овом чланку разматрали смо начине квантификације и квалификације квалитета података за станице у реалном времену. Под претпоставком да постоји референтна поуздана станица, показали смо да квантификовање коришћењем Крамер-вон Мизесове или Васерштајнове удаљености може указати на проблеме са било којим подацима станице.

Показали смо и да раздаљина сама по себи није довољна, и да тачније треба разумети контекст станице. као што су његова локација и метеоролошки услови. Међутим, пошто контекст није нешто што се може аутоматизовати, коначно решење коришћено за ВАКИ пројекат се састоји од квалификоване станице чија је статистичка удаљеност до референтне станице мања од 1/4. Ово ће ступити на снагу током наредних недеља (погледајте акицн.орг/статион / за мапу станица у реалном времену.

Овај чланак је део серије, ау следећем чланку ћемо се бавити средствима квалификационе станице где није доступна референтна станица.


--

Volos promenade by night
Кликните овде да видите све уносе са честим питањима
  • AQI Scale: What do the colors and numbers mean?
  • Using Statistical Distances for Real-time Sensor Networks Validation
  • Nitrogen Dioxyde (NO2) in our atmosphere
  • О мерењу квалитета ваздуха и загађења:

    О нивоима квалитета ваздуха

    -Вредности индекса квалитета ваздуха (АКИ).Нивои здравствене бриге
    0 - 50ДоброКвалитет ваздуха се сматра задовољавајућим, а загађење ваздуха представља мали или никакав ризик
    51 -100УмереноКвалитет ваздуха је прихватљив; Међутим, за неке загађиваче може бити умерено забрињавајуће здравствено стање за врло мали број људи који су необично осетљиви на загађење ваздуха.
    101-150Нездраво за осетљиве групеЧланови осетљивих група могу имати здравствене последице. Општа популација вероватно неће бити погођена.
    151-200НездравиСвако може почети да осећа здравствене тегобе; чланови осетљивих група могу имати озбиљније здравствене последице
    201-300Веома нездравимЗдравствена упозорења о хитним условима. Читава популација ће бити погођена.
    300+ОпасноЗдравствено упозорење: свако може доживети озбиљније здравствене ефекте

    Да бисте сазнали више о квалитету ваздуха и загађењу, погледајте тему на википедији о квалитету ваздуха или Аирнов водичу за квалитет ваздуха и ваше здравље .

    За веома корисне здравствене савете пекиншког доктора Рицхарда Саинт Цир МД, погледајте блог ввв.михеалтхбеијинг.цом .


    Употреба обавештења: Сви подаци о квалитету ваздуха су неважећи у време објављивања, а због обезбеђивања квалитета ови подаци могу бити без измењени у било ком тренутку, без обавештења. Пројектни тим "Светског индекса квалитета ваздуха" је уложио разуман напор и бригу приликом састављања садржаја ових информација и пројектни тим или његови агенти, ни под каквим околностима неће бити одговорни због било каквог губитка, повреде или оштећења која настају директно или индиректно из коришћења ових података.



    Settings


    Language Settings:


    Temperature unit:
    Celcius